Vybrané statistické metody
Interpretace geodat
2024-05-06
Faktorová analýza
- snaha zjistit, zda-li pozorované proměnné nejsou projevem několika skrytých faktorů
- snížení počtu dimenzí dat (méně sloupců)
- řada metod a hodnotících kritérii
Principal component analysis (PCA)
- redukce dimenzionality dat výpočem hlavních komponent
- výsledkem jsou nové proměnné (komponenty) - lineární kombinace původních proměnných
- výsledné komponenty jsou ortogonální (nejsou korelované)
- výsledné komponenty jsou seřazeny podle velikosti variance, první komponenta má největší varianci, druhá druhou největší atd.
- výsledné komponenty mohou být použity jako nové proměnné pro další analýzy
Shluková analýza
- snaha rozdělit data do skupin (shluků) na základě podobnosti
- řada method, od jednoduchých (k-means, k-medoids) po složité (hierarchické)
- u některých nutnost určení počtu shluků, jinde se určí automaticky v rámci výpočtu
- volba závisí na typu dat a cíli analýzy (nelze obecně určit nejlepší metodu, nutnost experimentovat)
Rozhodovací stromy
- predikční metoda
- založená na if/then pravidlech
- lze klasifikovat kategorie ale i hodnoty (vhodnější patrně na kategorie)