Instytut Informatyki PB
Zakład Oprogramowania

Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat: Składowe Główne

Zagadnienia: Definicja składowych głównych. Kryteria Hotelling’a i Pearson’a. Techniki numeryczne wyznaczania składowych głównych – rozwiązywanie symetrycznego zagadnienia własnego. Własności algebraiczne i statystyczne składowych głównych. Ładunki składowych głównych. Zastosowania – redukcja wymiarowości.

Treść ćwiczenia:

  1. Policzyć składowe główne na podstawie macierzy kowariancji i macierz korelacji; zbadać ile składowych jest potrzebnych, aby przenieść (wyrazić) odpowiednio 90, 95 i 99% zmienności układu;
  2. Sporządzić wykresy zależności pomiędzy 3 pierwszymi składowymi;
  3. Utworzyć na podstawie dowolnej zmiennej V z oryginalnego zbioru dodatkową zmienną Z, tak aby była ona liniowym przekształceniem zmiennej V; zbadać czy (jak) zmienią się składowe główne;
  4. Zmienić skalę pomiarową rozpatrywanego zbioru (przykładowo pomiary podawane w cm wyrażamy w metrach), i sprawdzić czy (kiedy) ma wpływ taka operacja na składowe;

Wykorzystywane procedury SAS:

PROC PRINCOMP {opcje};
            {VAR lista-zmiennych;}
            {BY list-zmiennych;}
            {FREQ zmienna;} - umożliwia podanie częstości występowania poszczególnych obserwacji     opcje:
                N = liczba - ilość składowych głównych,
                COV – składowe są wyliczane z macierzy kowariancji, (domyślnie z macierzy korelacji),
                OUT = zbiór SAS-a – tworzony jest wyjściowy zbiór zawierający oprócz oryginalnych  danych również ładunki,
                PREFIX = nazwa – umożliwia określenie prefiksu wykorzystywanego do nazwania kolejnych składowych

Przykładowe pytania sprawdzające:

1. W jakim celu liczymy składowe główne?
2. Dlaczego składowe główne uzyskiwane z macierzy kowariancji i korelacji mogą się różnić?
3. W jaki sposób oceniamy kolejne składowe?
4. Co to są ładunki (ang. scores)?
5. Dlaczego żądamy, aby wektory własne w procedurze wyznaczania składowych miały jednostkową długość?

Powrót   


Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights reserved.
Revised: 00-03-10