Instytut Informatyki PB
Zakład Oprogramowania

Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat:  Analiza Danych Dyskretnych

Zagadnienia: Tabela i macierz kontyngencji. Testy niezależności chi-kwadrat oraz Fishera. Współczynnik V Cramera.

Treść ćwiczenia:

  1. Zbadać niezależność czynnika klasyfikującego od pozostałych zmiennych. W zależności od liczności próbki użyć odpowiedniego testu niezależności. Przy wykorzystaniu współczynnika V Cramera zbadać siłę zależności zmiennych.
  2. Przeprowadzić 3 dyskretyzacje zmiennych o wartościach ciągłych (przyjmując różne ilości przedziałów) i zbadać niezależność tak powstałych zmiennych od klasy. Czy ilość przedziałów ma (może mieć) wpływ na niezależność zmiennych?

 Wykorzystywane procedury SAS:

PROC FREQ {opcje};
    {BY lista-zmiennych;}
    {TABLES zmienna*{zmienna*…} {/opcje-TABLES;}}
    {WEIGHT zmienna;}
opcje-TABLES:
    {ALPHA=p} – poziom istotności (domyślnie 0.05),
    {CHISQ} - testuje niezależność oraz oblicza współczynniki oparte na chi-kwadrat,
    {CUMCOL} – drukuje skumulowane wartości procentowe,
    {DEVIATION} – w każdej komórce tabeli wylicza odchylenie od częstości od wartości oczekiwanej,
    {EXACT} – liczy “Fisher exact test” dla tabel większych niż 2x2,
    {MEASURES} – podstawowe miary związków m. in. współczynniki korelacji Persona i Spearmana,

Przykładowe pytania sprawdzające:

1. W jakich sytuacjach nie możemy użyć testu chi-kwadrat?
2. Co oznaczają skrajne wartości współczynnika V Cramera?

Powrót   


Copyright © 1999 Marek Krętowski & Wojciech Kwedlo. All rights reserved.
Revised: 00-03-10