Instytut Informatyki PB
Zakład Oprogramowania

Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Temat:  Wprowadzenie do pakietu SAS - wczytywanie danych

Zagadnienia: Trzy style czytania danych z zewnętrznego pliku: listowy (list input), kolumnowy (column input) oraz wykorzystujący informaty. Wybrane informaty; mieszanie stylów wczytywania danych; bardziej skomplikowane sytuacje (jedna linia - wiele obserwacji, wiele linii - jedna obserwacja, czytanie tylko częsci pliku). Opcje wyrażenia INFILE.

Informaty (uwaga na kropkę):
    - znakowe: $informatw.  (np:  $CHARw.    $HEXw. $w. )
    - numeryczne: informatw.d  (np:  COMMAw.d   PERCENTw. ) 
    - daty: informatw.   (np:  DATEw.   MMDDYYw. )

Opcje wyrażenia INFILE:

    - FIRSTOBS=n - umożliwia rozpoczęcie wczytywania danych od linii nr n;
    - MISSOVER - w przypadku napotkania końca linii nie przechodzimy do następnej linii,
                              wszystkie pozostałe zmienne obserwacji przyjmują wartość brakującą;
    - PAD - uzupełnia wszystkie czytane linie spacjami do maksymalnej dlugości linii (domyślna długość 132);

    - DLM - wykorzystywane do zmiany domyślnego separatora (np: DLM=',' oznacza przecinek jako separator) ;

Przykładowe programy SAS:

DATA lab_2;         /* Styl kolumnowy */
    INFILE 'c:\data\kolumny.txt' FIRSTOBS=2; /* Opuszczamy pierwszą linię */
    INPUT nazwa $ 1-20 ilosc 21-25 wartosc 30-39;
RUN;

DATA lab_2;         /*Wykorzystanie informatów */
    INFILE 'c:\data\inne.txt';'
    INPUT nazwa $20.  ilosc 3.  +2  data MMDDYY8.   (kwota1 kwota2 kwota3) (10.2);
                                 /* +n oznacza przesunięcie o n znaków */
RUN;

DATA lab_2;         /* Mieszanie stylów wczytywania danych*/
    INFILE 'c:\data\inne.txt';'
    INPUT nazwa $ 1-20 ilosc kraj $ cena @50 wartosc COMMA10.;
                                /* @n oznacza przeskok do kolumny numer n */
RUN;

Powrót   


Copyright © 2000 Marek Krętowski & Wojciech Kwedlo. All rights reserved.
Revised:
2000-03-10