Read zaklady_aplikovanej_statistiky-kniha_Deskripcia_dat_RITOMSKY.pdf text version

Alojz Ritomský

kojioôi kojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôi kojioôi

Deskripcia dát

pomocou

o.lnk

Sondy do súcasnej rodiny a domácnosti

kojioôikojioôi kojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôikojioôi kojioôi

Medzinárodné stredisko pre stúdium rodiny

Alojz Ritomský

Deskripcia dát

pomocou

SPSS

Sondy do súcasnej rodiny a domácnosti

Medzinárodné stredisko pre stúdium rodiny Bratislava 1999

Informácie v tejto knihe sú zverejnené bez ohadu na ich prípadnú patentovú ochranu. Názvy niektorých programov, firiem a pod. môzu by ochrannými alebo registrovanými ochrannými známkami príslusných vlastníkov.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ © Alojz Ritomský, 1999

Obsah Predslov ................................................................................................................... 5 Tématický rámec.................................................................................................... 6 1. cas ­ Dáta, premenné, skály ......................................................................... 11 1. Premenné a ich hodnoty .............................................................. 12 2. Metódy zberu dát ........................................................................ 16 3. Zdroje dát .................................................................................... 16 4. Príprava dát na pocítacové spracovanie ...................................... 17 2. cas ­ Statistická deskripcia .......................................................................... 21 1. Opis súboru poda jednej kardinálnej premennej ....................... 24 2. Komparácia súborov poda kardinálnej premennej .................... 68 3. Vzah medzi dvomi kardinálnymi premennými ......................... 90 4. Opis súboru poda jednej ordinálnej premennej ........................104 5. Komparácia súborov poda ordinálnej premennej .....................116 6. Vzah medzi dvomi ordinálnymi premennými ..........................132 7. Opis súboru poda jednej nominálnej premennej ......................138 8. Komparácia súborov poda nominálnej premennej ...................146 9. Vzah medzi dvomi nominálnymi premennými ........................154 3. cas ­ Moznosti vybraných príkazov SPSS .................................................159 1. Okná a ponuky SPSS .................................................................162 2. Príkaz Define Variable ..............................................................167 3. Príkaz Compute .........................................................................172 4. Príkaz Recode into Same Variables .........................................176 5. Príkaz Recode into Different Variables ...................................178 6. Príkaz Frequencies ....................................................................181 7. Príkaz Explore ...........................................................................186 8. Príkaz Crosstabs ........................................................................190 9. Príkaz Means .............................................................................194 Záver ....................................................................................................................197 Príloha ...................................................................................................................199 Literatúra ..............................................................................................................214

Predslov Milá citateka, vázený citate! Práve som dopísal túto knihu. Prebieha mi pred ocami ­ uz neviem kokýkrát ­ ,,defilírka" známych tvárí, výskumníkov z rôznych odborov psychológie, psychiatrie, medicíny, sociológie, pedagogiky, politológie, humánnej geografie, personalistiky, výskumu verejnej mienky, marketingu,..., mladé tváre studentiek a studentov psychológie, sociológie a politológie, s ktorými prezívam svoj cas nad dátami. Niektorým z nich sú blizsie ,,slová" ako ,,císla". Niektorí císla nemajú radi. Sem-tam som svedkom zápasu so strachom z pocítaca. Pri písaní knizky som casto myslel na tieto tváre, na tieto zázitky. Na to, ako im a alsím bude kniha slúzi. Analýze dát sa uz tradicne samostatne venujú tri oblasti náucnej literatúry: 1. knihy o metodológii a metódach výskumu tej, ktorej vednej disciplíny, 2. knihy o statistických metódach a 3. knihy, prírucky, manuály o tom, aké moznosti pouzitia ponúka urcitý statistický pocítacový systém. Výskumník ci student v konkrétnej analýze dát stojí pred neahkou úlohou, ke sám musí integrova do konkrétneho konzistentného celku poznatky z týchto troch zdrojov. Netradicnos tejto knihy spocíva v tom, ze sa v nej cieavedome snazím pomôc citateovi operova v takomto celostnom rámci. Prístup je zalozený na riesení mnozstva konkrétnych typických úloh. Pouzité dáta sú z výskumu rodín a domácností na Slovensku v roku 1999. Srdecná vaka za ne patrí výskumnému oddeleniu Medzinárodného strediska pre stúdium rodiny v Bratislave, osobitne jeho vedúcej, Mgr. Jarke Filadelfiovej. Oceujem záujem a podporu strediska pri vydaní tejto knihy. Este raz vaka. A Tebe, milý citate, zelám vea chuti do práce. Alojz Ritomský 26.9.1999 pri Kamenistom potoku

5

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­-

????

????

Tématický rámec

(o com bude v knihe rec)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Empirický výskum

Empirický výskum v spolocenských vedách sa v ostatnom case výrazne zmenil. Vo vseobecnosti to bolo pod vplyvom technického rozvoja, v nasom teritóriu pochopitene výrazne pôsobili spolocenské zmeny, ale veda a výskum má aj svoje vnútorné stimuly rastu. V súcasných dynamických procesoch v empirickom výskume si popri spolocných základných princípoch jednotlivé vedné odbory (alebo ich skupiny) rozvíjajú svoje osobité metódy práce. Máme teraz na mysli sirsie pole vedy. Empirický výskum v prírodných a technických vedách sa zjavne lísi od empirického výskumu v spolocenských vedách. Ekonomické výskumné odbory majú samozrejme blizsie k uz tradicným spolocenským vedám (k psychológii, sociológii, pedagogike, politológii a pod.), ale ich empirický výskum má vea specifík. Áno, základná otázka v tomto rámci znie ,,ako analyzova dáta?". Cieom tejto knizky je da aspo ciastocnú odpove na túto otázku, keze celá odpove - uz kvôli rozsahu - sa do nej nezmestí. Iným ohranicením je uz vyssie spomínaná skutocnos, ze vedné disciplíny analyzujú dáta vzhadom na ich predmet pomerne osobitnými metódami. Domnievame sa, ze existuje okruh vedných odborov z oblasti spolocenských vied, o ktorom mozno na onú základnú otázku sformulova monotematickú odpove. Aj ke úlohy v knihe sú formulované a riesené na dátach z oblasti sociologickej a sociálno-psychologickej, ich charakter je blízky nielen psychologickému a pedagogickému kvantitatívnemu skúmaniu, ale i teritóriu empirického výskumu v medicíne, v humánnej geografii, výskumu verejnej mienky a marketingovému výskumu a pod.

Ako analyzova dáta?

V akej oblasti?

6

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tri gnozeologické dimenzie násho problému...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tri zlozky

V psychologickom, sociologickom, edukacnom alebo inom sociálnom empirickom výskume k meritórnej (základnej zlozke) sa pricleuje (vcleuje) oblas statistických metód a aplikovaná pocítacová veda. V konkrétnej výskumníckej akcii je vemi dôlezité, akú tieto tri zlozky vytvárajú struktúru.

Sociálno-vedný výskum

Sociálno-vedný výskum

Statistické metódy

Statistické metódy

SPSS

SPSS

Schéma 1

Schéma 2

Sociálno-vedný výskum

Aplikácie statistických metód

s pouzitím

SPSS

Schéma 3

Prvá schéma zobrazuje splostený koncept izolovaných troch zloziek, ktoré sú spojené mechanickými pravidlami aplikácie statistiky a pocítacového statistického systému SPSS (v sociálnom výskume zjavne preferovaného pred vsetkými ostatnými systémami). Je to vemi chudobná struktúra a kooperácia v takejto situácii nevedie k pozadovaným efektom. Druhá schéma ukazuje situáciu alebo stádium spolupráce sociálnej vedy s ,,pocítacovou statistikou", ktorá je v pozícii vonkajsieho nástroja pouziteného pre sociálny výskum. Tretia schéma

7

pripomína tri ,,matriosky" ­ 1. sociálny výskum, 2. statistické aplikácie a 3. uzitú pocítacovú vedu, napríklad vo forme statistického pocítacového systému SPSS. Dodajme, ze tretia situácia v optimálnej verzii predstavuje organické spojenie vsetkých troch zloziek, pricom tu platí nacrtnutá subordinácia. To je ideálna situácia, ku ktorej (zia) povedomie viacerých udí v spolocenskovedných vedách má viditený distanc. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Prístupy k predmetu výskumu... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Nie je nasou úlohou rozobera siroké pole problémov súvisiacich s prístupmi k predmetu empirického výskumu. Je treba ma vsak na pamäti kontext, alebo parametre priestoru, v ktorom sa vedecké empirické poznanie deje. Pripomenieme strucne len tie cinitele, ktoré sú z metodologického hadiska najzávaznejsie. Kontrapozície Kvantitatívny versus kvalitatívny prístup ku skúmaniu javov a procesov. Akcentuje sa jedna stránka sociálnej skutocnosti, kvalitatívna, respektíve kvantitatívna. Akcent na jedno alebo mnohé, cize idiografický alebo nomotetický výskum. Exploracný versus konfirmacný prístup k rieseniu problému. Exploracný prístup: · slabo rozvinutá teoretická zlozka výskumu, · bez meritórnej hypotézy, · postupne kladieme výskumnícke otázky a odpovede hadáme v empirických dátach. Konfirmacný prístup: · dobre rozvinutá teoretická zlozka výskumu, · adekvátnym postupom sformulované meritórne hypotézy, · overovanie hypotéz empirickými dátami. Vzahový versus kauzálny (prícinný) spôsob explikácie problému (stýl myslenia) a s tým súvisiaci výskum ex post facto, respektíve experimentálny výskum. Deskripcia versus inferencia (spôsob práce s empíriou): · deskripcia - vycerpávajúci výskum urcitého súboru (populácie), · inferencia - statistické výberové zisovanie (výberový súbor zo základného súboru). Ak si chceme efektívne osvojova poznatky, metódy a techniky empirickej analýzy dát, zrejme postup, akým to budeme robi, by mal by ovplyvnený nasou orientáciou, cize ,,nastavením" vyssie spomínaných parametrov.

8

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Ako si osvojova metódy analýzy dát v sociálnych a humanistických disciplínach?... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Bez toho, ze by sme chceli neúmerne vyzdvihova výskum kvantitatívnej stránky sociálnych javov a procesov, treba skonstatova fakt, ze v statistickej analýze dát spoznávame väcsmi kvantitatívne vzahy nez kvalitatívne. Výlucne nás budú zaujíma hromadné javy (ono mnohokrát sa opakujúce v jednotlivých javoch). Zaraujeme sa tak do prúdu nomotetických výskumov. Postup osvojovania si metód analýzy dát, poda násho súdu, by mal zaca exploratívnymi úlohami. Az po ich zvládnutí sa úspesne zhostíme aj konfirmacných postupov. Rozhodne si treba najprv osvoji úlohy vzahovej analýzy a az v druhej fáze sa pusti do úloh, ktoré odhaujú kauzálne vzahy. Nie je mozné robi dokonalú statistickú inferenciu (zovseobecovanie) bez dôkladných znalostí metód statistickej deskripcie. Rovnako je proti logike veci, ak sa pokúsime preskoci univariacnú, ci komparacnú analýzu a rovno prejs k bivariacnej alebo nebodaj k multivariacnej analýze. So zreteom na uz spomínané tri gnozeologické dimenzie analýzy dát a vzhadom na optimálne zaradenie prístupov a metód do postupnosti osvojovania si tejto rozsiahlej, ale i neahkej problematiky, aj pod vplyvom praktických skúseností sme dospeli k nasledujúcemu konceptu, respektíve k akejsi ,,orientacnej mape": STATISTICKÁ DESKRIPCIA Meritórny (sociologický, psychologický, edukacný at.) výskum · prístup exploracný, · stýl myslenia vzahový, · empirický materiál. Statistické metódy · deskriptívna statistika ­ exploracné metódy. SPSS · statistické procedúry prípravy a deskripcie dát. 2. kurz STATISTICKÁ INFERENCIA Meritórny výskum · prístup prevazne konfirmacný, · stýl myslenia vzahový alebo kauzálny, · (menej strukturované) meritórne hypotézy. Statistické metódy · statistická inferencia (statistické odhady parametrov populácie a testovanie hypotéz). SPSS · statistické procedúry inferencie.

9

Ako postupova?

Orientacná mapa

1. kurz

3. kurz

MULTIVARIACNÁ ANALÝZA DÁT Meritórny výskum · problémy, hypotézy, · pestrý a bohato strukturovaný referencný rámec. Statistické metódy · multivariacná analýza dát (viacnásobná regresia a korelácia, faktorová a diskriminacná analýza, multidimenzionálne typologické metódy, reliabilita sumacného indexu, mnohorozmerné skálovanie, kauzálne modely at.). SPSS · procedúry multivariacnej analýzy.

K obsahu knihy 1. cas 2. cas

3. cas

Cie knihy sa kryje s cieom nacrtnutého 1. kurzu. Ohnisko tvoria jej prvé dve casti. Ak má by rec o tom, ako sa robí deskripcia dát, pokladáme za vhodné aspo strucne nacrtnú otázky a problémy okolo dát samotných. Prvá cas knihy Dáta, premenné, skály nám pripravuje pôdu, z ktorej vyrastajú základný typy deskriptívnych úloh. Jadrom druhej casti s názvom Statistická deskripcia sú konkrétne úlohy analýzy ,,zivých" a ,,cerstvých" dát (február 1999) z reprezentatívneho výskumu rodín a domácností na Slovensku. Jednotlivé úlohy predstavujú základné typy cinností v analýze dát: od spôsobu formulácie problému, cez jeho technické riesenie az po explikovaný výsledok, ktorým môze by frekvencná tabuka, graf, ci tabuka statistických charakteristík. Zlozenie a usporiadanie druhej casti ­ devä kapitol - zásadným spôsobom ovplyvnil jednak zrete na typ a pocet opisovaných premenných (nominálne, ordinálne alebo kardinálne premenné, ich uni- alebo bi-variacná analýza) i na pocet analyzovaných súborov. Dátami z jediného výskumu sme sa usilovali posilni nielen logické, ale aj meritórne súvislosti. Kazdá úloha ukazuje vo vzájomnej väzbe (,,v akcii") vsetky tri uz spomínané dimenzie (meritórnu, statistickú a pocítacovo-technickú zlozku). Pojmy a metódy sme sa rozhodli vysvetova ,,za pochodu", pocas riesenia úloh. Matematický a formálny náboj sme sa snazili minimalizova. Aj vseobecný trend a skúsenosti zo sveta potvrdzujú, ze sa to môze udia bez negatívneho dopadu na vlastnú kvalitu analýz. S prvou a druhou casou knihy súvisí Príloha. V nej sú podrobne uvedené premenné a ich prvostupové tabuky zo spomínaného výskumu 1 030 rodín a domácností. Tretia cas knihy Moznosti vybraných príkazov SPSS je venovaná len pocítacovému rozmeru problematiky. V spolocenskovednej obci na Slovensku v zápase o priaze zvíazil presvedcivo svetový spickový statistický pocítacový systém SPSS. Preto ani nasa voba medzi rozsiahlou ponukou nebola komplikovaná. Systém SPSS je dynamický. Minimálne po kazdých dvoch rokoch vzniká jeho nová verzia. V knihe pracujeme s deviatou verziou SPSS (v case písania knihy je to najnovsia verzia). Tretia cas knihy podáva moznosti vybraných príkazov SPSS, v jej deviatej verzii. Pri písaní knihy sme mali na pamäti aj tých, ktorí pracujú s nizsou verziou, napríklad so siestou (takých je na Slovensku este dos). Drvivá väcsina úloh uvedených v knihe je bez problémov (rovnako alebo takmer rovnako) riesitená aj pomocou nizsích verzií SPSS.

10

I. cas DÁTA, PREMENNÉ, SKÁLY

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

1. Premenné a ich hodnoty

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Dáta V empirickom výskume pozorujeme, zisujeme urcité empirické vlastnosti javov a procesov, ktoré sú súcasou predmetu výskumu. To, ktoré empirické vlastnosti sú predmetom násho záujmu, závisí od výskumných otázok, respektíve od výskumných hypotéz a od ich operacionalizácie ­ transformácie pojmov do empirickej roviny. Empirické vlastnosti sú premenlivé, majú urcité stavy. Pod pojmom dáta budeme rozumie empirické informácie, ci záznamy o stavoch empirických vlastností skúmaných javov a procesov, respektíve záznamy o hodnotách premenných. V tomto kontexte má zásadný význam poznávacia cinnos nazývaná meranie. Meranie je urcitý spôsob vyjadrenia (reprezentácie) stavov empirických vlastností pomocou systému reálnych císel. Tento proces zobrazenia sa môze dia na rôznej úrovni, pricom na kazdej z nich platia pevné pravidlá. Tu budeme hovori o troch úrovniach merania: · nominálna, · ordinálna, · kardinálna. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.1. Nominálna úrove merania ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Nominálna skála Meranie na najnizsej ­ nominálnej úrovni znamená, ze císla alebo iné symboly sú pouzité ku klasifikácii (k triedeniu), k oznaceniu kategórií, do ktorých sú zaradené osoby alebo iné jednotky. Tieto císla alebo symboly tvoria nominálnu stupnicu (skálu). Modelom empirickej vlastnosti na tejto úrovni merania je nominálna premenná (nominálny znak). Hodnoty nominálnej premennej sú totozné s císlami, symbolmi oznacujúcimi kategórie. Ak respondent na otázku "Mohli by ste mi, prosím poveda, v akom type domácnosti zijete?" odpovedá ,,mladá domácnos", alebo ,,bezná domácnos", ,,starsia domácnos", pouzíva symboly (oznacenia), ktoré reprezentujú kategórie domácností (a k jednej z nich respondentova domácnos patrí), cize pouzíva nominálnu stupnicu. Premenná typ domácnosti respondenta je príklad nominálnej premennej. Inými príkladmi takéhoto typu premennej sú pohlavie (s kategóriami muz, zena), národnos (slovenská, maarská, iná), kraj (s clenením do osem krajov), kategórie respondentov poda hlavného zamestnania (nekvalifikovaný manuálny pracovník, ..., výkonný odborný pracovník, tvorivý odborný pracovník, riadite, ... ) a podobne.

Meranie

Príklady nominálnych premenných

12

Podmienka adekvátnosti merania

Adekvátnos merania na nominálnej úrovni je urcená platnosou vzahu ekvivalencie. To znamená, ze jednotky (osoby, domácnosti a podobne), ktoré sme zaradili do tej istej kategórie, musia by ekvivalentné z hadiska faktického stavu empirickej vlastnosti, ktorú meriame. Vzah ekvivalencie sa zvykne symbolicky oznacova: ,,=".(Je reflexívny: x=x pre vsetky x. Je symetrický: ak x=y, potom y=x. Je tranzitívny: ak x=y a y=z, potom x=z.) Symboly, ktoré oznacujú jednotlivé kategórie (varianty nominálnej premennej) mozno vymeni, ak je táto výmena konzistentná a úplná. Takáto jedno-jednoznacná transformácia je jediná prípustná operácia na tejto úrovni merania. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.2. Ordinálna úrove merania ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Ordinálna skála

Nech sú respondenti zaradení do kategórií a platí vzah ekvivalencie tak, ako sme o tom hovorili v súvislosti s najnizsou úrovou merania. Nech okrem toho sú kategórie v urcitom type vzahu. Príkladmi takého typu vzahu môzu by: vyssí, silnejsí, spokojnejsí, hodnotnejsí, výhodnejsí, zaujímavejsí, bohatsí at. Také vzahy budeme vseobecne oznacova symbolom ,,>" , cize ,,väcsí nez". Ak takáto nerovnos platí medzi niektorými, ale nie vsetkými dvojicami kategórií, budeme hovori, ze stupnica je ciastocne usporiadaná. Ak nerovnos platí pre vsetky dvojice, teda stupnica je úplne usporiadaná, budeme ju nazýva ordinálnou stupnicou (skálou). Modelom empirickej vlastnosti na tejto druhej úrovni merania je ordinálna premenná (ordinálny znak). Hodnoty ordinálnej premennej sú kategórie, stupne (císelne oznacené) úplne usporiadanej skály. Na otázku ,,Pokúste sa, prosím, zhodnoti, aká je súcasná príjmová (financná) situácia Vasej domácnosti?" dostali respondenti skálu odpovedí, z ktorej si mali vybra najprimeranejsiu: 1 = príjmy stacia na vsetko, 2 = príjmy stacia na vsetko, ale hospodárime úsporne, 3 = musíme vea setri, aby sme si mohli kúpi drahsie veci, 4 = máme dos peazí len na nákup najlacnejsích vecí, 5 = peniaze stacia len na základné potraviny, 6 = nemáme dos peazí ani na nákup základných potravín, 9 = neviem posúdi. Je zrejmé, ze kategórie odpovedí tvoria len ciastocne usporiadanú skálu, keze úplnú usporiadanos narusuje kategória oznacená císlom devä. V analýze dát sa postupuje casto tak, ze sa z nej vylúcia vsetci tí, ktorí odpovedali ,,neviem posúdi". Po tomto úkone modifikovaná premenná vystupuje ako ordinálna premenná. Iným príkladom je nasledujúca otázka: ,,Na Slovensku nie je zriedkavosou, ke v jednej domácnosti býva viacero rodín. Aký je Vás názor na spolocné bývanie viacerých rodín v jednej domácnosti - je to výhodné?". Je to takzvaná uzavretá otázka, keze respondent si má vybra s uzavretej ponuky mozností:

13

Príklady

1 = je jednoznacne výhodné, prinása pre vsetkých len výhody, 2 = prinása síce isté problémy, ale z celkového pohadu je výhodné, 3 = prinása dos problémov, ale v urcitom období je takýto spôsob bývania najvýhodnejsí, 4 = prinása viac problémov ako výhod, 5 = je jednoznacne nevýhodné - prinása vsetkým len problémy, 6 = mám iný názor, 9 = neviem. Aj tu je skála iba ciastocne usporiadaná. Ak vylúcime z analýzy tých, ktorí majú iný názor a tých, ktorí nevedeli na polozenú otázku odpoveda, získame ordinálnu premennú. Úplné usporiadanie sa nenarusí, ak císla kategórii zmeníme tak, aby sa relácia nerovnosti neporusila. Napríklad takto: 2 = je jednoznacne výhodné, prinása pre vsetkých len výhody, 1 = prinása síce isté problémy, ale z celkového pohadu je výhodné, 0 = prinása dos problémov, ale v urcitom období je takýto spôsob bývania najvýhodnejsí, -1 = prinása viac problémov ako výhod, -2 = je jednoznacne nevýhodné - prinása vsetkým len problémy. Takéto oznacenie nenarusuje ordinalitu skály, dokonca oproti predchádzajúcej má urcité pozitívum. Kategória ­ stupe oznacený nulou upriamuje pozornos na jej ambivalentnos. Stupne oznacené kladnými císlami ukazujú na prevahu výhod a stupne so zápornými císlami vyjadrujú negativitu v odpovedi respondentov. Táto skála je ordinálna a navyse bipolárna s prítomnosou stredu (kategórie s odpoveou o protirecivosti javu). Vo výskumnej praxi sa tiez pouzívajú bipolárne ordinálne skály bez prítomnosti ,,stredu". Napríklad, ak odpovede na otázku: ,,Na Slovensku je veková hranica pre odchod do dôchodku 60 rokov a menej. Vo viacerých krajinách je tento vek vyssí. Do akej miery súhlasíte alebo nesúhlasíte s tým, aby bola na Slovensku zvýsená veková hranica odchodu do dôchodku?": 1 = úplne súhlasím, 2 = skôr súhlasím, 3 = skôr nesúhlasím, 4 = vôbec nesúhlasím, 9 = neviem, ,,ocistíme" od kategórie neviem, môzeme transformova do nasledujúcej podoby: 2 = úplne súhlasím, 1 = skôr súhlasím, -1 = skôr nesúhlasím, -2 = vôbec nesúhlasím. Podmienky adekvátnosti Adekvátnos merania na ordinálnej úrovni je urcená platnosou vzahu ekvivalencie a úplným usporiadaním kategórií. (Vzah ,,väcsí

14

merania

nez" je nereflexívny: pre ziadne x neplatí x>x. Je asymetrický: ak x>y, potom neplatí, ze y>x. Je tranzitívny: ak x>y a y>z, potom x>z.) Teda nezálezí na tom, aké císla priradíme dvom prípadom z rôznych kategórií, pokia dáme väcsie císlo prípadu, ktorý je empiricky ,,vyssí". ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.3. Kardinálna úrove merania ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kardinálna skála

Ak sú splnené vsetky podmienky z ordinálnej úrovne merania a okrem toho vzdialenosti medzi ubovolnými dvomi císlami na skále reprodukujú diferencie medzi dvomi stavmi skúmanej empirickej vlastnosti, potom dosiahnutá úrove merania sa nazýva kardinálna. Modelom empirickej vlastnosti na tretej úrovni merania je kardinálna premenná. Hodnoty kardinálnej skály sú císla, ktorých gnozeologickú hodnotu si blizsie vysvetlíme. Skála je charakterizovaná spolocnou a konstantnou jednotkou merania. Ak je pociatok skály ubovolný, skála dostane prívlastok intervalová. Ak je pociatok prirodzený (skutocný nulový bod), skálu budeme nazýva proporcionálnou. Ako príklad kardinálnej premennej zoberme IQ. Jednotka merania (1 bod) je stabilná, pociatok skály je umelý. Premenná IQ má preto intervalovú stupnicu. Rozdiely (a odtia prívlastok intervalová stupnica) medzi ktorýmikovek dvomi bodovými skóre IQ (pochopitene s výnimkou nuly) majú tú vlastnos, ze sa na nich môzu regulárne robi aritmetické operácie. Napríklad, nech osoba A má skóre 90 bodov, osoba B 60 a osoba C má 120 bodov. Pomer rozdielu IQ medzi osobou C a osobou B (60 bodov) a rozdielu IQ medzi osobou A a osobou B (30 bodov) je rovný hodnote 2. Tento pomer je nezávislý na nulovom bode a jednotke merania. Pomer rozdielov je adekvátnym výrazom empirickej reality. Pomer dvoch hodnôt, napríklad tvrdenie (interpretácia), ze inteligencia osoby C je dvojnásobkom inteligencie osoby B je nepatricné - neodráza empirické vzahy, ktoré by sa dali vyvodi z inter valovej premennej. Takýto prístup je adekvátny pre proporcionálnu stupnicu. Napríklad vek vyjadrený v rokoch je proporcionálna premenná (má prirodzený pociatok) a ako taká umozuje konstatova: ak osoba A má 42 rokov a osoba B 21 rokov, potom mozno poveda, ze vek osoby A je dvojnásobkom veku osoby B. Kazdá zmena císel na intervalovej stupnici musí zachováva nielen usporiadanie stavov meranej vlastnosti, ale tiez relatívne rozdiely medzi týmito stavmi. To znamená, ze intervalová stupnica poskytuje takú informáciu, ktorá sa lineárnou transformáciou nemení (ktorá je invariantná ak císla vynásobíme kladnou konstantou a pripocítame urcitú konstantu). Císla získané na proporcionálnej úrovni merania spajú vzahy: (a) ekvivalencie, (b) nerovnosti - ,,väcsí nez", (c) pomer kazdých dvoch intervalov ­ diferencií, (d) pomer kazdých dvoch hodnôt. Císla propor15

Príklady

Podmienky adekvátnosti merania

cionálnej stupnice sú ,,skutocné" císla s ,,prirodzenou" nulou. Len jednotka merania je ubovolná. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

2. Metódy zberu dát

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Ako sme uz hovorili, poziadavky na dáta sú podriadené urcitému výskumnému plánu, ktorý je rozpracovaný do formy projektu empirického výskumu. V om sú uvedené aj zdroje dát a metódy ich získavania. Dáta môzeme v teréne zbiera rôznymi spôsobmi. Oblas metód terénneho zberu dát je v spolocenských vedách dobre metodicky rozpracovaná. Kazdá kultúra vsak specificky determinuje terén. Z tohoto hadiska ostatné roky v tranzitívnych krajinách znamenali veký pokrok v oblasti terénneho zberu dát (pre spravodlivos treba poveda, ze v Posku sa táto oblas rozvíjala kontinuálne aj pocas ostatných pädesiat rokov). Ak je rozsah terénnych prác väcsí, pomáhajú zaskolení spolupracovníci ­ opytovatelia (anketári). Problematika metód zberu dát je rozsiahla a v literatúre opísaná. Hlavnými metódami zberu dát sú: · vedecké pozorovanie, · osobný rozhovor, · telefonický rozhovor, · dotazníková metóda (respondent sám vyplní dotazník, ktorý dostal klasickou alebo elektronickou postou), · laboratórny experiment, · experiment v prirodzených podmienkach. Otázka, ako získa dáta, je bezpochyby závazná. O nic menej dôlezitá je tiez otázka o kvalite získaných dát. Cize, este pred ich deskripciou je nutné pozna ich validitu (platnos) a reliabilitu (spoahlivos). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

3. Zdroje dát

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Výskumník alebo výskumný tím si v rámci svojho vedeckého záujmu buduje teoretický a metodologický, ale aj empirický (dátový) poznatkový fond. Dátový poznatkový fond môzeme rozdeli poda zdroja na: · primárne dáta, · sekundárne dáta. Základný rozdiel medzi nimi pramení z toho, k akému cieu boli dáta zhromazované. Primárne dáta sú dáta zhromazované bezprostredne pre úcel rieseného projektu. Patria zadávateovi výskumu, ktorý ich sám vyzbieral alebo si ich dal vyzbiera specializovanou institúciou. Napríklad zadávateom dát o rodinách a domácnostiach na Slovensku, ktoré my budeme pri výklade látky pouzíva, bolo výskumné oddelenie Medzinárodného strediska pre stúdium rodiny. Pre tento tím sú dáta

16

Primárne dáta

primárnymi dátami. Poznamenajme, ze terénny zber dát vykonala agentúra FOCUS, Centrum pre sociálnu a marketingovú analýzu. Sekundárne dáta Ak sú dáta pouzité k inému úcelu nez je projekt, v rámci ktorého boli zbierané, hovoríme o nich ako o sekundárnych dátach (nazývame ich tiez údajmi ,,z druhej ruky"). Keze získavanie primárnych dát je casto vemi nárocné na udské i financné zdroje, je pochopitené, ze snahou výskumníkov je neustále budova poznatkový fond sekundárnych dát. A teraz vyslovíme pre poriadok jednu triviálnu vetu. Analýza sekundárnych dát sa nazýva sekundárnou analýzou dát. Aj my, ke v rámci výkladu metód statistickej deskripcie riesime rôzne typy úloh na dátach z druhej ruky, robíme zárove sekundárnu analýzu dát. Aby nevzniklo nedorozumenie. Upozorujeme, ze termín sekundárne dáta sa niekedy pouzíva aj v inom význame ­ pre výsledky statistického spracovania pôvodných dát. Môzu nimi by rôzne agregované dáta, hodnoty statistických ukazovateov, teda opä dáta.

Poznámka

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

4. Príprava dát na pocítacové spracovanie

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Od chvíle, ke sa dáta, záznamy informácií z terénu dostanú na výskumníkov stôl, prebieha jednak proces formalizácie a systematizácie obsahu týchto informácií a jednak selekcia a vylucovanie nekvalitných informácií (takzvané ,,cistenie dát"). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.1. Kontrola primárnych dát ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kontrola je v etape prípravy dát prvou váznou operáciou. Pri kontrole obsahu prvotného dokumentu (dotazníka, záznamového hárku, anketného listu a pod.) spravidla popri kvalite existujúcich informácií kontrolujeme aj to, ci niektoré údaje nechýbajú. Chýbajúce dáta sú osobitným prípadom tzv. vynechávaných dát, cize údajov, ktorých skutocnú hodnotu nevieme alebo nemôzeme urci. Výsledkom prvej kontroly prvotných dát je rozhodnutie, ci kontrolovaná jednotka bude - a s akým obsahom - zaradená do spracovania. Rec je o prvej kontrole preto, lebo alsia kontrola dát ­ logická kontrola - sa robí pomocou pocítaca (vo fáze, ke sú uz dáta ulozené na magnetickom médiu). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.2. Formalizácia prvotných informácií ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Pocas prípravy dát musíme dáta transformova do symbolickej reci kódov. Pretoze je efektívnejsie na magnetické médium uklada krát17

Kódovanie Kódovací kúc

ke symboly alebo císla, ci císlice, nez rozsiahle texty. V tejto fáze je casto potrebné vypracova systém kategorizácií skúmaných empirických javov a kódovací kúc. Kódovací kúc zaznamenáva proces formalizácie primárnych informácií. Z jednej strany presne zaznamenáva formulácie otázok a odpovedí (stimuly a reakcie) v terénnom zbere. Na strane druhej urcuje pravidlá priraovania kódov elementom empirickej informácie (kódovací kúc informácii z výskumu rodín a domácností na Slovensku obsahuje Príloha tejto knihy). Otvára sa tu zárove problém, akú pocítacovú formu (formát) nadobudnú jednotlivé meritórne premenné. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.3. Pocítacový formát premenných ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Premenné z meritórneho hadiska sme rozdelili do troch základných typov: na nominálne, ordinálne a kardinálne premenné. V rámci formalizácie, v pohybe informácií z terénu do pocítaca treba definova transformáciu meritórnych premenných do urcitých (adekvátnych) foriem pocítacových premenných. To znamená, ze kazdá meritórna premenná dostane pocítacové meno a prípadne oznacenie (opis). Definuje sa jej príslusnos k urcitému typu. Môze sa (cím chceme poveda, ze to nie je povinnos) zadefinova oznacenie (opis) jednotlivých hodnôt premenných. Urcujú a oznacujú sa vynechávané (chýbajúce) hodnoty. Podrobnejsie o týchto otázkach vo vseobecnej rovine pojednáva 2. kapitola v tretej casti knihy. Ako konkrétna ilustrácia nám môze slúzi informácia o pocítacových atribútoch meritórnych premenných z výskumu rodín a domácností uvedená v Prílohe. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.4. Záznam dát na magnetické médium ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Matica dát

Dáta, ktoré presli procesom cistenia a formalizácie, si môzeme predstavi ako urcitú tabuku ­ maticu, v ktorej riadky tvoria jednotky, prípady (skúmané osoby, skupiny apod.) a stpce premenné. Vlastný obsah buniek tvoria kódy hodnôt premenných:

Prípady (Cases) 1 2 3 . i . n Premenné (Variables) X1 X2 . . . . . . . . Xj . . . . . . a11 a21 a31 . ai1 . an1 a12 a22 a32 . ai2 . an2 .............. .............. .............. .............. .............. .............. .............. a1j a2j a3j . aij . anj ........... ........... ........... ........... ........... ........... ........... Xr a1r a2r a3r . air . anr

18

Prostriedky

Pole mozností, ako ulozi dáta na magnetické médium, je dnes vemi rozsiahle. Necháme stranou moznosti optických snímacov. Sústredíme sa na klasickú formu, na ukladanie dát. Keze sa orientujeme na spracovanie dát systémom SPSS, budeme hovori o moznostiach vstupu dát do tohto systému: 1. SPSS pre Windows má vlastný editor dát (podrobnejsie o om pozri v 1. kapitole tretej casti). 2. Dátové súbory si môzeme pripravi vo forme ASCII (American Standard Code for Information Interchange), cize pomocou standardizovaného súboru císelných kódov jednotlivých znakov. Môzeme pritom pouzi niektorý zo starsích ci nových editorov alebo textových procesorov (napr. NORTON EDITOR, T602, WORD, WORDPERFECT, CHIWRITER a pod., alebo textový editor REVIEW, ktorý je súcasou SPSS/PC+, starsej verzie SPSS, pracujúcej pod MS DOS). 3. SPSS dokáze tiez importova dátové súbory vytvorené tabukovým procesorom 1-2-3 a databázovými systémami dBASE, Symphony, Multiplan at. a co je azda najdôlezitejsie, z EXCEL-u. 4. Na vytvorenie dátového súboru môzeme pouzi tiez program DATA ENTRY II, ktorý je samostatným modulom SPSS/PC+.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Odporúcaná literatúra Nasledujúca vybraná literatúra obsahuje dobre spracované témy o dátach, o ich získavaní, o úrovniach merania a o validite a reliabilite: Disman 1993, Gavora 1996, Hirner 1976, Janousek a kol. 1986, Kerlinger 1972, Marsálová, Miksík a kol. 1990, Pelikán 1998, Svec a kol. 1998. O dátach v kontexte pocítacových systémov odporúcame literatúru: Booth 1992, Bártová a ehák 1993, Kähler 1990, Diamantopoulos a Schlegelmilch 1997, Norusis 1999, Ritomský 1998.

19

20

II. cas STATISTICKÁ DESKRIPCIA

Prehad základných úloh statistickej deskripcie

Analýza:

Premenné: Univariacná Kardinálne

Opis súboru poda jednej kvantitatívnej premennej (triedenie, usporiadanie poda poradia, úrove a variabilita, kosos a strmos)

Komparacná (porovnávacia)

Komparácia súborov poda kvantitatívnej premennej (komparácia poda percent,percentilov, priemerov, stand. odchýliek, strmosti a kososti)

Bivariacná (vzahová)

Vzah medzi dvomi kvantitatívnymi premennými (lineárna regresia, korelácia)

1.kap. Ordinálne

Opis súboru poda jednej poradovej premennej (triedenie a usporiadanie poda poradia)

2.kap.

Komparácia súborov poda poradovej premennej(komparácia poda percent a percentilov)

3.kap.

Vzah medzi dvomi poradovými premennými (poradová korelácia)

4.kap. Nominálne

Opis súboru poda jednej kvalitatívnej premennej(triedenie)

5.kap.

Komparácia súborov poda kvalitatívnej premennej (komparácia poda percent)

6.kap.

Vzah medzi dvomi kvalitatívnymi premennými (kontingencia)

7.kap.

8.kap.

9.kap.

23

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Opis súboru poda jednej Kapitola I

kardinálnej premennej

kojioôi

(jednorozmerná analýza kvantitatívnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má tri subkapitoly: 1.1. triedenie kvantitatívnych dát (nominálna vrstva informácií), 1.2. usporiadanie kvantitatívnych dát poda poradia (ordinálna vrstva informácií), 1.3. sumarizácia so zreteom na vzdialenosti medzi dátami (specificky kardinálna vrstva informácií).

]]]

1. subkapitola riesi tri typy úloh: · sumarizácia hodnôt do tabuky (frekvencná tabuka), · vizualizácia tabuky pomocou grafického vyjadrenia jej obsahu (stpcové grafy, polygóny, histogramy a císlicové grafy), · transformácia premennej (úprava premennej, ktorá vedie k intervalovej distribúcii).

]

2. subkapitola má dve casti: · statistické poradové charakteristiky (percentily), · vizualizácia statistických poradových charakteristík (krabickové grafy).

]

3. subkapitola sa skladá z troch tém: · statistické ukazovatele úrovne a variability v tabukovej forme: statistický ukazovate úrovne, centrálnej tendencie (priemer), statistické ukazovatele rozmanitosti, variability (rozptyl, standardná odchýlka a variacné rozpätie), · statistické ukazovatele úrovne a variability v grafickej forme (priemer plus/mínus dve standardné odchýlky), · statistické ukazovatele tvaru distribúcie (koeficient asymetrie a koeficient strmosti, porovnanie histogramu s normálnou krivkou).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s nasledujúcimi

kvantitatívnymi premennými: · pocet clenov domácnosti (pocdom), · vek respondenta (vek1), · príjem na clena domácnosti (h). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

24

Kapitola je rámcovaná predmetom analýzy. Tým je jedna premenná v jednom súbore. Premenná je kvantitatívna. Obsah a postupnos nastolovaných problémov je urcená tromi gnozeologickými rovinami kvantitatívnej premennej. O nich sme uz v predchádzajúcej casti hovorili. Sú to : nominálny rozmer kvantitatívnych dát - triedenie dát, ordinálny rozmer kvantitatívnych dát - usporiadanie dát poda poradia, specificky kardinálny rozmer kvantitatívnych dát ­ sumarizácia so zreteom na vzdialenosti medzi dátami.

]]]

25

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.1. Triedenie kvantitatívnych dát

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Empirické hodnoty sú na zaciatku analýzy neusporiadané. Uplatnime jednoduché klasifikacné kritérium ­ rovnaké namerané hodnoty dajme do jednej kategórie. Kategórií je toko, koko je rozmanitých hodnôt. V kazdej kategórii zistíme výskyt hodnôt ­ pocetnos (Count, Frequency). Hodnoty a pocetnos ich výskytu v súbore definujú rozdelenie pocetností (Frequency Distribution) skúmanej premennej, niekedy pouzijeme aj kratsí názov distribúcia. Najcastejsie sa vyskytujúca hodnota ­ modus (Mode) ­ je prvou statistickou charakteristikou distribúcie. Skladba subkapitoly Subkapitola má tri casti: · · · sumarizácia hodnôt do tabuky (Frekvencná tabuka...), vizualizácia tabuky pomocou grafického vyjadrenia jej obsahu (Grafy...), transformácia premennej (Úprava premennej...), ktorá vedie k intervalovej distribúcii.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Frekvencná tabuka...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Frekvencná tabuka (Frequency Table) premennej, ktorú si vytvoríme pomocou systému SPSS má standardnú podobu. Podrobnejsie si ju vysvetlíme na príkladoch vo výstupe úlohy. Úloha 1 Vypocíta frekvencnú tabuku kvantitatívnych premenných: pocet clenov domácnosti (pocdom), vek (vek1) a príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Frequencies (pozri 6. kapitolu v 3. casti). Analyze Descriptive Statistics Frequencies...

Cesta

26

Obraz 1: Dialógový box Frequencies

V dialógovom boxe Frequencies v ponúknutom zozname vysvietime tri kvantitatívne premenné pocdom, vek1 a h. Stlacíme tlacidlo (s trojuholníckom) uprostred dialógového boxu, cím presunieme urcené premenné do prázdneho rámceka vpravo. Stlacíme tlacidlo OK. Výstup 1 Vo výstupnom okne sa zobrazia tri frekvencné tabuky (tabuka 1, 2 a 3). Co obsahuje standardná frekvencná tabuka (prvý stupe triedenia dát ­ triedenie, ktoré sa deje poda jedného klasifikacného kritéria, jednej premennej)? Prvý stpec rozdeuje riadky na tri casti. Prvá cas je oznacená Valid, co znamená, ze v týchto riadkoch budú nasledova valídne (platné) hodnoty. Ak premenná obsahuje aj chýbajúce hodnoty, v druhej casti je slovo Missing. Táto cas je urcená pre chýbajúce hodnoty dvojakého druhu. Systémové chýbajúce hodnoty (System-missing Value) ­ to sú nezistené údaje, v editore dát symbolicky oznacené v prípade kvantitatívnych premenných ciarkou. Uzívateské chýbajúce hodnoty (Usermissing Value) ­ to sú císelne vyjadrené hodnoty, ktoré vsak uzívate dodatocne oznacil ako chýbajúce hodnoty (pozri príkaz Define Variable, 2. kapitola v 3. casti). Tretia cas prvého stpca obsahuje oznacenie Total ­ súcet vsetkých riadkov. Tabuka 3 obsahuje aj valídne, aj chýbajúce hodnoty (z nich len systémové). Tabuky 1 a 2 obsahujú len valídne hodnoty. Druhý stpec obsahuje aktuálne varianty kvantitatívnej skály, napríklad, v tabuke 1 sú to hodnoty 1 az 10, ktoré predstavujú pocet clenov domácnosti. alej obsahuje oznacenie Total ­ súcet riadkov len s valídnymi hodnotami. Pod ním nasleduje specifikácia chýbajúcich hodnôt, ak sú prítomné. A alsie oznacenie Total ­ vtedy, ak je v tabuke viac riadkov s chýbajúcimi hodnotami, cize súcet vsetkých chýbajúcich hodnôt. Tretí stpec Frequency ­ pocetnosti, ktoré vyjadrujú výskyt hodnôt v jednotlivých riadkoch. Riadky oznacené ako Total v tomto treom stpci vyjadrujú ciastkové alebo celkový súcet pocetností.

27

Casto robíme spracovanie s perspektívou, ze dáta (ich distribúciu) budeme porovnáva s inými distribúciami dát s nerovnakým rozsahom. Vtedy nám poslúzia percenta výskytu hodnôt. Vo stvrtom stpci s oznacením Percent sú percenta výskytu hodnôt vypocítané zo základu vsetkých (i nevalídnych) hodnôt. V nasom prípade vo vsetkých troch tabukách je základ 1030 prípadov. Piaty stpec s oznacením Valid Percent obsahuje percenta, ktoré sú vypocítané z celku (len) valídnych hodnôt. O siestom stpci Cumulative Percent ­ kumulatívne percenta, budeme podrobne písa neskôr.

Pocet clenov domácnosti:

Frequency Valid 1 2 3 4 5 6 7 8 9 10 Total

101 215 221 271 148 47 16 6 3 2 1030

Percent

9,8 20,9 21,5 26,3 14,4 4,6 1,6 ,6 ,3 ,2 100,0

Valid Percent

9,8 20,9 21,5 26,3 14,4 4,6 1,6 ,6 ,3 ,2 100,0

Cumulative Percent

9,8 30,7 52,1 78,4 92,8 97,4 98,9 99,5 99,8 100,0

Tabuka 1: Triedenie domácností poda poctu ich clenov (frekvencná tabuka)

Tabuka 1 obsahuje výsledok triedenia 1030 valídnych zistení o pocte clenov domácnosti. V rozpätí jeden az ses clenov sa nachádza podstatná cas vsetkých prípadov. V súbore sa nenachádza ani jeden prípad s viac nez desiatimi clenmi domácnosti. Najpocetnejsí variant (hodnota) je císlo 4 s 26,3-percentným výskytom. Císlo styri ­ najcastejsie sa vyskytujúce císlo premennej pocet clenov domácnosti sa nazýva modus (Mode). Je to prvá statistická charakteristika distribúcie, postupne sa budeme zoznamova s alsími charakteristikami. Tabuka 1 má 10 variantov premennej. Vek v tabuke 2 vystupuje s ovea jemnejsou skálou. Variantov je tu viac ako sedemdesiat. Prvostupová tabuka v takomto prípade je pomerne málo funkcná v prezentácii, hoci pre potreby analýzy si ju môzeme vyrobi (my sme z nej pre veký rozsah vynechali podstatnú cas riadkov ­ slúzi nám len ako ilustrácia). Neskôr si ukázeme vhodnejsie formy prezentácie takejto premennej. To, co sme napísali o tabuke 2 este vo väcsej miere platí pre tabuku 3. V tabuke 3 by nám nemala uniknú informácia, ze premenná príjem na clena domácnosti má 302 chýbajúcich hodnôt.

28

Vek:

Frequency Valid 18 19 20 21 22 23 , 84 85 87 89 Total

49 21 13 16 14 18 , 1 1 1 1 1030

Percent

4,8 2,0 1,3 1,6 1,4 1,7 , ,1 ,1 ,1 ,1 100,0

Valid Percent

4,8 2,0 1,3 1,6 1,4 1,7 , ,1 ,1 ,1 ,1 100,0

Cumulative Percent

4,8 6,8 8,1 9,6 11,0 12,7 , 99,7 99,8 99,9 100,0

Tabuka 2: Triedenie respondentov poda veku

Príjem na clena domácnosti:

Frequency Valid 300,00 375,00 625,00 750,00 1125,00 1166,67 1300,00 1375,00 1500,00 1625,00 , 15000,00 15500,00 23500,00 Total Missing Total System

3 1 1 1 1 2 1 1 8 3 , 1 1 1 728 302 1030

Percent

,3 ,1 ,1 ,1 ,1 ,2 ,1 ,1 ,8 ,3 , ,1 ,1 ,1 70,7 29,3 100,0

Valid Percent

,4 ,1 ,1 ,1 ,1 ,3 ,1 ,1 1,1 ,4 , ,1 ,1 ,1 100,0

Cumulative Percent

,4 ,5 ,7 ,8 1,0 1,2 1,4 1,5 2,6 3,0 , 99,7 99,9 100,0

Tabuka 3: Triedenie domácností poda príjmu na clena domácnosti

29

Hodnoty premenných ako vek, príjem a podobne, teda premenných s vekým poctom variantov roztriedené v tabuke zatia vnímame ako hodnoty diskrétnych premenných (Discrete Variables). Akcent je na pocte jednotiek ­ na pocte rokov, na pocte korún. Takto sme teraz pozerali na vek a príjem. Môzeme vsak v takomto prípade tiez úspesne pouzi koncept spojitej premennej (Continue Variable). Akcentujeme skálu merania ako kontinuum. Ako sa potom riesi úloha triedenia, to nám ukázu niektoré typy grafov distribúcií. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Grafy...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Základné typy grafov

Pripomeme si, ze este stále pozeráme na kvantitatívne dáta cez optiku klasifikácie (ich triedenia). Ukázali sme si základný produkt triedenia, ktorým je frekvencná tabuka. Výsledok je prezentovaný císlami. Iná mozná forma prezentácia je vizuálna, kedy je frekvencná tabuka transformovaná do grafu. Mozností a foriem je viac a statistické systémy ponúkajú mnozstvo aplikácií. My sa teraz zoznámime so styrmi typmi grafov: stpcový graf (Bar Chart), polygón (Polygon), histogram (Histogram), císlicový graf (Stem-and-leaf).

Úloha 2 Cesta

Vytvori stpcový graf (Bar Chart) distribúcie premennej pocet clenov domácnosti (pocdom). V riesení úlohy pouzijeme príkaz Bar Charts. Graphs Bar...

Obraz 2: Dialógový box Bar Charts

Nastavenie v dialógovom boxe Bar Charts ponecháme v ponúknutom standardnom tvare: typ stpcového grafu je jednoduchý (Simple) a údaje

30

sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

Obraz 3: Dialógový subbox Summaries for Groups of Cases

V subboxe Summaries for Groups of Cases do rámceka s názvom os kategórií (Category Axis:) presunieme premennú pocdom. V rubrike Bars Represent zapneme tlacidlo % of cases. Specifikujeme tým vertikálnu os. Stpce grafu budú vyjadrova percentuálny výskyt kategórií. Stlacíme tlacidlo Options....

Obraz 4: Dialógový subbox Options

Ak chceme vylúci z grafu kategórie chýbajúcich hodnôt, vypneme v dialógovom subboxe Options stvorcek Display groups defined by missing values. Stlacíme tlacidlo Continue. A následne stlacíme OK. Výstup 2 Vytvorili sme stpcový graf 1, ktorý prezentuje distribúciu premennej pocet clenov domácnosti.

31

Percenta

30

25

20

15

10

5

0 1 2 3 4 5 6 7 8 9 10

Pocet clenov domácnosti:

Graf 1: Distribúcia premennej pocet clenov domácnosti (stpcový graf)

V stpcovom grafe je vseobecne horizontálna os osou kategórií. V nasom prípade kazdá kategória vyjadruje urcitý pocet clenov domácnosti. Stpce svojou výskou vyjadrujú percentuálne (alebo tak ako zadefinujeme vertikálnu os) zastúpenie jednotlivých kategórií. Je zjavné, ze hodnota 4 je modusom. Sírka stpca má len vizuálnu funkciu. Medzery medzi stpcami vyjadrujú oddelenos kategórií (v nasej úlohe zdôrazujú diskrétny charakter hodnôt premennej). Úloha 3 Cesta Vytvori polygón (Polygon) distribúcie premennej pocet clenov domácnosti (pocdom). V riesení úlohy pouzijeme príkaz Line Charts. Graphs Line...

Obraz 5: Dialógový box Line Charts

32

Nastavenie v dialógovom boxe Line Charts ponecháme v ponúknutom standardnom tvare: typ polygónu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Slacíme Define.

Obraz 6: Dialógový subbox Summaries for Groups of Cases

V dialógovom subboxe Summaries for Groups of Cases do rámceka s názvom os kategórií (Category Axis:) presunieme premennú pocdom. V rubrike Line Represents zapneme tlacidlo % of cases. Specifikujeme tým vertikálnu os. Úsecky polygónu budú spája body, ktoré vyjadrujú percentuálny výskyt kategórií. Stlacíme tlacidlo Options....

Obraz 7: Dialógový subbox Options

Ak chceme vylúci z polygónu varianty chýbajúcich hodnôt, vypneme v subboxe Options stvorcek Display groups defined by missing values. Stlacíme tlacidlo Continue. A následne stlacíme OK. Výstup 3 Vytvorili sme polygón (graf 2), ktorý zobrazuje distribúciu premennej pocet clenov domácnosti.

33

Percenta

30

25

20

15

10

5

0 1 2 3 4 5 6 7 8 9 10

Pocet clenov domácnosti

Graf 2: Distribúcia premennej pocet clenov domácnosti (polygón)

Jednoduché rozdelenie percent (podobne i pocetností) môzeme graficky znázorni polygónom. V pravouhlom súradnicovom systéme na horizontálnej osi znázorníme hodnoty - pocet clenov domácností. K nim patriaca (druhá) súradnica bude znázorova vekos percentuálneho výskytu hodnôt. Takto získané body, pospájané úseckami tvoria polygón distribúcie. Tvar distribúcie je z grafu zrejmý. Vrchol polygónu ukazuje na hodnotu modusu - stvrtý variant. V tomto prípade máme jednovrcholovú mierne asymetrickú distribúciu. Výrazne asymetrická distribúcia je, ak má tvar J. Ak sú vrcholy dva, hovoríme o bimodálnej distribúcii. Osobitný bimodálny prípad je distribúcia s tvarom U. Môze nasta tiez prípad viacvrcholovej distribúcie (multimodálna distribúcia). Teraz chceme este upozorni, ze polygón bude ma veký význam pri porovnávaní viacerých distribúcií. Úloha 4 Vytvori stpcový graf distribúcie premenných: vek (vek1) a príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Bar Charts ako v úlohe 2. Tento výstup uvádzame preto, aby sme si uvedomili zvlástnos situácie distribúcie premennej s vekým poctom variantov. Stpcový graf nám v celostnom pohade zachová jemné clenenie, na rozdiel od histogramu, o ktorom bude rec alej. Ale pozor, horizontálna stupnica nie je kvantitatívna (aj ke sa tak niekedy môze zda), ale nominálna. Ak máme záujem o takýto podrobne diferencovaný graf distribúcie, tak v aplikácii SPSS volíme stpcový graf. Detailná vizuálna prezentácia nám vsak limituje presnos numerických stránok prezentácie. Z grafu 3 este presne a pomerne ahko dokázeme vycíta hodnotu modusu, ale v prípade grafu 4 je to uz problém. Najdlhsí stpec je ahko identifikovatený, ale

34

Výstup 4

hodnota modusu je azko citatená. Takýto graf plní len orientacnú funkciu vo fáze analýzy dát, nie je vhodný na prezentáciu výsledkov.

Percenta

6

5

4

3

2

1

0 18 22 26 30 34 38 42 46 50 54 58 62 66 70 74 78 84

Vek

Graf 3: Distribúcia premennej vek (stpcový graf)

Percenta

6

5

4

3

2

1

0 300 1700 2375 3167 3900 4750 5600 6600 8250 11000 15000 1167 2100 2833 3625 4300 5167 6000 7250 9500

Príjem na clena domácnosti (v Sk)

Graf 4: Distribúcia premennej príjem na clena domácnosti (stpcový graf)

35

Úloha 5

Vytvori histogram (Histogram) premenných: najprv vek (vek1) a potom analogicky príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Histogram. Graphs Histogram...

Cesta

Obraz 8: Dialógový box Histogram

Tvorba histogramu (pre premennú vek) je vemi jednoduchá. V dialógovom boxe Histogram vysvietime premennú vek1 a presunieme ju do rubriky Variable:. Stlacíme tlacidlo OK. Výstup 5 Vytvorili sme grafickú prezentáciu distribúcie premennej vek respondenta vo forme histogramu (graf 5). Horizontálna os (kvantitatívna stupnica), tento raz s akcentom na to, ze tvorí kontinum, je medzi minimálnou a maximálnou hodnotou rozdelená na rovnako dlhé segmenty (ich dzka sa dá v pocítaci voli). Sírka stpcov tu nie je ubovoná, ale zodpovedá urceným segmentom (rovnakým intervalom). Medzi stpcami niet medzier, pokia sa v niektorom intervale vyskytuje nejaká hodnota. Výska stpcov je závislá na výskyte hodnôt v danom intervale. Vertikálna os zobrazuje stupnicu pocetností výskytu hodnôt. Poznamenajme este, ze v grafe 5, veda histogramu sa nachádza legenda, ktorá udáva rozsah súboru (N) a hodnoty statistických charakteristík: priemer (Mean) a standardnú odchýlku (Std. Dev.). O nich budeme podrobne hovori neskôr. Vytvorili sme rovnakou technológiou aj graf 6. Ak porovnáme tvar distribúcie v grafe 5 s tvarom distribúcie v grafe 6, zretene sa vynímajú rozdiely medzi nimi z hadiska strmosti a asymetrickosti. Tieto rozdiely sa dajú kvantifikova. Tejto otázke sa budeme venova neskôr v osobitnej casti.

36

Pocetnosti

160 140 120 100 80 60 40 20 0 20,0 25,0 30,0 35,0 40,0 45,0 50,0 55,0 60,0 65,0 70,0 75,0 80,0 85,0 90,0 Std. Dev = 16,41 Mean = 43,1 N = 1030,00

Vek:

Graf 5: Distribúcia premennej vek (histogram)

Pocetnosti

200 175 150 125 100 75 50 25 0 Std. Dev = 2086,95 Mean = 4294,5 N = 728,00

0 6, 01 24 ,0 0 08 22 ,0 4 14 20 ,0 8 20 18 ,0 2 27 16 ,0 6 33 14 ,0 0 40 12 ,0 4 46 10 0 , 28 85 0 , 92 65 0 , 56 46 0 , 20 27 0 4, 78

Príjem na clena domácnosti

Graf 6: Distribúcia premennej príjem na clena domácnosti (histogram)

Úloha 6

Vytvori císlicový graf (Stem-and-leaf) premenných: vek (vek1), príjem na clena domácnosti (h) a pocet clenov domácnosti (pocdom). V riesení úlohy pouzijeme príkaz Explore (pozri 7. kapitolu v 3. casti).

37

Cesta

Analyze Descriptive Statistics Explore...

Obraz 9: Dialógový box Explore

V boxe Explore vysvietime vsetky tri premenné (vek1, h a pocdom) a presunieme ich do rámceka Dependent List . V rubrike Display zapneme prepínac Plots (v tejto chvíli nás zaujímajú len grafy). Vpravo dole stlacíme tlacidlo Plots.... Otvorí sa dialógový subbox Plots.

Obraz 10: Dialógový subbox Plots

V rubrike Descriptive dialógového subboxu Plots vyznacíme polozku Stem-and-leaf. V rubrike Boxplots zapneme prepínac None. Stlacíme tlacidlo Continue. Stlacíme tlacidlo Options....

38

Obraz 11: Dialógový box Options

V dialógovom subboxe Options zapneme prepínac s názvom Exclude cases pairwise. Znamená to, ze prípady s chýbajúcimi hodnotami budú vylúcené zo spracovania osobitne pre kazdú premennú. Variant Exclude cases listwise by mal za následok takú redukciu dát, ze do spracovania by boli zahrnuté len tie prípady, ktoré majú valídne dáta vo vsetkých troch premenných. Výstup 6 Výstup predstavuje tri grafy. Distribúcia premennej vek a premennej pocet clenov domácnosti obsahuje vsetkých 1030 respondentov. Premenná príjem na clena domácnosti ­ ako uz vieme ­ má len 728 valídnych hodnôt. Co to je graf ,,Stem-and-leaf", nazývaný tiez císlicový graf? Otázka je na mieste, pretoze tento typ grafu prezíva este len svoju mlados. Vznikol ako jeden z mnohých originálnych nápadov profesora Tukeyho (popredná osobnos v exploracnej analýze dát) v sedemdesiatych rokoch a cez statistické pocítacové systémy sa stal vo svete siroko obúbený. Preco ,,Stem-and-leaf" (,,steblo a list")? Císelné hodnoty premennej sú fixne rozdelené na dve casti císlic, na "steblo" a na "list". Napríklad dvojciferné hodnoty veku sú rozdelené jednoducho tak, ze desiatky sú vyjadrené ,,steblom" a jednotky ,,listom". Císlo 18 je rozdelené na cas ,,1" ­ steblo a cas ,,8" ­ list. Císlicový graf je speciálny horizontálny stpcový graf, kde v "steble" sú obsiahnuté jednotlivé kategórie premennej a vpravo od nich sú "listy" jednotlivých hodnôt, ktoré tak vizuálne zobrazujú výskyt prípadov v príslusnej kategórii. V grafe 7, v prvom horizontálnom stpci sú viac násobne zobrazené císla 18 a 19. Pod grafom je informácia o tom, aká je sírka stebla - Stem width: 10, co znamená, ze steblo zobrazuje uz spomínané desiatky z hodnôt veku. alej je tu informácia o tom, koko prípadov reprezentuje kazdý ,,list" ­ Each leaf: 3 cases, co znamená, ze kazdý ,,list" znázoruje tri prípady (tri pravé casti císla). Symbol & upozoruje na listy, ktoré zastupujú mensí pocet prípadov ako je vseobecne platné. Celkový pocet prípadov (hodnôt) v riadku vyjadruje císlo v prvom stpci s názvom Frequency. Osemnás a devätnásrocných je 70, dvadsa az dvadsastyrirocných je 77, at. Graf, ak je to aktuálne, zobrazuje aj extrémne hodnoty (Extremes). Napríklad v grafe 8 je 40 hodnôt identifikovaných ako extrémne. Sú to prípady, kedy je príjem na clena domácnosti väcsí alebo rovný císlu 8167.- Sk. O extrémnych hodnotách budeme podrobnejsie hovori v súvislosti s ,,krabickovým grafom", alsím to Tukeyho vynálezom.

39

V císlicovom grafe sa spájajú výhody stpcového grafu a histogramu. Sú tu jasne vymedzené kategórie (,,steblá") a vnútorná struktúra horizontálnych stpcov (vyjadrená ,,listami") vytvára diferencovaný obraz o variabilite hodnôt. A to vsetko v prehadnej a zhustenej forme. Tento typ grafu slúzi skôr analýze, nez prezentácii dát. Ak sa pouzije v prezentácii, tak je to vo vedeckých publikáciách.

Vek: Stem-and-Leaf Plot Frequency Stem & Leaf 70,00 1 . 88888888888888889999999 77,00 2 . 0000111112222233333344444 100,00 2 . 555555566666666777777888888999999 125,00 3 . 000000011111222222233333333333334444444444 116,00 3 . 555555555666666667777778888888888999999 101,00 4 . 0000111111112222223333333334444444 78,00 4 . 555555666667777788888899999 77,00 5 . 00000111122222223333344444 66,00 5 . 55555566667777888888999 83,00 6 . 000001111122222233333344444 76,00 6 . 55555666667777778888889999 39,00 7 . 0000011122334 15,00 7 . 56789 4,00 8 . 2& 3,00 8 . & Stem width: 10 Each leaf: 3 case(s) & denotes fractional leaves. Graf 7: Distribúcia premennej vek (císlicový graf) Príjem na clena domácnosti: Stem-and-Leaf Plot Frequency Stem & Leaf 4,00 0 . 3 2,00 0 . & 5,00 1 . 13 29,00 1 . 55567788999 45,00 2 . 111111112233333 93,00 2 . 5555555556666677777778888888999 89,00 3 . 111111111111111122222333333333 108,00 3 . 555555555555566667777777777788888889 64,00 4 . 111111111222222223333 104,00 4 . 55555555555556667777777777778888889 42,00 5 . 11111112222223 41,00 5 . 55555555677888 15,00 6 . 1122& 24,00 6 . 55555578& 10,00 7 . 112& 13,00 7 . 55778 40,00 Extremes (>=8167) Stem width: 1000,00 Each leaf: 3 case(s) & denotes fractional leaves. Graf 8: Distribúcia premennej príjem na clena domácnosti (císlicový graf)

40

Pocet clenov domácnosti: Stem-and-Leaf Plot Frequency Stem & Leaf 101,00 1 . 00000000000000000 ,00 1 . ,00 1 . ,00 1 . ,00 1 . 215,00 2 . 000000000000000000000000000000000000 ,00 2 . ,00 2 . ,00 2 . ,00 2 . 221,00 3 . 0000000000000000000000000000000000000 ,00 3 . ,00 3 . ,00 3 . ,00 3 . 271,00 4 . 000000000000000000000000000000000000000000000 ,00 4 . ,00 4 . ,00 4 . ,00 4 . 148,00 5 . 0000000000000000000000000 ,00 5 . ,00 5 . ,00 5 . ,00 5 . 47,00 6 . 00000000 27,00 Extremes (>=7,0) Stem width: 1 Each leaf: 6 case(s) Graf 9: Distribúcia premennej pocet clenov domácnosti (císlicový graf)

Keze premenná pocet clenov domácnosti má len pomerne málo variantov, císlicový graf na stúdium distribúcie takejto premennej nie je prínosom. Vidíme to v ukázke ­ v grafe 9. Naopak, distribúcie premenných vek a príjem na clena domácnosti vo forme císlicových grafov (grafy 7 a 8) sú uzitocným podkladom k analýze dát.

41

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úprava premennej...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Podrobný grafický prieskum, aký sme uskutocnili v predchádzajúcich úlohách, nás môze inspirova k úprave viacvariantnej premennej na menejvariantnú. Chceme triedi prípady poda vopred stanovených intervalov a definova tak intervalovú distribúciu premennej. Úloha 7 Vytvori novú premennú r_pocdom z existujúcej premennej a to tak, ze prvých pä variantov (hodnôt) sa nezmení a hodnoty od ses vyssie zaradíme do jedného ­ siesteho variantu . V riesení úlohy pouzijeme príkaz Recode (pozri 5. kapitolu v tretej casti). Poznamenajme, ze editor dát musí by aktívny. Transform Recode Into Different Variables...

Cesta

Obraz 12: Dialógový box Recode into Different Variables

V dialógovom boxe Into Different Variables vybranú premennú z aktívneho súboru (ktorú chceme pouzi pri transformácii) pocdom vysvietime v avej casti boxu, stlacíme tlacidlo s trojuholníckom a meno premennej sa zapíse do rámceka Numeric Variable -> Output Variable. Do rubriky Output Variable vpíseme názov novej premennej, napríklad r_pocdom a stlacíme tlacidlo Change. Stlacením tlacidla Old and New Values... otvoríme dialógový subbox s rovnakým názvom. V poli na definovanie starých (pôvodných) hodnôt (Old Value) zapneme prvý prepínac Value a do vstupného poa vlozíme císlo 1. Do rámceka vpravo hore s názvom New Value, presnejsie do vstupného poa Value zapíseme novú hodnotu, v tomto prípade opä 1. Stlacíme tlacidlo Add . Keze chceme v novej premennej zachova nezmenené aj hodnoty 2 az 5, zopakujeme pre kazdú z nich uvedený postup.

42

Hodnoty z intervalu 6 a viac priradíme novej hodnote 6 nasledujúcim postupom:

Obraz 13: Dialógový subbox Old and New Values

V subboxe Old and New Values, v poli na definovanie starých hodnôt zapneme predposledný prepínac Range. Do vstupného pola zapíseme hodnotu 6. Za ním je text through highest , ktorý informuje, ze maximálny bod intervalu je definovaný ako najväcsia hodnota starej premennej (vieme, ze je to hodnota 10). Intervalu priradíme novú hodnotu 6, ktorú zapíseme do vstupného poa Value (vpravo hore). Stlacíme tlacidlo Add. Dialógový subbox je vyplnený, stlacíme tlacidlo Continue. Zobrazí sa nám pôvodný box a v om stlacíme tlacidlo OK. Výstup 7 Úloha 8 Výstup 8 V editore dát sa vytvorí nový stpec s názvom premennej r_pocdom. Vypocíta frekvencnú tabuku novej premennej pocet clenov domácnosti (r_pocdom). Postup je rovnaký ako v úlohe 1. Výstupom je tabuka 4 ­ tabuka prvého stupa triedenia novej premennej (premennej s novou kategorizáciou).

Pocet clenov domácnosti

Frequency Valid 1 2 3 4 5 6 a viac Total

101 215 221 271 148 74 1030

Percent

9,8 20,9 21,5 26,3 14,4 7,2 100,0

Valid Percent

9,8 20,9 21,5 26,3 14,4 7,2 100,0

Cumulative Percent

9,8 30,7 52,1 78,4 92,8 100,0

Tabuka 4: Triedenie domácností poda poctu ich clenov 43

Úloha 9 Výstup 9

Vytvori stpcový graf distribúcie novej premennej pocet clenov domácnosti (r_pocdom). Postup je rovnaký ako v úlohe 2. Výstupom je graf 10.

Percenta

30

25

20

15

10

5

0 1 2 3 4 5 6 a viac

Pocet clenov domácnosti

Graf 10: Distribúcia premennej pocet clenov domácnosti (stpcový graf)

Dodatok

Analogicky rekategorizujme premennú vek1 do novej premennej r1vek1 poda nasledujúcich poziadaviek: staré hodnoty 18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac nová hodnota 1 2 3 4 5 6

Ak sme vytvorili novú premennú, môzeme uz známym spôsobom vypocíta frekvencnú tabuku (pozri tabuku 5). Vhodným vizuálnym vyjadrením intervalovej distribúcie novej premennej r1vek1 by bol stpcový graf (Bar Chart). Histogram tu nie je vhodný, lebo vymedzené intervaly nemajú rovnakú dzku. Podobne by sme mohli spracova premennú príjem na clena domácnosti, cize zadefinova novú premennú so stanovenými intervalmi a potom vytvori tabuku a graf, ktoré by ukázali intervalovú distribúciu premennej.

44

Kategórie veku

Frequency Valid 18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

168 231 207 155 147 122 1030

Percent

16,3 22,4 20,1 15,0 14,3 11,8 100,0

Valid Percent

16,3 22,4 20,1 15,0 14,3 11,8 100,0

Cumulative Percent

16,3 38,7 58,8 73,9 88,2 100,0

Tabuka 5: Triedenie respondentov poda vekových kategórií (intervalová distribúcia)

45

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.2. Usporiadanie dát poda poradia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Ak neusporiadaný rad vsetkých nameraných hodnôt premennej zoradíme do neklesajúcej postupnosti, ahko z nej vycítame minimálnu i maximálnu hodnotu. Ak v tejto postupnosti kazdej hodnote priradíme poradové císlo a pomocou neho nájdeme prostrednú hodnotu, potom túto hodnotu budeme nazýva mediánom (Median). Je to císlo, ktoré charakterizuje premennú (jej distribúciu) tým, ze nám ukazuje 50% (v postupnosti) ,,dolných" ­ mensích alebo rovných ako medián a 50% ,,horných" hodnôt ­ väcsích ako medián. Podobne môzeme nájs poradové císlo, ktorým oddelíme prvých 25% od ostatných 75% prípadov. Zistené poradové císlo nám ukáze hodnotu premennej, pod ktorou sa nachádza stvrtina vsetkých hodnôt. Tomuto deliacemu bodu budeme hovori dolný [prvý] kvartil (Lower [1st] Quartile). Analogicky by sme mohli skonstruova horný [tretí] kvartil (Upper [3st] Quartile). Vsimnime si, ze druhý kvartil (Middle [2st] Quartile) je totozný s mediánom. Teraz sme postupnos dát ,,stvrtili". Ak by sme analogicky túto postupnos rozdelili na desa rovnakých castí, dospeli by sme k císlam ­ charakteristikám, ktoré nazývame decily (Deciles). Výsledkom delenia postupnosti na sto rovnakých castí sú percentily (Percentiles). Teraz budeme pocíta tieto charakteristiky a zapisova ich do tabuliek. Popri numerickej prezentácii si ukázeme aj ich vizuálnu prezentáciu vo forme krabickového grafu (Boxplot) a kumulatívneho grafu (Cumulative Histogram), ktorá prinesie nový pohad na tvar distribúcie. Skladba subkapitoly Subkapitola má dve casti: · · statistické poradové charakteristiky (Percentily...), vizualizácia statistických poradových charakteristík (Grafy...).

Este predtým si na malom fiktívnom dátovom súbore ukázeme niektoré operácie usporiadania dát.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Fiktívny príklad...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Predmetom analýzy dát je výkon deviatich studentov v teste z anglictiny. Získané body (v pozícii premennej) nazveme menom var00001. Neusporiadaný rad primárnych dát ­ výsledky testu ­ je takýto: 78, 51, 44, 55, 36, 47, 45, 61 a 39. Úloha Chceme si ukáza na tomto malom súbore dát riesenie dvoch jednoduchých úloh. V prvej úlohe pomocou systému SPSS príkazom Rank Cases priradíme kazdej jednotke (studentovi) poradie ­ poradové císlo

46

(vo forme novej premennej) v pomyselnom rade výsledkov testu, ktorý je usporiadaný od najnizsej po najvyssiu hodnotu. V druhej úlohe usporiadame riadky (prípady) v editore dát poda poradového císla príkazom Sort Cases. Nové usporiadanie v editore dát môzeme zapísa do výstupného okna v tabukovej forme príkazom Summarize Cases. Cesta Transform Rank Cases...

Obraz 14: Dialógový box Rank Cases

V dialógovom boxe Rank Cases presunieme premennú var00001 do rubriky Variable(s): a stlacíme OK. Vo výstupnom okne dostaneme informáciu o mene a oznacení novej premennej. Nová premenná, ktorej hodnoty sú poradové císla prípadov nesie meno rvar0000 a oznacenie Rank of VAR00001:

From variable -------VAR00001 New variable -------RVAR0000 Label ----RANK of VAR00001

V editore dát sa vytvorí nový stpec s názvom rvar00000 a v om sa zobrazia ku kazdej bodovej hodnote poradové císla:

Body Poradie ­­­­­­­­­­­­­­­ 78 9 51 6 44 3 55 7 36 1 47 5 45 4 61 8 39 2 ­­­­­­­­­­­­­­­ 47

Cesta

Data Sort Cases...

Obraz 15: Dialógový box Sort Cases

V boxe Sort Cases zo zoznamu premenných (vavo) vyberieme a presunieme premennú rvar0000 do rámceka Sort by: a stlacíme tlacidlo OK. V editore dát sa zmení usporiadanie prípadov poda poradového císla vzostupne:

Obraz 16: Editor dát

Cesta

Analyze Reports Case Summaries...

48

Obraz 17: Dialógový box Summarize Cases

V dialógovom boxe Case Summaries zo zoznamu premenných (vavo) vyberieme a presunieme premenné var00001 a rvar0000 do rámceka Variables: a stlacíme tlacidlo OK. Výstup Výstupom je tabuka primárnych dát urcených premenných v poradí, v akom sú aktuálne zaznamenané v editore dát:

Case Summaries

Body za výkon 1 2 3 4 5 6 7 8 9 Total N

36 39 44 45 47 51 55 61 78 9

RANK of VAR00001

1 2 3 4 5 6 7 8 9 9

Tabuka 6: Výpis primárnych dát z editora

49

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Percentily...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 10

Vytvori tabuku statistických charakteristík (pozícií osobitných bodov) - percentilov premenných: pocet clenov domácnosti (pocdom), vek (vek1) a príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Frequencies. Analyze Descriptive Statistics Frequencies...

Cesta

Obraz 18: Dialógový box Frequencies

V dialógovom boxe Frequencies, v zozname premenných vysvietime pocdom, vek1 a h. Presunieme ich do rámceka Variable(s): a stlacíme Statistics.

Obraz 19: Dialógový subbox Statistics 50

V dialógovom subboxe Statistics, v rubrika Percentile Values zvolíme kvartily (Quartiles), decily (Cut points 10 equql groups), piaty a devädesiaty piaty percentil (P5 and P95 ), v rubrike Central tendency si môzeme zapnú modus (Mode) a v rubrike Dispersion ukazovatele Minimum a Maximum. Stlacíme tlacidlo Continue. V dialógovom boxe Frequencies, do ktorého sme sa vrátili, vypneme prepínac Display frequency tables (nemáme v tejto chvíli záujem o výpocet frekvencnej tabuky). Výstup 10 Vo výstupnom okne sa zobrazí jedna tabuka a v nej tie statistické poradové charakteristiky, ktoré sme si zadali.

Statistics

Pocet clenov domácnosti: N Mode Minimum Maximum Percentiles 5 10 20 25 30 40 50 60 70 75 80 90 95 Valid Missing

1030 0 4 1 10 1,00 2,00 2,00 2,00 2,00 3,00 3,00 4,00 4,00 4,00 5,00 5,00 6,00

Vek:

1030 0 18 18 89 19,00 22,00 27,00 30,00 33,00 36,00 41,00 46,00 53,00 57,00 60,00 67,00 70,00

Príjem na clena domácnosti:

728 302 4500,00 300,00 23500,00 1900,0000 2300,0000 2750,0000 3100,0000 3166,6667 3500,0000 3875,0000 4375,0000 4750,0000 5125,0000 5275,0000 6500,0000 8250,0000

Tabuka 7: Statistické poradové charakteristiky kvantitatívnych premenných

Tabuka 7 nám pripomína, ze premenná príjem na jedného clena domácnosti má 302 prípadov, v ktorých nie sú zistené informácie o tejto premennej (Missing 302). Z jej platných hodnôt sa najcastejsie vyskytuje hodnota 4500.- Sk (modus). V tabuke sú uvedené najmensie a najväcsie vyskytujúce sa hodnoty vsetkých troch premenných. Ukázme si význam niektorých z uvedených percentilov. Pädesiaty percentil premennej vek má hodnotu 41 rokov. To znamená, ze v súbore je takých udí, ktorých vek nepresahuje 41 rokov polovica. Alebo inak povedané, ak vyberieme zo súboru 50% percent udí z co najnizsím vekom, budú

51

to udia, ktorí nie sú starsí nez styridsajeden rocní. ,,Horných" pä percent, cize pä percent udí zo skúmaného súboru, ktorí patria do domácnosti s najvyssím príjmom na clena vykazujú najmenej 8250.- Sk na clena domácnosti. Je to hodnota 95-tého percentila. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Grafy...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

V tejto subkapitole budeme tvori: · krabickový graf a · kumulovaný histogram. Úloha 11 Vytvori krabickový graf premennej pocet clenov domácnosti (pocdom) interaktívnou cestou. Cieom je v grafe znázorni základné poradové charakteristiky a prinies tiez nové moznosti v identifikácii tvaru distribúcie. V riesení úlohy pouzijeme príkaz Boxplot. Graphs Interactive Boxplot...

Cesta

Obraz 20: Dialógový box Boxplot 52

Najprv sme zvolili interaktívnu cestu konstrukcie krabickového grafu. V jeho tvorbe je mozné ís aj standardnou cestou. Vzápätí si ukázeme aj tento spôsob. Do vstupného poa dialógového boxu Boxplot presunieme premennú pocdom. Bezprostredne nad týmto vstupným poom sú dve tlacidla, ktorými volíme bu vertikálny alebo hotizontálny smer zobrazenia krabickového grafu. My si ukázeme postupne obidva varianty. Prvá predstava o krabickovom grafe vznikla v jeho horizontálnej verzii, neskôr sa presadila vertikálna verzia. Azda preto, lebo tvorbe viacerých ,,krabiciek" v jednom grafe, kedy nám ide o komparáciu distribúcií je tento variant vhodnejsí. Výstup 11 Vytvorili sme krabickový graf. Najprv si vysvetlíme krabickový graf v horizontálnom tvare (graf 12).

Graf 12: Krabickový graf (horizontálny) premennej pocet clenov domácnosti

Základom grafu je "krabicka". "Krabicka" je obdznik, ktorého zvislé strany zodpovedajú dolnému a hornému kvartilu. Uz z tabuky 7 vieme, ze dolný kvartil je rovný hodnote 2 a horný kvartil hodnote 4. To sa potvrdzuje i v nasom grafe. Vertikálny predel vo vnútri obdznika oznacuje medián ­ hodnotu 3. Z "krabicky" vychádzajú vavo i vpravo úsecky zvané "bokombrady". avá ,,bokombrada" zacína v pozícii 1 a koncí na úrovni 2. Pravá ,,bokombrada" zacína v pozícii 4 a koncí na úrovni 7. "Bokombrady" sú maximálne 1.5-krát dlhsie nez je dzka ,,krabicky". Dzka krabicky, alebo medzikvartilové rozpätie (Interquartile Range) je vzdialenos medzi dolným a horným kvartilom. avá ,,bokombrada" má dzku rovnú jednej, pravá ,,bokombrada" dosiahla maximálne moznú hodnotu 3. Za nimi sú znázornené indivi-duálne vybocujúce hodnoty (Outliers). V grafe sú znázornené tri vybocujúce hodnoty. Z tabuky vieme tieto hodnoty konkretizova: hodnota 8 6-krát, 9 3-krát a 10 2-krát. Zvlás vzdialené body, ktoré sú od kvartilu vzdialené viac nez trojnásobok

53

medzikvartilového rozpätia sa oznacujú ako extrémne (Extremes). Extrémne hodnoty sa v grafe 4 nenachádzajú.

hodnoty

Z krabickového grafu môzeme vycíta aj dôlezité informácie o tvare distribúcie. Ak je dzka krabicky malá, naopak ,,bokombrady" maximálne dlhé, prípadne sú prítomné vybocujúce alebo extrémne hodnoty, hovorí to o tom ze distribúcia je pravdepodobne jednovrcholová a strmá. Ak sú bokombrady krátke a krabicka dlhá, bude to pravdepodobne distribúcia v tvare U. Ak mediánova úsecka rozdeuje krabicku disproporcne, distribúcia bude asymetrická. Ak otocíme krabicku o 90 stupov, dostaneme vertikálny variant. Takým je graf 13, v ktorom je specifickým spôsobom znázornená distribúcia premennej príjem na clena domácnosti.

Graf 13: Krabickový graf (vertikálny) premennej príjem na clena domácnosti

Úloha 12

Vytvori krabickový graf premennej príjem na clena domácnosti (h) pomocou standardnej procedúry ­ príkazom Boxplot . Z technických dôvodov bude potrebné najprv príkazom Compute (pozri 3. kapitolu 3. casti) zadefinova pomocnú premennú, napríklad s názvom konst tak, aby mala pre vsetky jednotky (prípady) hodnotu rovnú napríklad 1. (Syntaxová forma tohto príkazu je: compute konst =1.)

54

Cesta

Graphs Boxplot...

Obraz 21: Dialógový box Boxplot

Nastavenie dialógového boxu Boxplot ponecháme v ponúknutom standardnom tvare: typ krabickového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

Obraz 22: Dialógový subbox Summaries for Groups of Cases

V subboxe Summaries for Groups of Cases premennú h presunieme do rámceka Variable: a premennú konst z technických dôvodov presunieme do rámceka Category Axis:. Stlacíme tlacidlo OK. Výstup 12 Úloha 13 Výstup - graf je obsahom rovnaký ako graf 12, lísi sa len technickými parametrami. Vytvori kumulatívny histogram (Cumulative Histogram) premennej príjem na clena domácnosti (h) interaktívnou cestou. V riesení úlohy pouzijeme príkaz Histogram. Graphs Interactive Histogram...

55

Cesta

Kumulatívny histogram môzeme vytvori iba interaktívnou cestou. V dialógovom boxe Create Histogram v zozname premenných ,,uchopíme" premennú h a presunieme ju do vstupného poa vertikálnej osi. Bezprostredne nad týmto vstupným poom sú dve tlacidla, ktorými volíme bu vertikálny alebo horizontálny smer zobrazenia histogramu. Zvome si vertikálny smer a stlacme preto prvé tlacidlo. Do vstupného poa horizontálnej osi vlozíme $pct, cím sme urcili, ze na nej budú znázornené percenta. Keze chceme vytvori kumulatívny histogram, prepínac v dolnej casti dialógového boxu s názvom Cumulative histogram zapneme.

Obraz 23: Dialógový box Histogram

Výstup 13

Vo výstupnom okne sa zobrazí kumulatívny histogram premennej príjem na clena domácnosti. Coze je to za graf? Je cas sa vráti k frekvencnej tabuke ­ k tabuke 3: Triedenie domácností poda príjmu na clena domácnosti. Zatia sme obchádzali jej posledný stpec ­ kumulatívne percenta (Cumulative Percent). Kumulatívne percento príslusnej hodnoty (príjmu) vyjadruje podiel vsetkých udí v súbore, ktorí vykazujú príjem na clena domácnosti nizsí alebo rovný príslusnej hodnote. Napríklad, tri percenta zo súboru vykazuje príjem na clena domácnosti mensí alebo rovný 1625.- Sk. Podiel vsetkých udí zo skúmaného súboru, ktorí vykazujú príjem na clena domácnosti mensí

56

alebo rovný 15500.- Sk je 99,9-percentný. Na horizontálnej osi je zobrazená skála príjmov na clena domácnosti. Vertikálna os zobrazuje kumulatívne percenta. Strmé ,,schody" na grafe ukazujú príjmové intervaly, v ktorých sa nachádzajú pocetné skupiny udí. Nízke ,,schody" naopak ukazujú riedke zastúpenie v intervaloch, na ktorých stoja.

Graf 14: Kumulatívny graf premennej príjem na clena domácnosti

(získaný interaktívnou cestou)

57

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 1.3. Sumarizácia so zreteom na vzdialenosti medzi dátami

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kvantitatívna premenná je produktom merania pomocou intervalovej alebo podielovej skály. Obidva typy skál pracujú s jednotkou merania, ktorou sme schopní zisti vzdialenos medzi ktorýmikovek dvomi nameranými hodnotami. Na tomto základe môzeme opisova dáta alsími statistickými charak-teristikami. Skladba Subkapitoly Táto subkapitola sa skladá z troch castí: · statistické ukazovatele úrovne (polohy) a variability v tabukovej forme: statistický ukazovate úrovne, centrálnej tendencie (Central Tendency) priemer (Mean) a statistické ukazovatele rozmanitosti, variability (Dispersion) rozptyl (Variance) standardná odchýlka (Standard Deviation) a variacné rozpätie (Range), statistické ukazovatele úrovne a variability v grafickej forme: priemer plus/mínus dve standardné odchýlky (Graf: Mean +2SD), statistické ukazovatele tvaru distribúcie: koeficient sikmosti (Skewness) a koeficient strmosti (Kurtosis), porovnanie histogramu s normálnou krivkou.

· ·

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Statistické ukazovatele v tabukovej forme...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 14

Vytvori tabuku statistických charakteristík úrovne a variability premenných: pocet clenov domácnosti (pocdom), vek (vek1) a príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Frequencies. Analyze Descriptive Statistics Frequencies...

Cesta

58

Obraz 24: Dialógový box Frequencies

V ponúknutom zozname boxu Frequencies vysvietime tri kvantitatívne premenné pocdom, vek1 a h. Stlacíme tlacidlo uprostred dialógového boxu, cím presunieme urcené premenné do prázdneho rámceka vpravo. Stlacíme tlacidlo Statistics.

Obraz 25: Dialógový subbox Statistics

V dialógovom subboxe Statistics, v rubrike Central Tendency zvolíme priemer (Mean) a Dispersion ukazovatele Std. Deviation, Variance a Range. Stlacíme tlacidlo Continue. V dialógovom boxe Frequencies, do ktorého sme sa vrátili, vypneme prepínac Display frequency tables (nemáme v tejto chvíli záujem o výpocet frekvencnej tabuky). Napokon stlacíme OK. Výstup 14 Vypocítali sme pre vsetky tri skúmané kvantitatívne premenné priemer (Mean, tiez Average ) ­ statistickú charakteristiku úrovne a standardnú odchýlku (Standard Deviation), rozptyl (Variance) a variacné rozpätie (Range) - statistické charakteristiky variabili-ty.

59

Statistics

Pocet clenov domácnosti: N Mean Std. Deviation Variance Range Valid Missing

1030 0 3,40 1,51 2,28 9

Vek:

1030 0 43,14 16,41 269,21 71

Príjem na clena domácnosti:

727 303 4268,09 1962,80 3852582,34 15200

Tabuka 8: Tabuka statistických charakteristík úrovne a variability troch premenných

To, ako sa priemer (,,x s pruhom") vypocíta sme si pravdepodobne vyskúsali uz ako ziaci základnej skoly, ke sme si rátali priemerný prospech. Spocítali sme vsetky hodnoty a podelili ich poctom (celkový súcet hodnôt musí by zmysluplný):

Priemer závislý na vsetkých hodnotách, i na extrémnych. Je siroko pouzívaný. Môzeme sa na pozera ako na urcité ,,azisko" vsetkých nameraných dát skúmanej premennej. (Súcet vsetkých odchýliek nameraných hodnôt od priemeru je nulový.) Vznik pojmu priemer bol inspirovaný reálnymi procesmi ,,spriemerovania" ­ homogenizácie (,,kazdému rovným dielom"): koko zo súctu vsetkých hodnôt pripadne na kazdého clena súboru, ak by z neho mal by prídel na kazdého clena súboru rovnaký. Takémuto pohadu je blízke rovnostárske prerozdeovanie príjmov na clena domácnosti. Variabilita hodnôt vo vseobecnosti je o diferenciách medzi kazdou dvojicou hodnôt. Jednoduchsí prístup je, ak budeme vychádza z diferencií hodnôt od priemeru:

Uz sme hovorili, ze ich súcet je rovný nule. Orientujeme sa preto na kvadrát diferencií:

Súcet kvadrátov diferencií podelený poctom meraní zmenseným o jednu sa nazýva rozptyl. Obúbenejsia je vsak standardná odchýlka, ktorá je druhou odmocninou rozptylu:

60

Jej pozitívum (na rozdiel od rozptylu) je, ze je meraná v tých istých jednotkách ako dáta. Pre distribúciu ,,pekne tvarovanú" (podobnú normálnej distribúcii, o ktorej bude rec neskôr) priblizne platia nasledujúce empirické pravidlá, zalozené na priemerných hodnotách a standardných odchýlkach: 1. priblizne 68% z dát je v intervale 2. priblizne 95% z dát je v intervale 3. skoro vsetky dáta sú z intervalu Distribúcia príjmu na clena domácnosti je ,,pekne tvarovaná" a spa predpoklady pre adekvátnu aplikáciu týchto pravidiel. Na základe druhého pravidla môzeme tvrdi, ze v intervale príjmov na clena domácnosti <334.49 , 8185.69> sa nachádza priblizne 95% domácností (priemer mínus/plus dvakrát standardná odchýlka). V tabuke sa nachádzajú aj hodnoty variacného rozpätia (Range). Hodnota variacného rozpätia predstavuje rozdiel medzi najväcsou a najmensou nameranou hodnotou skúmanej premennej. Je to sírka pásma, v ktorom sa nachádzajú vsetky namerané hodnoty. Variacné rozpätie teda závisí aj od extrémnych hodnôt.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Statistické ukazovatele v grafickej forme...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 15

Vytvori graf "priemer plus/mínus dve standardné odchýlky" (Mean+- 2 SD) premennej príjem na clena domácnosti (h) standardnou cestou. V riesení úlohy pouzijeme príkaz Error Bar. Graphs Error Bar...

Cesta

61

Obraz 26: Dialógový box Error Bar

Nastavenie dialógového boxu Error Bar ponecháme v ponúknutom standardnom tvare: typ grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

Obraz 27: Dialógový subbox Summaries for Groups of Cases

V subboxe Summaries for Groups of Cases premennú h presunieme do rámceka Variable: a premennú konst z technických dôvodov presunieme do rámceka Category Axis:. V rámceku s názvom Bars Represent aktivujeme variant Standard deviation. Stlacíme tlacidlo OK. Výstup 15 Vytvorili sme graf "priemer plus/mínus dve standardné odchýlky".

62

0 500

1000 1500

2000 2500

3000 3500

4000 4500

5000 5500

6000 6500

7000 7500

8000 8500

9000 9500

10000

Mean +- 2 SD Príjem na clena domácnosti:

Graf 15: Graf "priemer plus/mínus dve standardné odchýlky" premennej príjem na clena domácnosti

Stred úsecky reprezentuje aritmetický priemer. O om uz vieme, ze jeho hodnote je 4268,09 Sk. avý koniec intervalu je na úrovni 334,49 Sk. Táto hodnota predstavuje priemer mínus dvakrát standardnú odchýlku (Mean ­ 2 SD), cize 4260,09-2x1962,80. Pravý koniec intervalu je na úrovni 8185,69 Sk. Je to priemer plus dvakrát standardná odchýlka (Mean + 2 SD), cize 4260,0 + 2x1962,80. Význam takéhoto intervalu sme si v predchádzajúcej úlohe vysvetlili. Doceníme ho neskôr, ke budeme porovnáva viacero súborov pomocou takýchto intervalov. Graf umozní vizuálne porovnáva aj úrove aj variabilitu premennej vo viacerých súboroch. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Este raz k tvaru distribúcie...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Uz sme neraz hovorili o tvare distribúcie. Viaceré distribúcie s rovnakou úrovou a variabilitou hodnôt premennej sa môzu podstatne lísi sikmosou alebo spicatosou . Na tejto (tretej) úrovni poznania môzeme mera a hodnotou koeficienta vyjadri sikmos, asymetriu distribúcie (Skewness) i strmos, spicatos distribúcie (Kurtosis). Ukázeme si, ako sa tieto koeficienty vypocítajú. Porovnaním histogramu s tzv. normálnou krivkou (Normal Curve) ukázeme prínos grafickej prezentácie v riesení tejto otázky. Statistické ukazovatele tvaru distribúcie... Úloha 16 Vypocíta statistické ukazovatele sikmosti a strmosti distribúcie premenných: vek (vek1) a príjem na clena domácnosti (h). V riesení úlohy pouzijeme príkaz Frequencies.

63

Cesta

Analyze Descriptive Statistics Frequencies...

Obraz 28: Dialógový box Frequencies

V dialógovom boxe Frequencies zo zoznamu premenných presunieme premenné vek1 a h do rámceka Variable(s):. Stlacíme tlacidlo Statistics.

Obraz 29: Dialógový subbox Statistics

V dialógovom subboxe Statistics, v rubrike Distribution zapneme Skewness (sikmos) i Kurtosis (strmos). Stlacíme tlacidlo Continue. V dialógovom boxe Frequencies, do ktorého sme sa vrátili, vypneme prepínac Display frequency tables (nemáme v tejto chvíli záujem o výpocet frekvencnej tabuky). Napokon stlacíme OK. Výstup 16 Vypocítali sme pre dve vybrané kvantitatívne premenné koeficient sikmosti a koeficient strmosti (tabuka 9).

64

Statistics

Vek: N Skewness Kurtosis Valid Missing

1030 0 ,298 -,912

Príjem na clena domácnosti:

727 303 1,628 4,639

Tabuka 9: Statistické ukazovatele sikmosti a strmosti distribúcie

Koeficient sikmosti nie je ohranicený ­ môze nadobudnú akúkovek hodnotu. Ak je distribúcia symetrická, je rovný nule. Kladné hodnoty nadobúda vtedy, ak je distribúcia kladne zosikmená. V kladne zosikmenej distribúcii je väcsia koncentrácia polovice malých hodnôt, cize rozdiel medzi mediánom a najmensou hodnotou je mensí ako rozdiel medzi maximálnou hodnotou a mediánom. Z tabuky 9 je vidie (a u-kázeme si to neskôr aj na grafe), ze aj distribúcia veku aj distribúcia príjmu na clena domácnosti je kladne zosikmená (prvá vemi málo, tá druhá viac ­ cím väcsia kladná hodnota koeficienta, tým väcsie kladné zosikmenie). Záporné hodnoty nadobúda koeficient, ak je distribúcia záporne zosikmená. V záporne zosikmenej distribúcii je väcsia koncentrácia polovice vekých hodnôt, cize rozdiel medzi mediánom a najmensou hodnotou je väcsí ako rozdiel medzi maximálnou hodnotou a mediánom. Koeficient strmosti (spicatosti) tiez nie je ohranicený. Ak má premenná distribúciu tvaru normálnej krivky, koeficient je rovný nule. Koeficient je kladný v prípade strmsieho rozdelenia nez je normálne. Koeficient je záporný, ak je rozdelenie menej strmé nez je normálne rozdelenie. Z tabuky 9 môzeme vycíta, ze distribúcia veku je menej strmá ako normálna distribúcia a distribúcia príjmu na clena domácnosti je zjavne strmsia ako je normálne rozdelenie. Ukázeme si tieto fakty aj vo vizuálnej forme.

Histogram verzus normálna krivka...

Úloha 17

Vytvori histogram premennej príjem na clena domácnosti (h) a normálna krivka. V riesení úlohy pouzijeme príkaz Histogram. Graphs Histogram...

Cesta

65

Obraz 30: Dialógový box Histogram

V boxe Histogram do rámceka Variable presunieme názov premennej h. Stacíme tlacidlo OK. Výstup 17 Distribúcia v tvare normálnej krivky vpísaná do grafu 16 a 17, je urcitá idealizovaná (teoretická, modelová) krivka, ktorej sa vemi podobajú distribúcie kvantitatívnych premenných z urcitých oblastí zivota. Casto i my ocakávame, ze nami skúmaná premenná má priblizne normálne rozdelenie. Okrem precízneho hodnotenia normality pomocou koeficientov sikmosti a strmosti, môzeme v grafe opticky porovna reál s ,,ideálom" (s ocakávaným tvarom). Graf 16 a 17 potvrdzujú nase výsledky z tabuky 9.

Pocet

200 180 160 140 120 100 80 60 40 20 0 Std. Dev = 1962,80 Mean = 4268,1 N = 727,00

Graf 16: Histogram premennej príjem na clena domácnosti a normálna

0 0, 00 16 00,0 0 15 0,0 00 14 00,0 0 13 0,0 00 12 00,0 0 11 00,0 0 10 , 0 00 90 0,0 0 80 , 0 00 70 0,0 0 60 0,0 0 50 0,0 0 40 , 0 00 30 0,0 0 20 0,0 0 10 0 0,

Príjem na clena domácnosti

krivka

66

160 140 120 100 80 60 40 20 0 20,0 30,0 40,0 50,0 60,0 55,0 70,0 80,0 90,0 25,0 35,0 45,0 65,0 75,0 85,0 Std. Dev = 16,41 Mean = 43,1 N = 1030,00

Pocet

Vek

Graf 17: Histogram premennej vek a normálna krivka

67

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Komparácia súborov poda Kapitola II

kardinálnej premennej

kojioôi

(komparatívna analýza kvantitatívnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má tri subkapitoly: 2.1. komparácia distribúcií, 2.2. komparácia súborov poda percentilov, 2.3. komparácia súborov so zreteom na vzdialenosti medzi dátami.

]]]

1. subkapitola má dve casti: · numerická komparácia (tabuka triedenia druhého stupa), · vizuálna komparácia (polygóny).

]

2. subkapitola riesi dve témy: · numerická komparácia percentilov - tabuka percentilov poda jednotlivých súborov, · vizuálna komparácia percentilov ­ komparatívny krabickový graf.

]

3. subkapitola riesi tri okruhy problémov: · numerická komparácia úrovne a variability (tabuka charakteristík úrovne a variability), · vizuálna komparácia úrovne a variability (komparatívny graf ,,priemer plus/mínus dve standardné odchýlky"), · komparácia súborov poda charakteristík asymetrie a strmosti distribúcií (tabuka koeficientov asymetrie a strmosti).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s dvomi typmi

premenných: 1. kvantitatívne premenné, ktorými budeme porovnáva rôzne súbory: · pocet clenov domácnosti (pocdom), · príjem na clena domácnosti (h). 2. premenné, ktoré budú vymedzova súbory (spravidla nominálne alebo kategorizované premenné): · vekostné kategórie obcí (katobc), · národnos (narod). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

68

Castejsie, nez s opisom jednej premennej v jednom súbore, stojíme pred úlohou porovna viacero súborov z hadiska jednej premennej. Kazdé porovnanie je zalozené na predbeznej znalosti jednotlivých stránok (tu súborov), ktoré chceme porovnáva. Preto bolo potrebné najprv absolvova univariacnú analýzu. Úlohy komparácie súborov poda kvantitatívnej premennej budú zalozené na pojmoch, ktoré sme si ozrejmili v predchádzajúcej kapitole. V kazdej úlohe budú vystupova dve premenné: jedna premenná vymedzuje súbory, ktoré chceme komparova a druhá premenná, ktorou chceme komparova súbory. Obsah a postupnos nastolovaných problémov aj tu, rovnako ako v predchádzajúcej kapitole, je urcená tromi gnozeologickými rovinami kvantitatívnej premennej. Pripomeme si ich: nominálny rozmer kvantitatívnych dát - triedenie dát, ordinálny rozmer kvantitatívnych dát - usporiadanie dát poda poradia, specificky kardinálny rozmer kvantitatívnych dát - sumarizácia so zreteom na vzdialenosti medzi dátami.

]]]

69

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­2.1. Komparácia distribúcií

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Skladba subkapitoly Subkapitola sa skladá z dvoch tém: · · numerická komparácia (tabuka triedenia druhého stupa), vizuálna komparácia (polygóny).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia distribúcií ...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 1

Vytvori komparacnú tabuku ­ vykona triedenie druhého stupa. V stpcoch budú jednotlivé súbory vymedzené poctom obyvateov zijúcich v obci a v riadkoch vekové kategórie. V bunkách nech sú pocetnosti a stpcové percenta (keze chceme porovnáva skladbu stpcov). Úlohu budeme riesi príkazom Crosstabs. Analyze Descriptive Statistics Crosstabs...

Cesta

Obraz 1: Dialógový box Crosstabs

V dialógovom boxe Crosstabs do rámceka Row(s): presunieme premennú r1vek a do rámceka Column(s): presunieme premennú katobc. Stlacíme tlacidlo Cells... .

70

V dialógovom subboxe Cells v rámceku Counts ponecháme zapnutý prepínac s názvom Observed (zaujímajú nás empirické, pozorované pocetnosti). V rámceku Percentages zapneme prepínac Column (chceme vypocíta stpcové percenta, cize kazdá kategória obcí tvorí celok a percentuálny základ). Stlacíme Continue a potom tlacidlo OK.

Obraz 2: Dialógový subbox Cells

Výstup 1

Výstupom je tabuka triedenia druhého stupa (tabuka 1).

Pocet obyvateov obce: menej ako 1 tisíc Kategórie 18 az 25 veku: 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

19 13,2% 32 22,2% 25 17,4% 23 16,0% 18 12,5% 27 18,8% 144 100,0%

1 az 2 tisíc

30 17,0% 34 19,3% 37 21,0% 25 14,2% 29 16,5% 21 11,9% 176 100%

2 az 5 tisíc

20 15,9% 26 20,6% 28 22,2% 19 15,1% 20 15,9% 13 10,3% 126 100%

5 az 20 tisíc

30 16,7% 46 25,6% 36 20,0% 26 14,4% 25 13,9% 17 9,4% 180 100,0%

20 az 50 tisíc

30 18,0% 38 22,8% 34 20,4% 27 16,2% 18 10,8% 20 12,0% 167 100,0%

50 az 100 tisíc

21 17,5% 29 24,2% 19 15,8% 17 14,2% 22 18,3% 12 10,0% 120 100,0%

Bratislava, Kosice

18 15,4% 26 22,2% 28 23,9% 18 15,4% 15 12,8% 12 10,3% 117 100,0%

Tabuka 1: Distribúcie veku poda vekostných kategórií obcí

Kazdá vekostná kategória obcí definuje súbor. Priamo porovnatené sú percenta (stpcové). Vyberieme si ubovoný riadok (vekovú kategóriu) a v om porovnávame percentuálne hodnoty. Napríklad, zaostrime pozornos na najstarsiu vekovú kategóriu ­ 66-rocných a starsích. Môzeme konstatova, ze najväcsí podiel starých udí sme nasli

71

v súbore malých dedín (s menej ako tisíc obyvatemi). V ostatných súboroch (kategóriách obcí je podiel starsích udí výrazne nizsí). Podobne analyzujeme a komparujeme súbory poda alsích vekových kategórií. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Grafická (vizuálna) komparácia... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Úloha 2 Vytvori polygón vekovej skladby respondentov pre kazdý súbor, definovaný vekostnými kategóriami obcí. Druhostupová tabuka z predchádzajúcej úlohy bude vyjadrená mnozstvom oddelených polygónov. Úlohu budeme riesi interaktívnou cestou príkazom Dot. Graphs Interactive Dot...

Cesta

Obraz 3: Dialógový box Create Dots

72

Najprv sme zvolili interaktívnu cestu konstrukcie polygónov. V ich tvorbe je mozné ís aj standardnou cestou. V nasledujúcej úlohe si ukázeme aj tento spôsob. V Dialógovom boxe Dot do vstupného poa horizontály prenesieme premennú r1vek a do vstupného poa vertikály $pct (na vertikále grafu budú znázornené percenta). Do rámceka Panel Variables vlozíme premennú katobc. Stlacíme tlacidlo OK. Výstup 2 Vyrobili sme graf polygónov veku poda vekostných kategórií obcí.

Graf 1: Polygóny veku poda vekostných kategórií obcí

Spravidla, kúcové diferencie, ktoré sme odhalili v komparacnej tabuke prezentujeme aj graficky, napríklad formou polygónov. Úloha 3 Budeme riesi ten istý problém ako v predchádzajúcej úlohe. Budeme vytvára polygóny pre jednotlivé súbory, avsak na rozdiel od predchádzajúceho riesenia vsetky polygóny budú v jednom grafe. Úlohu budeme riesi príkazom Line.

73

Cesta

Graphs Line...

Obraz 4: Dialógový box Line Charts

V dialógovom boxe Line Charts zapneme druhý typ grafu ­ Multiple. V rámceku Data in Chart Are nebudeme robi ziadne zmeny. Stlacíme tlacidlo Define.

Obraz 5: Dialógový subbox Summaries for Groups of Cases

V dialógovom subboxe Summaries for Groups of Cases do rámceka Category Axis: presunieme premennú, poda ktorej budeme tvori polygóny ­ pocdom. Do rámceka Define Lines by: presunieme premennú narod ­ pre kazdú kategóriu tejto premennej vytvoríme polygón. V rámceku Lines Represent zapneme prepínac % of cases, dosiahneme tým, ze vertikálna os bude zobrazova percenta. Stlacíme tlacidlo Options... .

74

Obraz 6: Dialógový subbox Options

Ak premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma polygón tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná narod nemá chýbajúce hodnoty.) Výstup 3 Vytvorili sme graf polygónov poctu clenov domácností poda národnosti.

Percenta

30

25

20

15

10

Národnos:

slovenská

5 maarská 0 1 2 3 4 5 6 7 8 9 10 iná

Pocet clenov domácnosti

Graf 2: Polygóny poctu clenov domácností poda národnosti

Niekedy komparácia, v ktorej nezistíme ziadne rozdiely je vemi dôlezitá. Z grafu 2 vidíme, ze vsetky tri súbory domácností sú poda distribúcie poctu clenov domácností pomerne homogénne. Pred tým, nez sa rozhodneme takto prezentova grafom výsledok, starostlivo analyzujme komparacnú tabuku. Pretoze ona presnejsie informuje o rozdieloch medzi súbormi. Az potom sa rozhodneme, ci a ako pouzijeme vizuálnu prezentáciu výsledkov.

75

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­2.2. Komparácia súborov poda percentilov

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Subkapitola riesi dva okruhy problémov: · · numerická komparácia percentilov - tabuka percentilov poda jednotlivých súborov, vizuálna komparácia percentilov ­ komparatívny krabickový graf.

Skladba subkapitoly

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia percentilov... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 4 Vytvori tabuku percentilov premenných: pocet clenov domácnosti, vek a príjem na clena domácnosti pre jednotlivé súbory respondentov, definované vekosou obcí, v ktorých trvalo zijú. Úlohu budeme riesi príkazom Explore . (Pripomíname, ze o percentiloch sme uz podrobne hovorili v subkapitole 1.2.) Analyze Descriptive Statistics Explore...

Cesta

Obraz 7: Dialógový box Explore

V dialógovom boxe Explore do rámceka Dependent List: presunieme premennú, pre ktorú budeme pocíta percentily, cize premennú h. Do rámceka Factor List: presunieme premennú, ktorá definuje súbory ­ katobc. V rámceku Display zapneme prepínac Statistics (chceme pocíta statistické charakteristiky). Stlacíme tlacidlo Statistics... .

76

V dialógovom subboxe Statistics zapneme polozku Percentiles. Stlacíme Continue a následne stlacíme tlacidlo OK.

Obraz 8: Dialógový subbox Statistics

Výstup 4

Vytvorili sme tabuku zadaných percentilov príjmu na clena domácnosti poda vekostných kategórií obcí (tabuka 2).

Percentiles 5 10

2040,00 2100,00 2602,50 2375,00 2166,67 2587,50 2612,50

25

2625,00 2750,00 3166,67 2950,00 2875,00 3468,75 4500,00

50

3500,00 3375,00 3854,17 3875,00 3875,00 4337,50 5250,00

75

4750,00 4468,75 5166,67 4833,33 4750,00 5583,33 8250,00

90

5530,00 5462,50 6191,67 6133,33 7166,67 7700,00

95

6500,00 6616,67 6716,67 7225,00 7750,00 9637,50

Príjem na menej ako 1 tisíc clena 1 az 2 tisíc domácnosti: 2 az 5 tisíc 5 az 20 tisíc 20 az 50 tisíc 50 az 100 tisíc

1500,00 1430,00 2168,75 2100,00 1900,00 1800,00

Bratislava, Kosice 2293,75

9525,00 10775,00

Tabuka 2: Percentily príjmu na clena domácnosti poda vekostných kategórií obcí

Ako analyzova tabuku 2? Uvedomme si, ze porovnávame domácnosti siedmych súborov. A môzeme si polozi jednu z mnohých otázok, napríklad: Aká je horná príjmová hranica domácnosti (v zmysle príjmu na clena) piatich percent najnizsie situovaných domácností v urcitom súbore? Sústreme pozornos na prvý (pä-) percentilový stpec. Najmensie obce majú tento ,,strop" najnizsí, väcsie obce a mensie a stredné mestá sú na tom výrazne lepsie. Najvyssie polozený strop ,,dolných" 5% domácností je 1.8, respektíve takmer 2.3 tisíc Sk vo väcsích a najväcsích mestách. Analogicky v analýze prechádzame postupne alsími stpcami (percentilmi). Dodatok Pozrime sa pre zaujímavos na tabuku percentilov premennej pocet clenov domácnosti poda národnosti.

77

Percentiles 5 Pocet clenov domácnosti: slovenská nár. maarská nár. iná nár.

1,00 1,00 1,00

10

2,00 1,00 2,00

25

2,00 2,00 2,00

50

3,00 3,00 3,00

75

4,00 4,00 5,00

90

5,00 5,00 6,00

95

6,00 5,50 7,00

Tabuka 3: Percentily pocte clenov domácnosti poda kategórií národnosti

Skála pocet clenov domácností má relatívne malý pocet mozností (napríklad na rozdiel od príjmovej skály). V takýchto situáciách percentily (tabuka 3) sú dos hrubým a preto len orientacným komparacným prostriedkom (na rozdiel od tabuky 2). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Grafická (vizuálna) komparácia percentilov... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 5 Vytvori krabickové grafy poctu clenov domácnosti poda premennej národnos. (O krabickových grafoch sme uz podrobne hovorili v subkapitole 1.2.) Úlohu budeme riesi príkazom Boxplot. Graphs Boxplot...

Cesta

Obraz 9: Dialógový box Boxplot

Nastavenie dialógového boxu Boxplot ponecháme v ponúknutom standardnom tvare: typ krabickového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

78

Obraz 10: Dialógový subbox Summaries for Groups of Cases

V dialógovom subboxe Summaries for Groups of Cases do vstupného poa Variable: presunieme premennú pocdom. Krabickové grafy tejto premennej budeme vytvára. Do vstupného poa Category Axis: presunieme premennú narod ­ ona definuje súbory. Stlacíme tlacidlo Options... . Uz sme upozorovali na situáciu, ze ak premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma graf tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná narod nemá chýbajúce hodnoty.)

Obraz 11: Dialógový box Options

Výstup 5

Vytvorili sme krabickové grafy poctu clenov domácnosti poda národnosti (graf 3). Na základe komparacnej analýzy a interpretácie tabuky percentilov sa treba rozhodnú, ci je vhodné prezentova výsledky vo forme krabickových grafov. Niekedy takéto grafy sú vhodné len v procese analýzy dát, napríklad, ak sú súbory pomerne homogénne ako v grafe 3. Graf 4 je ovea pestrejsí a ako taký je nielen zaujímavý vo fáze analýzy dát, ale môze by aj vhodným prostriedkom prezentácie výsledkov.

79

Pocet clenov domácnosti

11 10 9 8 7 6 5 4 3 2 1 0 slovenská maarská iná

Národnos

Graf 3: Krabickové grafy poctu clenov domácnosti poda národnosti

Dodatok

Pozrime sa pre zaujímavos na krabickové grafy premennej príjem na clena domácnosti poda vekostných kategórií obcí.

Príjem na clena domácnosti

16000 15000 14000 13000 12000 11000 10000 9000 8000 7000 6000 5000 4000 3000 2000 1000 0 menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc 20 az 50 tisíc Bratislava, Kosice 5 az 20 tisíc 50 az 100 tisíc

Pocet obyvateov obce

Graf 4: Krabickové grafy príjmu na clena domácnosti poda vekostných kategórií obcí

80

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­2.3. Komparácia súborov so zreteom na vzdialenosti medzi dátami

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Skladba subkapitoly

V tejto subkapitole budeme riesi tri okruhy problémov: · · · numerická komparácia úrovne a variability (tabuka charakteristík úrovne a variability), vizuálna komparácia úrovne a variability (komparatívny graf ,,priemer plus/mínus dve standardné odchýlky"), komparácia súborov poda charakteristík sikmosti a strmosti distribúcií (tabuka koeficientov asymetrie a strmosti).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia úrovne a variability... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 6 Vytvori tabuku charakteristík úrovne a variability premenných pocet clenov domácnosti, vek a príjem na clena domácnosti pre jednotlivé vekostné kategórie obcí. Úlohu budeme riesi príkazom Means. (Pripomíname, ze o charakteristikách úrovne a variability sme podrobne hovorili v subkapitole 1.3.) Analyze Compare Means Means...

Cesta

Obraz 12: Dialógový box Means

V dialógovom boxe Means do rámceka Dependent List: presunieme kvantitatívne premenné pocdom, vek1 a h. Pre ne budeme pocíta

81

charakteristiky úrovne a variability. Do rámceka Independent List: presunieme premennú, ktorá definuje súbory ­ katobc. Stlacíme tlacidlo Options... . V dialógovom subboxe Options z rámceka Statistics: vyberieme charakteristiky, napríklad Median, Minimum, Maximum, Range, Mean a Standard Deviation. Stlacíme Continuum a následne OK.

Obraz 13: Dialógový subbox Options

Výstup 6

Vypocítali sme charakteristiky úrovne a variability premenných pocet clenov domácnosti, vek respondenta a príjem na clena domácnosti poda vekostných skupín obcí (tabuka 4). Vhodnos väcsiny mier úrovne kvantitatívneho znaku závisí od tvaru distribúcie. Vieme, ze predstavu o tvare distribúcie získame pomocou grafov (stpcový graf, krabickový graf, histogram). Ak je distribúcia (priblizne) symetrická a unimodálna môzeme pouzi priemer (treba si tiez da pozor na extrémne hodnoty). Ak je distribúcia prílis zosikmená, vhodnejsí je medián (trebárs spolu s krabickovým grafom). Ak je distribúcia multimodálna, treba zvázi taký postup, v ktorom dáta rozdelíme na intervaly (podskupiny) a kazdú z nich charakterizujeme priemerom a mediánom. Aj aplikácia mier variability by mala by podriadená tvaru distribúcie. Ak je distribúcia symetrická, bez váznejsích extrémnych hodnôt, standardná odchýlka a variacné rozpätie je vhodné. Aj je distribúcia zosikmená, prípadne má este extrémne hodnoty, vhodnejsia je medzikvartilová odchýlka.

82

Pocet clenov domácnosti: menej ako 1 tisíc Median Minimum Maximum Range Mean Std. Deviation 1 az 2 tisíc Median Minimum Maximum Range Mean Std. Deviation 2 az 5 tisíc Median Minimum Maximum Range Mean Std. Deviation 5 az 20 tisíc Median Minimum Maximum Range Mean Std. Deviation 20 az 50 tisíc Median Minimum Maximum Range Mean Std. Deviation 50 az 100 tisíc Median Minimum Maximum Range Mean Std. Deviation Bratislava, Kosice Median Minimum Maximum Range Mean Std. Deviation

4,00 1 8 7 3,83 1,68 3,00 1 9 8 3,52 1,66 4,00 1 10 9 3,65 1,73 3,00 1 10 9 3,31 1,35 3,00 1 6 5 3,25 1,26 3,00 1 7 6 3,16 1,33 3,00 1 9 8 3,06 1,39

Vek:

44,00 18 87 69 45,37 17,06 43,00 18 82 64 44,13 16,87 41,00 18 78 60 42,88 16,18 40,50 18 89 71 41,87 15,72 38,00 18 80 62 42,25 16,39 41,00 18 85 67 43,18 17,04 41,00 18 75 57 42,42 15,55

Príjem na clena domácnosti:

3500,00 300 12500 12200 3738,92 1622,10 3375,00 300 13500 13200 3632,74 1731,86 3854,17 300 7750 7450 4155,04 1409,81 3875,00 625 13000 12375 4132,68 1734,44 3875,00 1700 10500 8800 4155,23 1679,43 4337,50 1125 11000 9875 4828,29 2082,53 5250,00 1833 15500 13667 6066,79 2848,99

Tabuka 4: Charakteristiky úrovne a variability premenných pocet clenov domácnosti, vek respondenta a príjem na clena domácnosti poda vekostných skupín obcí 83

Z toho plynie, ze by sme nemali priamociaro pristúpi k aplikácii priemerov a standardných odchyliek (a vo výskumnej praxi sa to tak nezriedka deje). Skôr nez zacnete analyzova tabuku 4 a interpretova priemery a standardné odchýlky, preskúmajte najprv distribúcie (tvar) jednotlivých premenných osobitne v kazdej kategórii obcí (vymedzenej poda vekosti) a pri rozhodovaní, ktorú charakteristiku pouzijete majte na zreteli spomínané pravidlá, predovsetkým zásadu, ze pouzitie statistických charakteristík je podmienené tvarom distribúcie. Nerespektovanie tejto rady môze vies k úplne pomýleným interpretáciám. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Grafická (vizuálna) komparácia úrovne a variability... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Úloha 7 Vytvori graf ,,priemer plus/mínus dve standardné odchýlky" premennej príjem na clena domácnosti poda vekostných kategórií obcí. Úlohu budeme riesi príkazom Error Bar. Graphs Error Bar...

Cesta

Obraz 14: Dialógový box Error Bar

V dialógovom boxe Error Bar ponecháme nastavenie v ponúknutom standardnom tvare: typ grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases). Stlacíme Define. V dialógovom subboxe Summaries for Groups of Cases do vstupného poa Variable: presunieme premennú h. Grafy ,,priemer plus/mínus 2 standardné odchýlky" tejto premennej budeme vytvára. Do vstupného poa Category Axis: presunieme premennú katobc ­ ona definuje súbory. Stlacíme tlacidlo Options... .

84

Obraz 15: Dialógový subbox Summaries for Groups of Cases

Obraz 16: Dialógový subbox Options

Opä poukazujeme na situáciu kedy premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma graf tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná katobc nemá chýbajúce hodnoty.) Stlacíme Continue a následne OK. Výstup 7 Vytvorili sme graf ,,priemer plus/mínus 2 standardné odchýlky" premennej príjem na clena domácnosti poda vekostných kategórií obcí. Graf 5 je vhodne pozitý, ak spa pravidlá o aplikácii priemerov a standardných odchýlkach, v tom zmysle ako sme hovorili v úlohe 6. Za takých okolností je vhodným doplnkom, vizuálnou prezentáciou väcsieho mnozstva distribúcií, ke chceme klás dôraz na existujúcu centrálnu tendenciu v súboroch, na rozdiely úrovne a na charakter dislokácie dát okolo priemerov.

85

Mean +- 2 SD Príjem na clena domácnosti

14000 13000 12000 11000 10000 9000 8000 7000 6000 5000 4000 3000 2000 1000 0 menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc 20 az 50 tisíc Bratislava, Kosice 5 az 20 tisíc 50 az 100 tisíc

Pocet obyvateov obce

Graf 5: Graf ,,priemer plus/mínus 2 standardné odchýlky" premennej príjem na clena domácnosti poda vekostných kategórií obcí

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Komparácia súborov poda charakteristík sikmosti a strmosti distribúcií... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 8 Vytvori tabuku koeficientov asymetrie (sikmosti) a strmosti premenných pocet clenov domácnosti, vek a príjem na clena domácnosti poda jednotlivých vekostných kategórií obcí. Úlohu budeme riesi príkazom Means. (O mierach sikmosti a strmosti distribúcie sme uz podrobne hovorili v subkapitole 1.3.) Analyze Compare Means Means... V dialógovom boxe Means rovnako ako v úlohe 6 (obraz 12) do rámceka Dependent List: presunieme kvantitatívne premenné pocdom, vek1 a h. Pre ne budeme pocíta charakteristiky asymetrie a strmosti. Do rámceka Independent List: presunieme premennú, ktorá definuje súbory ­ katobc. Stlacíme tlacidlo Options... . V dialógovom subboxe Options z rámceka Statistics: vyberieme pozadované charakteristiky Skewness a Kurtosis. Stlacíme Continuum a následne OK.

86

Cesta

Obraz 17: Dialógový subbox Options

Výstup 8

Vypocítali sme tabuku koeficientov asymetrie a strmosti premenných pocet clenov domácnosti, vek a príjem na clena domácnosti poda jednotlivých vekostných kategórií obcí.

Pocet clenov domácnosti: Skewness Kurtosis

-,525 ,441 ,512 2,572 -,787 -,295 1,996 ,636

Vek: Skewness

,139 ,260 ,274 ,345 ,402 ,346 ,261 ,298

Príjem na clena domácnosti: Skewness

1,722 2,195 ,252 1,852 1,069 1,022 1,081 1,628

Kurtosis

-1,101 -1,013 -1,000 -,690 -,839 -,721 -,998 -,912

Kurtosis

7,259 9,755 ,107 6,333 1,258 1,114 1,499 4,639

menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc 5 az 20 tisíc 20 az 50 tisíc 50 az 100 tisíc Bratislava, Kosice Total

,115 ,571 ,583 ,776 ,044 ,136 ,771 ,533

Tabuka 5: Tabuka koeficientov asymetrie a strmosti premenných pocet clenov domácnosti, vek a príjem na clena domácnosti poda jednotlivých vekostných kategórií obcí

Ak skúmame zosikmenie distribúcií (Skewness) jednotlivých premenných v sledovaných súboroch obcí, z tabuky 5 plynie, ze najsymetrickejsia je distribúcia veku. Koeficient sikmosti distribúcie veku je vo vsetkých súboroch obcí vemi podobný a pomerne blízky nule. Este je potrebné preskúma situáciu z hadiska existencie, ci neexistencie

87

extrémnych hodnôt. Odporúcame vytvori krabickové grafy premennej vek poda vekostných kategórií obcí. Ten nám ukáze, ze ziadna z distribúcií nemá vybocujúce, ani extrémne hodnoty. Sú to podmienky, kedy je opodstatnené pracova s priemermi a so standardnou odchýlkou. Nase prípadné ocakávania o normálnej distribúcii príjmu na clena domácnosti nie sú splnené v takej miere ako v prípade premennej vek respondenta. Krabickový graf 4 z tejto subkapitoly ukazuje, ze v súboroch sa objavujú aj extrémne hodnoty. Ak v prípade príjmu na clena domácnosti pouzijeme v komparacnej analýze priemery a standardnú odchýlku, majme na pamäti mensí stupe platnosti podmienky o dobre tvarovaných distribúciách. Koeficienty strmosti distribúcie veku v súboroch sú pomerne vyrovnané. Ich vekos je záporná, okolo hodnoty mínus jedna. Distribúcie sú ciastocne plochsie ako normálna distribúcia. Koeficienty strmosti distribúcie premennej pocet clenov domácnosti medzi súbormi sú znacne diferencované. V absolútnej hodnote vsak nie vemi veké. Koeficienty strmosti distribúcie príjmu na clena domácnosti v niekokých súboroch sú znacne veké, naopak, v alsích pomerne malé.

88

89

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola III Vzah medzi dvomi

kardinálnymi premennými

kojioôi

(bivariacná analýza kvantitatívnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má dve subkapitoly: 3.1. lineárna regresia, 3.2. súcinová korelácia.

]]]

1. subkapitola má tri casti: · grafické zobrazenie súboru v dvojrozmernom priestore (bodový graf), · formy vzahu závisle a nezávisle premennej (jednoduchá lineárna a nelineárna regresia), · výpocet regresných koeficientov (parametre regresnej priamky).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s dvomi

premennými: · pocet clenov domácnosti (pocdom), · príjem na clena domácnosti (h). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

90

V tejto kapitole sa prvýkrát stretneme s úlohami bivariacnej analýzy. Základom je jeden súbor. V om analyzujeme vzah dvojice kvantitatívnych premenných. Dvojica premenných môze vystupova v dvoch variantoch: dve rôzne kvantitatívne premenné, vlastnosti jednotiek toho istého súboru (ich skály nemusia ma rovnakú jednotku alebo pociatok merania), tá istá kvantitatívna vlastnos jednotiek toho istého súboru v rôznom case zachytená dvomi premennými. Jeden príslusník súboru je reprezentovaný dvojicou kvantitatívnych hodnôt, pomocou nich ako súradníc je jednotlivec zobrazený v dvojrozmernom priestore. Niektoré vonkajsie znaky bivariacnej analýzy sú podobné s komparacnou analýzou. V komparacnej analýze tiez vystupujú, ako sme videli, dve premenné. Avsak jedna slúzi k vymedzeniu viacerých súborov, druhá je vlastným predmetom analýzy. Druhá premenná ­ keze poda nej komparujeme ­ musí ma vo vsetkých súboroch úplne rovnakú skálu.

]]]

91

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 3.1. Lineárna regresia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Subkapitola má tri casti:

·

Skladba subkapitoly

·

·

grafické zobrazenie súboru v dvojrozmernom priestore (bodový graf), formy vzahu závisle a nezávisle premennej (jednoduchá lineárna a nelineárna regresia), výpocet regresných koeficientov (parametre regresnej priamky).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Grafické zobrazenie súboru v dvojrozmernom priestore...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 1

Vytvori bodový graf (Scatter Plot) hodnôt premenných: pocet clenov domácnosti (pocdom) a príjem na clena domácnosti (h). Graphs Scatter...

Cesta

Obraz 1: Dialógový box Scatterplot

V dialógovom boxe Scatterplot (obraz 1) nebudeme robi ziadne zmeny, ponecháme jednoduchý typ (Simple) bodového grafu. Stlacíme Define. Otvorí sa nám dialógový subboxe Simple Scatterplot (obraz 2). Do rámceka X Axis presunieme premennú pocdom a do rámceka Y Axis premennú h. Stlacíme tlacidlo Options.... V dialógovom subbboxe Options zrusíme polozku Display groups defined by missing values. Stlacíme Continue a následne OK.

92

Obraz 2: Dialógový subbox Simple Scatterplot

Obraz 3: Dialógový subbox Options

Výstup 1

16000 14000 12000 10000 8000 6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Príjem na clena domácnosti

Pocet clenov domácnosti

Graf 1: Bodový graf dát dvoch kvantitatívnych premenných ­ pocet clenov domácnosti a príjem na clena domácnosti 93

V dvojrozmernom priestore horizontálna dimenzia zobrazuje skálu jednej kvantitatívnej premennej a vertikálna dimenzia zobrazuje skálu druhej kvantitatívnej premennej. To, ktorá dimenzia (císelná os) predstavuje, napríklad, prvú premennú zatia nie je dôlezité. Zatia premenné vystupujú v rovnakých pozíciách, ich vzah ­ spôsob dislokácie dát chápeme ako symetrický. Kazdý respondent je zobrazený v dvojrozmernom priestore (poda svojich hodnôt) ako krúzok. V grafe ten istý krúzok môze reprezentova viacero respondentov, ak majú rovnaké koordináty (súradnice). Pripomíname nás koncept: je taký, ze dáta predstavujú jeden súbor v dvojdimenzionálnom priestore, kde dimenzie znázorujú kvantitatívne premenné. V grafe 1 vidíme, ze takmer vsetky body sú umiestnené pod pomyselnou uhloprieckou obdznika. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Formy vzahu závisle a nezávisle premennej...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 2

Vytvori graf ,,priemer plus/mínus dve standardné odchýlky" premennej príjem na clena domácnosti poda poctu clenov domácnosti. V úlohe upresníme koncept, totiz, príjem na clena domácnosti budeme chápa ako závisle premennú na nezávisle premennej, ktorou je pocet clenov domácnosti. Otázkou je, ako sa menia podmienené aritmetické priemery v tom istom súbore respondentov. Úlohu budeme riesi príkazom Error Bar (úloha patrí formálne do tej istej kategórie ako úloha 7 v subkapitole 2.3.). Graphs Error Bar... V dialógovom boxe Error Bar ponecháme nastavenie v ponúknutom standardnom tvare: typ grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases). Stlacíme Define. V dialógovom subboxe Summaries for Groups of Cases do vstupného poa Variable: presunieme premennú h. Grafy ,,priemer plus/mínus 2 standardné odchýlky" tejto premennej budeme vytvára. Do vstupného poa Category Axis: presunieme premennú pocdom ­ ona definuje hodnoty nezávisle premennej. Stlacíme tlacidlo Options... . V dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. Stlacíme Continue a následne OK.

Cesta

Výstup 2

Vytvorili sme graf ,,priemer plus/mínus 2 standardné odchýlky" premennej príjem na clena domácnosti poda poctu clenov domácnosti. Vráme sa ku grafu 1 a dodatocne ho ciastocne reinterpretujme. Nech vertikála (Y) bodového grafu predstavuje závisle premennú a horizontála (X) nezávisle premennú. Sledujme ako sa menia ypsilonové súradnice jednotlivých bodov v závislosti na zmene iksových súradníc. Jednotlivé skupiny bodov, leziace na rovnakej vertikále môzeme

94

charakterizova ich priemerom a úseckou s dzkou styroch standardných odchýliek. Dostávame sa ku grafu 2. Ten specifickým spôsobom ukazuje ako sa mení príjem v závislosti na pocte clenov domácnosti. Umozuje na základe znalosti poctu clenov domácnosti urobi urcitú ­ menej alebo viac presnú - predikciu príjmovej úrovne domácnosti. Vseobecný trend je taký, ze cím je väcsí pocet clenov domácnosti, tým je príjem na clena mensí (zhruba nepriama úmera).

12000

Mean +- 2 SD Príjem na clena domácnosti

10000

8000

6000

4000

2000

0 1 2 3 4 5 6 7 8 9 10

Pocet clenov domácnosti

Graf 2: Graf ,,priemer plus/mínus dve standardné odchýlky" premennej príjem na clena domácnosti v závislosti na pocte clenov domácnosti

Úloha 3

V bodovom grafe 1 dislokovanými bodmi prelozi optimálnu krivku (regresnú krivku) ­ reprezentantku nelineárnej závislosti príjmu na clena domácnosti od poctu clenov domácnosti. V okne je zobrazený bodový graf 1. Graf prepneme do editovacieho rezimu (v 9. verzii SPSS to predstavuje: dvakrát rýchle stlaci avé tlacidlo mysi so sípkou na grafe). Sme v editovacom rezime. V ponuke vyberieme polozku Chart a vzápätí polozku Options... . Otvorí sa nám dialógový box Scatterplot Options (obraz 4). V rámceku Fit Line zapneme polozku Total. Rozsvieti sa tlacidlo Fit Options..., ktoré stlacíme. Otvorí sa nám dialógový subbox Fit Line (obraz 5). V rámceku Fit Method vyberieme typ Quadratic regression. Stlacíme Continue. Potom stlacíme tlacidlo OK.

Cesta

95

Obraz 4: Dialógový box Scatterplot Options

Obraz 5: Dialógový subbox Fit Line

Výstup 3

Nás zámer bol taký, aby sme získali a umiestnili do bodového grafu jednoduchú (kvadratickú) krivku, pricom má plati, ze odchýlky bodov vo vertikálnom smere od nej budú minimálne. Takú krivku budeme nazýva regresnou krivkou. A vzah, ktorý ona vyjadruje medzi závisle a nezávisle premennou budeme nazýva nelineárnou regresiou. Predikciu príjmu pri urcitom pocte clenov domácnosti robíme tak, ze nájdeme výsku ypsilonovej súradnice príslusného bodu na krivke. Je zrejmé, ze cím je väcsí rozptyl bodov okolo krivky, tým bude pravdepodobnos omylu v predikcii väcsia. Výskumnícka prax bola v minulosti casto taká, ze sa fáza vyhadávania regresnej krivky ,,preskocila" a priamo sa pristúpilo k deskripcii regresnej priamky ­ lineárneho regresného vzahu. Takýto postup nás môze uvies do omylu. Dnes, ke sme v situácii, ze pocítacový systém nám úlohu nelineárnej regresie ahko vyriesi, nie je uz dôvod vystavova sa takémuto riziku.

96

16000 14000 12000 10000 8000 6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Príjem na clena domácnosti

Pocet clenov domácnosti

Graf 3: Bodový graf dát dvoch kvantitatívnych premenných ­ pocet clenov domácnosti a príjem na clena domácnosti prekrytý regresnou krivkou

Úloha 4

V bodovom grafe 1 dislokovanými bodmi prelozi priamku (regresnú priamku) ­ reprezentantku lineárnej závislosti príjmu na clena domácnosti od poctu clenov domácnosti. V okne je zobrazený bodový graf 1. Graf prepneme do editovacieho rezimu (v 9. verzii SPSS to predstavuje: dvakrát rýchle stlaci avé tlacidlo mysi so sípkou na grafe). Sme v editovacom rezime. V ponuke vyberieme polozku Chart a vzápätí polozku Options... . Otvorí sa nám dialógový box Scatterplot Options. V rámceku Fit Line zapneme polozku Total. Rozsvieti sa tlacidlo Fit Options... , ktoré stlacíme. Otvorí sa nám dialógový subbox Fit Line. V rámceku Fit Method vyberieme typ Linear regression. Stlacíme Continue. Potom stlacíme tlacidlo OK. Graf 4 ukazuje ze nie je podstatný rozdiel medzi tvarom regresnej priamky a regresnej kvadratickej krivky (graf 3), ktoré vyjadrujú vzah závislosti príjmu na clena rodiny od poctu je clenov. Má preto zmysel zaujíma sa o konkrétny vzorec regresnej priamky. Výpocet parametrov priamky si ukázeme v úlohe 5.

Cesta

Výstup 4

97

16000 14000 12000 10000 8000 6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Príjem na clena domácnosti

Pocet clenov domácnosti

Graf 4: Bodový graf dát dvoch kvantitatívnych premenných ­ pocet clenov domácnosti a príjem na clena domácnosti prekrytý regresnou priamkou

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Výpocet regresných koeficientov... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 5 Vypocíta koeficienty lineárnej regresie ­ závislosti príjmu na clena domácnosti od poctu clenov domácnosti. Analyze Regression... Linear...

Cesta

Obraz 6: Dialógový box Linear Regression 98

Výstup 5

V pocítacovom výstupe nás predovsetkým zaujímajú parametre priamky, ktorá predstavuje regresnú priamku.

a Regresné koeficienty

5913,436

b

-524,175

Tabuka 1: Parametre regresnej priamky

Rovnica priamky má vseobecnú formu: Y=a+bX Úsek a a smernica b (parametre) regresnej priamky sa tiez nazývajú regresnými koeficientami. Úsek a (Incept) je hodnota Y, ak X = 0. V nasom prípade je rovná hodnote 5913.4. V grafe 4 je to úsek na osi ypsilon medzi nulou a bodom regresnej priamky. Smernica b (Slope) ukazuje do akej miery Y rastie, respektíve (napríklad v nasom prípade) klesá pri jednotkovej zmene X. Smernica priamky je v nasej úlohe rovná ­524.2. Záporné znamienko smernice poukazuje na nepriamu úmeru medzi premennými (,,cím viac, tým menej"). Kladné znamienko smernice vyjadruje priamu úmeru (,,cím viac, tým viac").

99

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 3.2. Súcinová korelácia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ K meraniu tesnosti lineárnej závislosti (sily lineárneho vzahu) medzi dvomi kvantitatívnymi premennými sa najcastejsie pouzíva (Pearsonov) súcinový korelacný koeficient r (Pearson Correlation). Nadobúda hodnoty z intervalu <-1, 1 >. Pearsonov koeficient súcinovej korelácie je symetrická miera - miera vzájomného vzahu a preto nezálezí na poradí premenných, ktoré do výpoctu vstupujú. Záporné hodnoty (negatívnu koreláciu) nadobúda pri nepriamej závislosti (s rastom hodnôt premennej X klesajú priemerné hodnoty premennej Y, pozri obraz D ). Kladné hodnoty (pozitívnu koreláciu) nadobúda pri priamej závislosti (s rastom hodnôt premennej X rastú i priemerné hodnoty premennej Y, pozri obraz C). Závislos je tým tesnejsia, cím viac sa koeficient korelácie blízi bu k -1, respektíve k +1. Krajné situácie predstavujú deterministický vzah (pozri obraz A a B). Cím viac sa koeficient korelácie blízi k nule, tým silnejsie odmieta prítomnos pozitívneho alebo negatívneho lineárneho vzahu. Za koeficientom korelácie blízkym nule alebo priam nulovým sa môze skrýva jedna z viacerých diametrálne odlisných situácií. Jedna moznos je, ze Y je (takmer) konstantou (pozri obraz F). Iná situácia, vzah medzi Y a X je neregulárny, chaotický (pozri obraz E). Za nulovou koreláciou sa môze skrýva celkom regulárny nelineárny vzah(!).

A

B

C

D

E 100

F

Pozitívne alebo negatívna korelácia este neznamená, ze ide o kauzálny vzah. V neexperimentálnych výskumoch je kauzálny výklad vemi nárocný. Vyzaduje speciálnu teoretickú a metodologickú konceptualizáciu. Druhá mocnina koeficientu korelácie - r² - sa nazýva koeficient determinácie (R Square). Jeho interpretácia je nasledovná: r²-krát 100 predstavuje percenta rozptylu (prípadne zmien) závisle premennej Y, ktoré môzeme vysvetli zvolenou lineárnou regresnou funkciou (priamkou), zvysok je mozné pripísa bu nelinearite závislosti, alebo vedajsím a náhodným ciniteom. Úloha 6 Vypocíta Pearsonov koeficient korelácie medzi príjmom na clena domácnosti a poctom jej clenov. Analyze Correlate Bivariate...

Cesta

Obraz 7: Dialógový box Bivariate Correlations

Vyberieme premenné poctom a h. Stlacíme OK. Výstup 6 V tabuke 2 sa nachádza Pearsonov koeficient korelácie ­ 0.383.

Pocet clenov d á i Pearson Correlation Pocet clenov domácnosti: Príjem na clena domácnosti:

Tabuka 2: Korelacná matica 101

1,000 -,383

Príjem na clena d á i Pearson Correlation

-,383 1,000

N

1030 727

N

727 727

Koeficient determinácie je rovný 0.147. Variabilita nezávisle premennej urcuje len 15% percent variability závisle premennej. Predikcný potenciál regresného modelu teda nie je veký. Dodatok Pokúsme sa teraz hada odpove na nasledujúcu otázku. Zistili sme, ze v celoslovenskom súbore platí tendencia, ze cím je väcsia domácnos, tým mensí je priemer príjmu na clena domácnosti. Preskúmajme túto otázku v jednotlivých vekostných skupinách obcí. Chceme vytvori bodové grafy a vypocíta koeficienty korelácie v týchto súboroch. Najprv si nastavíme funkciu ,,pílenia" celého súboru. Vstúpime do ponuky Data (predtým sme otvorili okno editora dát). Zavoláme si dialógový box Split File. V om najprv zapneme prepínac Organize output by groups . Vyberieme premennú katob a stlacíme OK. Od tejto chvíle kazdý príkaz sa opakovane realizuje na siedmych súboroch. Spusme postupne opä príkazy z úloh 1, 4 a 6 tejto subkapitoly. Výsledky upravíme do grafu 5. Vidíme v om, ako sa v jednotlivý súboroch reprodukuje vseobecná (celoslovenská) tendencia. Dajú sa z neho vycíta aj niektoré (aj ke nevýrazné) osobitosti súborov. Dodajme este technickú poznámku. Ak chceme zrusi ,,pílenie" súborov, v dialógovom boxe Split File zapneme prepínac Analyze all cases, do not create groups a stlacíme OK.

102

Menej ako 1 tisíc obyvateov

14000 12000 10000 8000

(r = - .395)

14000 12000 10000 8000

1 az 2 tisíc obyvateov (r = - .389)

Príjem na clena domácnosti:

6000 4000 2000 0 0 2 4 6 8 10

Príjem na clena domácnosti:

6000 4000 2000 0 0 2 4 6 8 10

Pocet clenov domácnosti:

Pocet clenov domácnosti:

2 az 5 tisíc obyvazeov

14000 12000 10000 8000

(r = - .334)

14000 12000 10000 8000

5 az 20 tisíc obyvateov

(r = - . 406)

Príjem na clena domácnosti:

6000 4000 2000 0 0 2 4 6 8 10

Príjem na clena domácnosti:

6000 4000 2000 0 0 2 4 6 8 10

Pocet clenov domácnosti:

Pocet clenov domácnosti:

20 az 50 tisíc obavateov

14000 12000 10000 8000

(r = - .440)

14000 12000 10000 8000

50 az 100 tisíc obyvateov

(r = - .238)

Príjem na clena domácnosti:

6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Príjem na clena domácnosti:

6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Pocet clenov domácnosti:

Pocet clenov domácnosti:

Bratislava, Kosice

14000 12000 10000 8000

(r = - .361)

Príjem na clena domácnosti:

6000 4000 2000 0 0 1 2 3 4 5 6 7 8 9 10

Pocet clenov domácnosti:

Graf 5: Bodové grafy závislosti príjmu od vekosti domácnosti v kategóriách obcí 103

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Opis súboru poda Kapitola IV

ordinálnej premennej

kojioôi

(jednorozmerná analýza poradových dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má dve subkapitoly: 4.1. triedenie poradových dát (nominálna vrstva informácií), 4.2. usporiadanie dát poda poradia (specificky ordinálna vrstva informácií).

]]]

1. Subkapitola riesi dva typy úloh: · · sumarizáciu poradových dát do tabuky (frekvencná tabuka), vizualizáciu tabuky pomocou grafického vyjadrenia jej obsahu (stpcové grafy a polygóny).

]

2. Subkapitola má dve casti: · · statistické poradové charakteristiky (percentily), vizualizácia statistických poradových charakteristík (krabickové grafy).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s nasledujúcimi

poradovými premennými: názor na spolocné bývanie viacerých rodín v jednej domácnosti (spolbyv), · názor na vekovú hranicu odchodu do dôchodku (odchdoch), · hodnotenie súcasnej financnej situácie domácnosti (finsit). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

104

·

Kapitola je vymedzená predmetom deskripcie. Tým je jedna premenná v jednom súbore. Premenná je poradová. Obsah a postupnos nastolovaných problémov je urcená dvomi gnozeologickými dimenziami poradovej premennej. Sú to : nominálny rozmer poradových dát ­ triedenie (klasifikácia) dát, specificky ordinálny rozmer poradových dát - usporiadanie dát poda poradia.

]]]

105

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.1. Triedenie ordinálnych dát

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Zisti pocetnos (Count, Frequency) hodnôt ordinálnej premennej, jej rozdelenie pocetností (Frequency Distribution) a modus (Mode) ­ to sú úlohy, ktoré sme sa v prípade kvantitatívnej premennej riesili (pozri subkapitolu 1.1. v II. casti). V mnohom sú podobné rieseniam, ktoré prezentujeme v tejto subkapitole a preto sa na ne budeme casto odvoláva. Skladba podkapitoly Podkapitola má dve casti: · · sumarizácia poradových dát do tabuky (Frekvencná tabuka...), vizualizácia tabuky pomocou grafického vyjadrenia jej obsahu (Grafy...).

Predtým nez zacneme tieto úlohy riesi, z pôvodných premenných s kvazi ordinálnymi skálami vytvoríme (riadne) ordinálne premenné. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Modifikácia premenných Chceme premenné s kvazi ordinálnymi skálami upravi na premenné, ktorých skála je (striktne) ordinálna. Na základe ,,starých" premenných spolbyv, odchdoch a finsit vytvoríme nové premenné, pricom vo vsetkých troch premenných sa zbavíme dát s kódom 9 (9=SYSMIS) a u premennej spolbyv aj dát s kódom 6 (6=SYSMIS). Pouzijeme pritom známy príkaz RECODE. Syntaxový spôsob príkazov je nasledovný:

RECODE spolbyv (1=1)(2=2)(3=3)(4=4)(5=5) (6=SYSMIS) (9=SYSMIS) INTO rspolbyv . RECODE odchdoch (1=1)(2=2)(3=3)(4=4)(9=SYSMIS) INTO roddoch . RECODE finsit (1=1)(2=2)(3=3)(4=4)(5=5)(6=6)(9=SYSMIS) INTO rfinsit .

Nové hodnoty nových premenných si ziadajú nové oznacenie - value label. Môzeme pouzi nasledovný syntaxový príkaz: value label rspolbyv

1 2 3 4 5 "je jednoznacne výhodné" "prinása isté problémy" "prinása dos problémov" "prinása vea problémov" "je jednoznacne nevýhodné" "úplne súhlasím" "skôr súhlasím" "skôr nesúhlasím" 106

/roddoch

1 2 3

4 /rfinsit 1 2 3 4 5 6

"vôbec nesúhlasím" "príjmy stacia na vsetko" "príjmy stacia na vsetko, ale hospodárime úsporne" "musíme vea setri, aby sme si mohli kúpi drahsie veci" "máme dos peazí len na nákup najlacnejsích vecí" "peniaze stacia len na základné potraviny" "nemáme dos peazí ani na nákup základných potravín".

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Frekvencná tabuka...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 1

Vypocíta frekvencnú tabuku poradových premenných: názor na spolocné bývanie viacerých rodín v jednej domácnosti (rspolbyv), názor na vekovú hranicu odchodu do dôchodku (roddoch) a hodnotenie súcasnej financnej situácie domácnosti (rfinsit). V riesení úlohy pouzijeme príkaz Frequencies. Analyze Descriptive Statistics Frequencies... V ponúknutom zozname dialógového boxu Frequencies vysvietime tri poradové premenné rspolbyv, roddoch a rfinsit. Stlacíme tlacidlo uprostred dialógového boxu, cím presunieme urcené premenné do prázdneho rámceka vpravo. Stlacíme tlacidlo OK.

Cesta

Výstup 1

Vo výstupnom okne sa zobrazia tri frekvencné tabuky (tabuka 1 az tabuka 3).

Spolocné bývanie viacerých rodín v jednej domácnosti:

Valid Cumulative Frequency Percent Percent Percent Valid je jednoznacne výhodné prinása isté problémy prinása dos problémov prinása vea problémov je jednoznacne nevýhodné Total Missing Total System

46 160 247 290 263 1006 24 1030 4,5 15,5 24,0 28,2 25,5 97,7 2,3 100,0 4,6 15,9 24,6 28,8 26,1 100,0 4,6 20,5 45,0 73,9 100,0

Tabuka 1: Triedenie poda názoru respondentov na spolocné bývanie viacerých rodín v jednej domácností (frekvencná tabuka)

107

Vekovú hranicu odchodu do dôchodku treba zvýsi:

Frequency Percent Valid úplne súhlasím skôr súhlasím skôr nesúhlasím vôbec nesúhlasím Total Missing Total System

29 70 210 688 997 33 1030 2,8 6,8 20,4 66,8 96,8 3,2 100,0

Valid Cumulative Percent Percent

2,9 7,0 21,1 69,0 100,0 2,9 9,9 31,0 100,0

Tabuka 2: Triedenie respondentov poda názoru na vekovú hranicu odchodu do dôchodku

Súcasná financná situácia Vasej domácnosti:

Frequency Valid príjmy stacia na vsetko príjmy stacia na vsetko, ale hospodárime úsporne musíme vea setri, aby sme si mohli kúpi drahsie veci máme dos peazí len na nákup najlacnejsích vecí peniaze stacia len na základné potraviny nemáme dos peazí ani na nákup základných potravín Total Missing System Total

27 246 306

Percent

2,6 23,9 29,7

Valid Percent

2,7 24,6 30,7

Cumulative Percent

2,7 27,4 58,0

158 219 42 998 32 1030

15,3 21,3 4,1 96,9 3,1 100,0

15,8 21,9 4,2 100,0

73,8 95,8 100,0

Tabuka 3: Triedenie hodnotenia súcasnej financnej situácie domácnosti

Pripomeme si, ze varianty nasich premenných nie sú kvantitatívne hodnoty, ale kategórie z poradovej skály. Kategórie odpovedí predstavujú stupne poradovej skály. Ostatné pojmy obsiahnuté vo frekvencných tabukách 1 az 3 fungujú rovnako ako v subkapitole 1.1. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Grafy...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Pripomeme si, ze este stále pozeráme na poradové dáta cez optiku klasifikácie (ich triedenia). Základným produktom triedenia je frekvencná tabuka. Iná mozná forma prezentácia je vizuálna, kedy je obsah frekvencnej tabuky transformovaný do grafu. Mozností je viac

108

Základné typy grafov

a statistické systémy ich ponúkajú. Pre poradové premenné medzi najvhodnejsie povazujeme nasledujúce dva typy: stpcový graf (Bar Chart), polygón (Polygon),

Úloha 2

Vytvori stpcový graf (Bar Chart) distribúcie premennej názory na spolocné bývanie viacerých rodín v jednej domácnosti (rspolbyv). V riesení úlohy pouzijeme príkaz Bar Charts. Graphs Bar... Nastavenie dialógového boxu Bar Charts ponecháme v ponúknutom standardnom tvare: typ stpcového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define. V dialógovom subboxe Summaries for Groups of Cases, do rámceka s názvom os kategórií (Category Axis:) presunieme premennú rspolbyv. V rubrike Bars Represent zapneme tlacidlo % of cases. Specifikujeme tým vertikálnu os. Stpce grafu budú vyjadrova percentuálny výskyt kategórií. Stlacíme tlacidlo Options.... Chceme vylúci z grafu kategórie chýbajúcich hodnôt. V dialógovom subboxe Options preto vypneme stvorcek Display groups defined by missing values. Stlacíme tlacidlo Continue. A následne stlacíme OK.

Cesta

Výstup 2

Vytvorili sme stpcový graf 1, ktorý prezentuje distribúciu premennej pocet clenov domácnosti.

Percenta

40 35 30 25 20 15 10 5 0

je é dn ho vý n. oz dn je ap ás in pr ém bl ro y ad ás in pr os l. ob pr ás in pr av . bl ro ap e je h. vý ne n. oz dn je

Spolocné bývanie viacerých rodín v jednej domácnosti:

Graf 1: Distribúcia názorov na spolocné bývanie viacerých rodín v jednej domácnosti (stpcový graf)

109

Úloha 3

Vytvori polygón (Polygon) distribúcie premennej názory na spolocné bývanie viacerých rodín v jednej domácnosti (rspolbyv).V riesení úlohy pouzijeme príkaz Line Charts. Graphs Line... Nastavenie v dialógovom boxe Line Charts ponecháme v ponúknutom standardnom tvare: typ polygónu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Slacíme Define. V subboxe Summaries for gruops of Cases, do rámceka s názvom os kategórií (Category Axis:) presunieme premennú rspolbyv. V rubrike Line Represents zapneme tlacidlo % of cases. Specifikujeme tým vertikálnu os. Úsecky polygónu budú spája body, ktoré vyjadrujú percentuálny výskyt kategórií. Stlacíme tlacidlo Options.... Chceme vylúci z polygónu varianty chýbajúcich hodnôt, preto v dialógovom subboxe Options vypneme stvorcek Display groups defined by missing values. Stlacíme tlacidlo Continue. A následne stlacíme OK.

Cesta

Výstup 3

Vytvorili sme polygón (graf 2), ktorý zobrazuje distribúciu premennej názory na spolocné bývanie viacerých rodín v jednej domácnosti.

Percenta

40 35 30 25 20 15 10 5 0 je jednoz. výhodné prinása problémy prinása dos probl. prinása vea probl. je jednoz. nevýh.

Spolocné bývanie viacerých rodín v jednej domácnosti:

Graf 2: Distribúcia názorov na spolocné bývanie viacerých rodín v jednej domácnosti (polygón)

Graf 2 obsahuje idealizované zobrazenie horizontálnej skály, skály poradovej. Je zobrazená tak, akoby vzdialenosti medzi stupami boli rovnaké. To vsak platí len pre kvantitatívne skály. Táto skutocnos ovplyvuje vnímanie tvaru polygónu. To je slabá stránka polygónu, ktorý zobrazuje distribúciu poradovej premennej.

110

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 4.2. Usporiadanie dát poda poradia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

V II. casti, v subkapitole 1.2. sme nastolili a riesili otázky spracovania kvantitatívnych dát v rámci mozností, ktoré poskytuje ich ordinálny rozmer. Rovnaké úlohy môzeme nastoli aj v prípade premenných, ktorých hodnoty sú z poradovej skály. Pri ich riesení sa budeme vraca a cerpa zo spomínanej subkapitoly, pretoze riesenia sa v mnohom prekrývajú. Skladba subkapitoly Subkapitola má dve casti: 1. statistické poradové charakteristiky (Percentily...) 2. vizualizácia statistických poradových charakteristík (Grafy...). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Percentily...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 4

Vytvori tabuku statistických charakteristík - percentilov premenných: názor na spolocné bývanie viacerých rodín v jednej domácnosti (rspolbyv), názor na vekovú hranicu odchodu do dôchodku (roddoch) a hodnotenie súcasnej financnej situácie domácnosti (rfinsit). V riesení úlohy pouzijeme príkaz Frequencies. Analyze Descriptive Statistics Frequencies... V zozname premenných dialógového boxu Frequencies vysvietime rspolbyv, roddoch a rfinsit. Presunieme ich do rámceka Variable(s): a stlacíme OK. V dialógovom subboxe Statistics, v rubrika Percentile Values zvolíme kvartily (Quartiles), decily (Cut points 10 equql groups), piaty a devädesiaty piaty percentil (P5 and P95 ), v rubrike Central tendency si môzeme zapnú modus (Mode) a v rubrike Dispersion ukazovatele Minimum a Maximum. Stlacíme tlacidlo Continue. V dialógovom boxe Frequencies, do ktorého sme sa vrátili, vypneme prepínac Display frequency tables (nemáme v tejto chvíli záujem o výpocet frekvencnej tabuky).

Cesta

Výstup 4

Vo výstupnom okne sa zobrazí tabuka 4 a v nej tie statistické poradové charakteristiky, ktoré sme si zadali.

111

Statistics

Spolocné bývanie viacerých rodín v jednej domácnosti: N Mode Minimum Maximum Percentiles 5 10 20 25 30 40 50 60 70 75 80 90 95 Valid Missing

1006 24 4 1 5 2,00 2,00 2,00 3,00 3,00 3,00 4,00 4,00 4,00 5,00 5,00 5,00 5,00

Vekovú hranicu odchodu do dôchodku treba zvýsi:

997 33 4 1 4 2,00 2,80 3,00 3,00 3,00 4,00 4,00 4,00 4,00 4,00 4,00 4,00 4,00

Súcasná financná situácia Vasej domácnosti:

998 32 3 1 6 2,00 2,00 2,00 2,00 3,00 3,00 3,00 4,00 4,00 5,00 5,00 5,00 5,00

Tabuka 4: Statistické charakteristiky poradových premenných

Tabuku 4 interpretujeme ako v subkapitole 1.2. Rozdiel je v tom, ze tu pracujeme so stupnicou poradovej skály, tam s hodnotami kvantitatívnej skály. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Grafy...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 5

Vytvori krabickový graf poradovej premennej názor na súcasnú financnú situáciu domácnosti pomocou standardnej procedúry ­ príkazom Boxplot . Z technických dôvodov bude potrebné najprv príkazom Compute (pozri 3. kapitolu v 3. casti) zadefinova pomocnú premennú, napríklad s názvom konst tak, aby mala pre vsetky jednotky (prípady) hodnotu rovnú napríklad 1. (Syntaxová forma tohto príkazu je: compute konst =1.)

112

Cesta

Graphs Boxplot... Nastavenie dialógového boxu Boxplot ponecháme v ponúknutom standardnom tvare: typ krabickového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define. V dialógogvom subboxe Summaries for Groups of Cases premennú rfinsit presunieme do rámceka Variable: a premennú konst z technických dôvodov presunieme do rámceka Category Axis:. Stlacíme tlacidlo OK.

Výstup 5

Výstupom je krabickový graf 3.

7

6

Súcasná financná situácia Vasej domácnosti

5

4

3

2

1

0

Graf 3: Krabickový graf (vertikálny) premennej: názor na súcasnú financnú situáciu domácnosti

Úloha 6

Vytvori kumulatívny histogram (Cumulative Histogram) premennej názor na súcasnú financnú situáciu domácnosti (rfinsit). V riesení úlohy pouzijeme príkaz Bar. Graphs Bar ... Nastavenie dialógového boxu Bar Charts ponecháme v ponúknutom standardnom tvare: typ stpcového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

Cesta

113

Do rámceka s názvom os kategórií (Category Axis:) presunieme premennú rfinsit. V rubrike Bars Represent zapneme prepínac Cum.% of cases, chceme totiz na vertikále znázorni kumulatívne percenta. Stlacíme tlacidlo Options.... Chceme vylúci z grafu kategórie chýbajúcich hodnôt, preto vypneme v dialógovom subboxe Options stvorcek Display groups defined by missing values. Stlacíme tlacidlo Continue. A následne stlacíme OK. Výstup 6 Vo výstupnom okne sa zobrazí kumulatívny histogram (graf 4) premennej názor na súcasnú financnú situáciu domácnosti.

100

80

Kumulatívne percenta

60

40

20

0 1 2 3 4 5 6

Súcasná financná situácia Vasej domácnosti:

Graf 4: Kumulatívny graf premennej: názor na súcasnú financnú

situáciu domácnosti Kumulatívny histogram aj tu, podobne ako polygón v úlohe 3 v subkapitole 4.1. homogenizuje vzdialenos medzi stupami. To je slabá stránka grafu 4.

114

115

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Komparácia súborov poda Kapitola V

ordinálnej premennej

kojioôi

(komparatívna analýza poradových dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má styri subkapitoly: 5.1. komparácia distribúcií, 5.2. komparácia súborov poda percentilov, 5.3. komparácia súborov so zreteom na idealizované vzdialenosti medzi dátami, 5.4. komparácia súborov pomocou sociálnych indexov.

]]]

1. subkapitola má dve casti: · numerická komparácia (tabuka triedenia druhého stupa), · vizuálna komparácia (polygóny).

]

2. subkapitola má dve casti: · numerická komparácia percentilov - tabuka percentilov poda jednotlivých súborov, · vizuálna komparácia percentilov ­ krabickové grafy.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách budeme pracova s dvomi typmi premenných:

1. poradové premenné, ktorými budeme porovnáva súbory: · financná situácia domácnosti (rfinsit), · názor na vekovú hranicu odchodu do dôchodku (roddoch), · názor na spolocné bývanie rodín (rspolbyv). 2. premenné, ktoré budú vymedzova súbory: · vekové kategórie respondentov (r1vek), · pocet clenov domácnosti (pocet), · pohlavie (pohl) · hlavné typy domácností (ot6mult). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

116

Stojíme pred úlohou porovna viacero súborov z hadiska jednej premennej. Uz sme vykonali univariacnú analýzu poradových premenných. Úlohy komparácie súborov poda poradovej premennej budú zalozené na pojmoch, ktoré sme si ozrejmili v predchádzajúcej kapitole. V kazdej úlohe budú vystupova dve premenné: jedna premenná vymedzuje súbory, ktoré chceme komparova a druhá premenná, ktorou chceme komparova súbory. Vo výklade budeme respektova uz známu logiku dvoch gnozeologických dimenzií poradovej premennej. K výkladu pridáme este jeden komparacný postup: najprv vykonáme jeden idealizacný krok a po om skonstruujeme index, s ktorým budeme pracova ,,ako" s kvantitatívnou premennou.

]]]

117

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­5.1. Komparácia distribúcií

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Subkapitola má dve casti: · · numerická komparácia (tabuka triedenia druhého stupa), vizuálna komparácia (polygóny).

Skladba subkapitoly

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia distribúcií ... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 1 Vytvori komparacnú tabuku ­ vykona triedenie druhého stupa. V riadkoch budú jednotlivé súbory vymedzené ako hlavné typy domácností (ot6mult) a v stpcoch poradová premenná: názor na vekovú hranicu odchodu do dôchodku (roddoch). V bunkách nech sú pocetnosti a riadkové percenta (keze chceme porovnáva skladbu riadkov). Úlohu budeme riesi príkazom Crosstabs. Analyze Descriptive Statistics Crosstabs... V dialógovom boxe Crosstabs do rámceka Row(s): presunieme premennú roddoch a do rámceka Column(s): presunieme premennú ot6mult. Stlacíme tlacidlo Cells... . V dialógovom subboxe Cells v rámceku Counts ponecháme zapnutý prepínac s názvom Observed (zaujímajú nás empirické, pozorované pocetnosti). V rámceku Percentages zapneme prepínac Row (chceme vypocíta riadkové percenta, cize kazdý hlavný typ domácnosti tvorí celok a percentuálny základ). Stlacíme Continue a potom tlacidlo OK. Výstup 1 Výstupom je tabuka triedenia druhého stupa (tabuka 1). V riadkoch tabuky sú jednotlivé súbory (hlavné typy domácností). Kladieme si, napríklad otázku: aký je v jednotlivých súboroch podiel udí, ktorí vôbec nesúhlasia s tvrdením, ze ,,vekovú hranicu odchodu do dôchodku treba zvýsi". Vyssí podiel vykazujú typy domácností, v ktorých je prítomní v urcitej konstelácii vyssí vek. Cistejsie to odzrkaduje tabuka 2, v ktorej je zretene vidie, ze na najcastejsí nesúhlas so spomínaným tvrdením narazíme u udí v preddôchodkovom veku. U tých, ktorých sa to najviac týka.

Cesta

118

Vekovú hranicu odchodu do dôchodku treba zvýsi: úplne skôr skôr vôbec súhlasím súhlasím nesúhlasím nesúhlasím Hlavné typy mladá domácnos domácností: bezná domácnos dospelá domácnos trojgeneracná domácnos starsia domácnos starí udia Total

2 1,9% 10 4,3% 6 2,3% 2 1,9% 1 1,1% 4 2,6% 25 2,6% 9 8,7% 19 8,2% 22 8,3% 6 5,8% 6 6,5% 7 4,5% 69 7,3% 29 28,2% 50 21,6% 55 20,8% 14 13,5% 18 19,6% 32 20,8% 198 20,9% 63 61,2% 152 65,8% 181 68,6% 82 78,8% 67 72,8% 111 72,1% 656 69,2%

Total

103 100,0% 231 100,0% 264 100,0% 104 100,0% 92 100,0% 154 100,0% 948 100,0%

Tabuka 1: Distribúcie názoru na vekovú hranicu odchodu do dôchodku poda hlavných typov domácností

Vekovú hranicu odchodu do dôchodku treba zvýsi: úplne súhlasím Kategórie veku 18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

4 2,7% 9 4,0% 6 2,9% 5 3,2% 3 2,1% 2 1,7% 29 2,9%

skôr súhlasím

17 11,3% 17 7,6% 16 7,8% 9 5,8% 4 2,8% 7 5,9% 70 7,0%

skôr nesúhlasím

43 28,7% 53 23,7% 44 21,5% 17 11,0% 27 18,6% 26 21,8% 210 21,1%

vôbec nesúhlasím

86 57,3% 145 64,7% 139 67,8% 123 79,9% 111 76,6% 84 70,6% 688 69,0%

Total

150 100,0% 224 100,0% 205 100,0% 154 100,0% 145 100,0% 119 100,0% 997 100,0%

Tabuka 2: Distribúcie názoru na vekovú hranicu odchodu do dôchodku poda vekových kategórií

119

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Grafická (vizuálna) komparácia... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Vytvori polygóny názorov na vekovú hranicu odchodu do dôchodku (roddoch) pre súbor muzov a pre súbor zien (pohl) v jednom grafe. Úlohu budeme riesi príkazom Line. Graphs Line... V dialógovom boxe Line Charts zapneme druhý typ grafu ­ Multiple. V rámceku Data in Chart Are nebudeme robi ziadne zmeny. Stlacíme tlacidlo Define. V dialógovom subboxe Summaries for Groups of Cases do rámceka Category Axis: presunieme premennú, poda ktorej budeme tvori polygóny ­ roddoch. Do rámceka Define Lines by: presunieme premennú pohl ­ pre kazdú kategóriu tejto premennej vytvoríme polygón. V rámceku Lines Represent zapneme prepínac % of cases, dosiahneme tým, ze vertikálna os bude zobrazova percenta. Stlacíme tlacidlo Options... . Ak premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma polygón tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná pohl nemá chýbajúce hodnoty.) Výstup 2 Vytvorili sme polygóny názorov na vekovú hranicu odchodu do dôchodku poda pohlavia (graf 1). Distribúcie názorov muzov a zien sú vemi podobné. O limitoch polygónov distribúcií poradových premenných sme hovorili v subkapitole 4.1.

Úloha 2

Cesta

120

Percenta

80 70 60 50 40 30 20 10 0

Pohlavie:

muz zena skôr súhlasím skôr nesúhlasím vôbec nesúhlasím

úplne súhlasím

Vekovú hranicu odchodu do dôchodku treba zvýsi:

Graf 1: Polygóny názorov na vekovú hranicu odchodu do dôchodku poda pohlavia

121

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­5.2. Komparácia súborov poda percentilov

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Skladba subkapitoly

Subkapitola má dve casti: · · numerická komparácia percentilov (tabuka percentilov poda jednotlivých súborov), vizuálna komparácia percentilov (komparatívny krabickový graf).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia percentilov... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 3 Vytvori tabuku percentilov poradovej premennej: súcasná financná situácia Vasej domácnosti (rfinsit) poda poctu clenov domácnosti (pocet). Úlohu budeme riesi príkazom Explore. Analyze Descriptive Statistics Explore... V dialógovom boxe Explore do rámceka Dependent List: presunieme premennú, pre ktorú budeme pocíta percentily, cize premennú rfinsit. Do rámceka Factor List: presunieme premennú, ktorá definuje súbory ­ pocet. V rámceku Display zapneme prepínac Statistics (chceme pocíta statistické charakteristiky). Stlacíme tlacidlo Statistics... . V dialógovom subboxe Statistics zapneme iba polozku Percentiles. Stlacíme Continue a následne stlacíme tlacidlo OK. Výstup 3 Vytvorili sme tabuku percentilov poradovej premennej: názor na súcasnú financnú situáciu domácnosti podmienený poctom clenov domácnosti (tabuka 3). Ako pouzijeme takúto tabuku? V stpcoch sú súbory, ktoré chceme porovnáva. V prvom riadku je piaty percentil. Vidíme v om jednu jednotku a styri dvojky. Jednotka znamená odpove, ze príjmy v rodine stacia na vsetko. V jednoclennej domácnosti (v prvom súbore) sa nachádza prinajmensom pä percent takých, ktorým príjmy stacia na vsetko. V ostatných súboroch je piaty percentil dvojka, to znamená, ze u nich pä percent (subjektívne) najsituovanejsích nevycerpáva prvý variant z odpovedí a niektorí z nich dodali dovetok ,,ale hospodárime úsporne". Podobne môzeme komparova alsie percentily. Kvartily bude vhodné porovnáva aj s pomocou krabickových grafov (pozri graf 2).

Cesta

122

Súcasná financná situácia Vasej domácnosti: Pocet clenov domácnosti: Percentiles 5 10 25 50 75 90 95 jeden

1,00 2,00 3,00 4,00 5,00 5,00 6,00

dvaja

2,00 2,00 3,00 4,00 5,00 5,00 6,00

traja

2,00 2,00 2,00 3,00 4,00 5,00 5,00

styria

2,00 2,00 2,00 3,00 4,00 5,00 5,00

pä a viac

2,00 2,00 2,00 3,00 5,00 5,00 5,25

Tabuka 3: Percentily premennej: názor na súcasnú financnú situáciu domácnosti poda poctu clenov domácnosti

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Grafická (vizuálna) komparácia percentilov...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 4

Vytvori krabickové grafy poradovej premennej: súcasná financná situácia Vasej domácnosti (rfinsit) poda poctu clenov domácnosti (pocet). Úlohu budeme riesi príkazom Boxplot. Graphs Boxplot... Nastavenie dialógového boxu Boxplot ponecháme v ponúknutom standardnom tvare: typ krabickového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define. V dialógovom subboxe Summaries for Groups of Cases do vstupného poa Variable: presunieme premennú rfinsit. Budeme vytvára krabickové grafy tejto premennej. Do vstupného poa Category Axis: presunieme premennú pocet ­ ona definuje súbory. Stlacíme tlacidlo Options... . Uz sme upozorovali na situáciu: ak premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma graf tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná pocet nemá chýbajúce hodnoty.)

Cesta

Výstup 4

Vytvorili sme krabickové grafy poradovej premennej: názor na súcasnú financnú situáciu domácnosti podmienený poctom clenov domácnosti (graf 2). Krabickové grafy nám odhaujú podobnos prvého s druhým súborom, tretieho so stvrtým a osobitos piateho súboru.

123

7

Súcasná financná situácia Vasej domácnosti

6

5

4

3

2

1 0 jeden dvaja traja styria pä a viac

Pocet clenov domácnosti

Graf 2: Krabickové grafy poradovej premennej: názor na súcasnú financnú situáciu domácnosti poda poctu clenov domácnosti

124

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 5.3. Komparácia súborov so zreteom na idealizované vzdialenosti medzi dátami

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Fiktívny príklad - pokracovanie

V II. casti, v subkapitole 1.2. sme uviedli fiktívny príklad. Teraz na nadviazeme. Máme k dispozícii výsledky testov z anglictiny zo sedemclenného krúzku: 43, 43, 50, 78, 78, 78, 79. Chceme kazdému studentovi priradi poradové císlo (od najúspesnejsieho k najmenej úspesnému). Poradové císlo 1 bez azkostí môzeme priradi studentovi s poctom bodov 79. Druhý az stvrtý student majú rovnaký pocet bodov. Ako priradi poradové císla týmto studentom? Jedna z mozností (v statistike najpouzívanejsia) je da kazdému z nich rovnaké poradové císlo, ktoré je priemerom císel 2, 3 a 4, cize 3. Student s bodovým ziskom 50 bude ma poradové císlo 5. Siesty a siedmy student majú opä rovnaký pocet bodov, metódou spriemerovania dostanú obidvaja rovnaké poradové císlo 6.5. Táto krátka úvaha nám poslúzi pri riesení úloh tejto subkapitoly. Poradová premenná názor na súcasnú financnú situáciu domácnosti (rfinsit) nadobúda hodnoty zo sesstupovej skály (1,2,...,6). 998 respondentov vyslovilo pomocou tejto stupnice svoj názor. Hoci skála nie je kardinálna, robí sa ­ pokia je to prijatené ­ idealizácia rovnakej vzdialenosti medzi stupami poradovej skály. Otázka prijatenosti tejto idealizácie je citlivá a preto ju výskumník musí starostlivo analyzova a jej dôsledky v alsej interpretácii dát zohadova. Ak budeme povazova túto idealizáciu za produktívnu aj v prípade analýzy premennej rfinsit, potom môzeme formulova nasledujúcu úlohu: pomocou príkazu Rank Cases vytvorme novú premennú, ktorá bude predstavova poradové císla respondentov z hadiska premennej rfinsit, pricom poradie zacneme tvori od respondentov z najnizsím hodnotením situácie, cize hodnotou 6 (na pouzitej poradovej skále v dotazníku). Oprime sa o skúsenosti zo spomínaného fiktívneho príkladu z II. casti, subkapitoly 1.2. Transform Rank Cases... Pozrime sa opä na obraz 14 v subkapitole 1.2. (II. cas). V dialógovom boxe Rank Cases presunieme premennú rfinsit do rubriky Variable(s): . V rámceku Assign Rank 1 to zapneme prepínac Largest value (poradové císlo 1 chceme udeli najvyssej hodnote). Stlacíme OK.

Úloha 5

Cesta

Výstup 5

Vo výstupnom okne dostaneme informáciu o mene a oznacení novej premennej. Nová premenná, ktorej hodnoty sú poradové císla prípadov nesie meno rrfinsit a oznacenie Rank of rfinsit:

125

From variable -------RFINSIT

New variable -------RRFINSIT

Label ----RANK of RFINSIT

V editore dát sa vytvorí nový stpec s názvom rrfinsit a v om sa zobrazia ku kazdej bodovej hodnote poradové císla. Lepsí prehad získame z frekvencnej tabuky 4 .

RANK of RFINSIT

Frequency Valid 21,5 152,0 340,5 572,5 848,5 985,0 Total Missing Total System

42 219 158 306 246 27 998 32 1030

Percent

4,1 21,3 15,3 29,7 23,9 2,6 96,9 3,1 100,0

Valid Percent

4,2 21,9 15,8 30,7 24,6 2,7 100,0

Cumulative Percent

4,2 26,2 42,0 72,6 97,3 100,0

Tabuka 4: Triedenie poda poradových císel odvodených z premennej názor na súcasnú financnú situáciu v domácnosti

Z tabuky napríklad plynie: tí, ktorí odpovedali v rozhovore, ze nemajú dos peazí ani na nákup základných potravín ­ bolo ich 42 ­ kazdý z nich dostal poradové císlo 21.5. Tí, ktorých príjmy stacia na vsetko ­ bolo ich vo výskume 27 ­ dostali poradové císlo 985,0. Táto úloha sama osebe nemá este ten pravý význam. Poradové císla efektívne vyuzijeme v nasledujúcej úlohe. Úloha 6 Vytvori tabuku priemerov poradových císel respondentov získaných poda hodnotenia financnej situácie domácnosti osobitne pre kazdú vekovú kategóriu. Úlohu budeme riesi príkazom Means. Analyze Compare Means Means... V dialógovom boxe Means do rámceka Dependent List: presunieme rrfinsitocdom. Pre u budeme pocíta priemery. Do rámceka Independent List: presunieme premennú, ktorá definuje súbory ­ r1vek. Stlacíme tlacidlo Options... . V dialógovom subboxe Options z rámceka Statistics: vyberieme charakteristiku Mean a Number of Cases. Stlacíme Continuum a následne OK.

126

Cesta

Výstup 6

Vypocítali sme priemery poradových císel respondentov získaných poda hodnotenia financnej situácie domácnosti osobitne pre kazdú vekovú kategóriu (tabuka 5).

Report

RANK of RFINSIT Kategórie veku

Mean

596,720 530,370 504,716 506,562 436,938 378,959 499,500

N

150 227 201 153 146 121 998

18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

Tabuka 5: Priemery poradí respondentov získaných poda hodnotenia financnej situácie domácnosti osobitne pre kazdú vekovú kategóriu

Nízke poradie, nízke hodnotenie financnej situácie. Tak sme konstruovali poradia. Platí to aj pre priemerné poradia. Kategória najmladsích respondentov hodnotí súcasný financný stav rodiny najpozitívnejsie, naopak, najstarsia generácia najnegatívnejsie.

127

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 5.4. Komparácia súborov pomocou sociálnych indexov

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Vo výskumnej praxi sú casto vemi produktívne kvantitatívne charakteristiky poradových premenných, ktoré nazývame (sociálnymi) indexami. Kvantitatívne charakteristiky poradových premenných, to ako sme mohli v predchádzajúcich úlohách vidie ­ neznie vôbec paradoxne. V nasledujúcich úlohách sa vsak cosi paradoxné udeje. Z ordinálnych dát ,,vyrobíme" dáta, s ktorými budeme narába ,,ako" s kvantitatívnymi. Opä sa tu stretneme s procesom idealizácie vzdialeností medzi stupami poradovej skály. To je cinite, ktorý limituje zmysel a opodstatnenos konstrukcie nasich indexov. Nie je tu miesto na rozsiahlejsie teoretizovanie, preto sa sústredíme na dve úlohy, ktoré nám problematiku priblízia. Úloha 7 Uz sme komparovali súbory (napríklad , vymedzené vekom respondentov) poda hodnotenia financnej situácie domácnosti. Ukázeme si nový spôsob riesenia tejto úlohy, pomocou indexu. V prvom kroku vytvoríme specifickým spôsobom novú premennú ind_fs odvodenú od uz viackrát analyzovanej ordinálnej premennej rfinsit (ak chceme pouzi dialógové boxy, odporúcame vráti sa a pouci sa z úlohy 7 v subkapitole 1.1.). V syntaxovej forme je príkaz nasledovný:

RECODE rfinsit (1=100)(2=80)(3=60)(4=40)(5=20)(6=0) INTO ind_fs.

Riesenie

Cieom tejto transformácie je, aby sa priemer novej premennej ­ ,,prestrojený" index - pohyboval v intervale < 0, 100 >. Pricom (teoreticky vzaté) nulovú hodnotu by nadobudol, ak by vsetci príslusníci súboru odpovedali: ,,nemáme dos peazí ani na nákup základných potravín". Maximálnu hodnotu - 100 ­ by index nadobudol, ak by vsetci príslusníci súboru odpovedali, ze im ,,príjmy stacia na vsetko". V druhom kroku pouzijeme známy príkaz MEANS (aplikácie sa nachádzajú v úlohe 6, subkapitola 2.3.). V dialógovom boxe Means do rámceka Dependent List: presunieme novú premennú ind_fs . Pre u budeme pocíta priemer. Do rámceka Independent List: presunieme premennú, ktorá definuje súbory ­ r1vek. Výstup 7 Výsledky v tabuke 6 umozujú takmer rovnakú interpretáciu násho problému ako tabuka 5 v subkapitole 5.3.

128

IND_FS Kategórie veku

Index

60,0 54,2 52,4 52,2 45,8 40,8 51,5

N

150 227 201 153 146 121 998

18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

Tabuka 6: Indexy hodnotenia súcasnej financnej situácie domácnosti respondenta poda vekových kategórií

Úloha 8

Táto úloha vychádza tiez z poradovej premennej, avsak jej skála je bipolárna. Rec bude o premennej, ktorá zachytáva názor na spolocné bývanie viacerých rodín v jednej domácnosti (spolbyv). Z nej vytvoríme index. Pomocou neho budeme opä porovnáva vekové skupiny. V prvom kroku vytvoríme specifickým spôsobom novú premennú ind_sb, odvodenú od ordinálnej premennej spolbyv. Mohli by sme pouzi dialógové boxy. V syntaxovej forme je príkaz nasledovný:

RECODE spolbyv (1=100)(2=50)(3=0)(4=-50)(5=-100)(else=sysmis) INTO ind_sb.

Riesenie

Cieom tejto transformácie je, aby sa priemer novej premennej ­ index hodnotenia spolocného bývania - pohyboval v intervale < -100, 100 >. Pricom (teoreticky vzaté) hodnotu -100 by index nadobudol, ak by vsetci príslusníci súboru odpovedali: ,,spolocné bývanie je jednoznacne nevýhodné, prinása vsetkým len problémy". Maximálnu hodnotu - 100 ­ by index nadobudol, ak by vsetci príslusníci súboru odpovedali, ze spolocné bývanie ,,je jednoznacne výhodné, prinása pre vsetkých len výhody". Nulová hodnota indexu vyjadruje ambivalentný stav súboru, alebo ambivalentné odpovede vsetkých príslusníkov súboru. V druhom kroku pouzijeme známy príkaz MEANS. V dialógovom boxe Means do rámceka Dependent List: presunieme novú premennú ind_sb . Pre u budeme pocíta priemer. Do rámceka Independent List: presunieme premennú, ktorá definuje súbory ­ r1vek. Výstup 8 Výsledky v tabuke 7 hovoria o tom, ze vsetky vekové kategórie hodnotia spolocné bývanie ako nevýhodné. Lísia sa mierou, ke stredná generácia dosahuje najnizsie hodnoty indexu (-35.0 a ­32.4), cize je najkritickejsia a najstarsia generácia je najmenej kritická (hodnota indexu je ­14.3).

129

IND_SB Kategórie veku

Index

-28,3 -35,0 -32,4 -26,5 -23,6 -14,3 -28,0

N

159 227 204 153 144 119 1006

18 az 25 26 az 35 36 az 45 46 az 55 56 az 65 66 a viac Total

Tabuka 7: Indexy hodnotenia spolocného bývania viacerých rodín v jednej domácnosti poda vekových kategórií respondentov

130

131

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VI Vzah medzi dvomi

ordinálnymi premennými

kojioôi

(bivariacná analýza poradových dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola riesi úlohu o Spearmanovom koeficiente poradovej korelácie.

]]]

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s tromi

premennými: · názor na spolocné bývanie (rspolbyv), · názor na hranicu odchodu do dôchodku (roddoch), · hodnotenie financnej situácie domácnosti (rfinsit). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­-

132

V tejto kapitole sa opä stretneme s úlohami bivariacnej analýzy. Pripomeme si, ze základom je jeden súbor. V om budeme analyzova vzah dvojice poradových premenných. Dvojica premenných môze vystupova v dvoch variantoch: dve rôzne poradové premenné, ktoré zachytávajú vlastnosti jednotiek toho istého súboru, tá istá vlastnos jednotiek toho istého súboru meraná na ordinálnej skále v rôznom case zachytená dvomi premennými. Jeden príslusník súboru je reprezentovaný dvojicou hodnôt z ordinálnych skál. Silu vzahu dvojice premenných budeme mera Spearmanovým koeficientom.

]]]

133

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 6. Poradová korelácia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Silu vzahu medzi dvomi premennými s ordinálnou skálou najcastejsie meriame Spearmanovým koeficientom poradovej korelácie (rho). Uz sme sa zaoberali vzahom medzi dvomi kvantitatívnymi premennými a mierou sily ich lineárneho vzahu pomocou Pearsonovho koeficientu korelácie r (pozri 3. kapitolu). Spearmanov koeficient poradovej korelácie má svoje korene v Pearsonovom koeficiente. Vznikol pomocou jeho osobitnej modifikácie zalozenej na myslienke homogenizácie vzdialenosti medzi stupami ordinálnej skály. Tejto otázke sme sa venovali v subkapitole 5.3. Teda, technicky vzaté, ak by sme na dvojicu poradových premenných aplikovali príkaz Rank Cases, cím by sme vytvorili novú dvojicu premenných a pre u pocítali Pearsonov koeficient korelácie, výsledok by bol rovnaký ako ke priamo pre poradové premenné vypocítame Spearmanov koeficient poradovej korelácie. Z toho plynie, ze koeficient (rovnako ako koeficient r) nadobúda hodnoty z intervalu <-1, 1 >. Záporné hodnoty (negatívnu koreláciu) nadobúda pri nepriamej závislosti (s rastom poradia premennej X klesá priemerné poradie premennej Y). Kladné hodnoty (pozitívnu koreláciu) nadobúda pri priamej závislosti (s rastom poradia premennej X rastie i priemerné poradie premennej Y). Závislos je tým tesnejsia, cím viac sa koeficient korelácie blízi bu k -1, respektíve k +1. Krajné situácie predstavujú jedno-jedoznacný vzah. Cím viac sa koeficient korelácie blízi k nule, tým silnejsie odmieta prítomnos pozitívneho alebo negatívneho vzahu. Za koeficientom korelácie blízkym nule alebo priam nulovým sa môze skrýva jedna z viacerých diametrálne odlisných situácií. Jedna moznos je, ze Y je (takmer) trvale na jednej úrovni. Alebo je vzah medzi Y a X neregulárny, chaotický. Pri nulovej korelácii môze plati celkom regulárny, ale zlozitejsí nez priamo, ci nepriamoúmerný vzah. Dodajme, ze rovnako ako Pearsonov koeficient súcinovej korelácie i Spearmanov koeficient poradovej korelácie je symetrická miera. Je to miera vzájomného vzahu a preto nezálezí na poradí premenných, ktoré do výpoctu vstupujú. Pozitívne alebo negatívna poradová korelácia (podobne ako v prípade súcinovej korelácie) este neznamená, ze ide o kauzálny vzah. Úloha 1 Vypocíta Spearmanov koeficienty poradovej korelácie medzi premennými: názor na spolocné bývanie (rspolbyv), názor na hranicu odchodu do dôchodku (roddoch) a hodnotenie financnej situácie domácnosti (rfinsit). Analyze Correlate Bivariate...

134

Cesta

Obraz 1: Dialógový box Bivariate Correlations

Vyberieme premenné rspolbyv, roddoch a rfinsit. V rámceku Correlation Coefficients vypneme prepínac Pearson a zapneme prepínac Spearman. Stlacíme OK. Výstup 1 V tabuke 1 sa nachádzajú pozadované koeficienty poradovej korelácie.

Spolocné bývanie viacerých rodín d á i Spearman´s rho Spolocné bývanie viacerých rodín v jednej domácnosti: Vekovú hranicu odchodu do dôchodku treba zvýsi: Súcasná financná situácia Vasej domácnosti:

1,000

N

1006

Veková hranicu Súcasná financná odchodu do dôchodku situácia domácnosti b Spearman´s ýsi Spearman´s rho rho N N

,039 978 -,077 981

,039 -,077

978 981

1,000 ,105

997 971

,105 1,000

971 998

Tabuka 1: Matica koeficientov poradovej korelácie

Keze medzi názorom na vekovú hranicu odchodu do dôchodku a názorom na spolocné bývanie viacerých rodín v jednej domácnosti je koeficient blízky nule (= 0.039, pozri tabuku 1), priama úmera medzi poradiami neexistuje. Z druhostupovej tabuky frekvencií by sme zistili, ze ani iný typ regulárneho vzahu medzi premennými nie je prítomný. Medzi hodnotením súcasnej financnej situácie respondentovej domácnosti a jeho názorom na zvýsenie vekovej hranice odchodu do dôchodku je koeficient poradovej korelácie rovný hodnote 0.105. Je to slabý vzah. Ukazuje vsak náznaky tendencie: cím nizsie hodnotená

135

financná situácia domácnosti, tým castejsie sa objavuje vyssí stupe nesúhlasu so zvýsením hranice odchodu do dôchodku. Inak povedané, priemerné poradie poda názoru na hranicu odchodu do dôchodku nepatrne rastie pri nizsie hodnotenej financnej situácie (pozri tabuku 2). Medzi hodnotením súcasnej financnej situácie respondentovej domácnosti a jeho názorom na spolocné bývanie viacerých rodín v jednej domácnosti je koeficient poradovej korelácie rovný zápornej hodnote 0.077 (pozri tabuku 1). Cím vyssie je hodnotená financná situácia domácnosti, tým castejsie sa objavuje kritický názor na spolocné bývanie rodín. V tabuke 2, v poslednom stpci postupne klesajú (preto záporná korelácia) hodnoty priemerného poradia.

Mean

Priemerné poradie poda názoru na hranicu odchodu do Súcasná financná situácia dôchodku Vasej domácnosti: príjmy stacia na vsetko 436,6 príjmy stacia na vsetko, ale hospodárime úsporne musíme vea setri, aby sme si mohli kúpi drahsie veci máme dos peazí len na nákup najlacnejsích vecí peniaze stacia len na základné potraviny nemáme dos peazí ani na nákup základných potravín

468,5 502,7

Priemerné poradie poda názoru na spolocné bývanie rodín

539,8 530,6 501,5

511,8 524,0 563,0

513,6 458,8 496,5

Tabuka 2: Priemerné poradia v súboroch domácností

Dodatok

To, co sme si doteraz ukázali na celoslovenskom súbore, môzeme (napríklad) studova v jednotlivých vekostných kategóriách obcí. A výsledky medzi sebou môzeme porovna ­ ukáza spolocné a osobitné vlastnosti hodnôt koeficientov poradovej korelácie podmienené sociálnym priestorom. Podklad k takejto analýze poskytuje tabuka 3. Aký je technický postup v tvorbe tejto tabuky? V subkapitole 3.2. sme ukázali podobný postup, kedy sme na jednotlivých súboroch reprodukovali tvorbu bodového grafu. S malou modifikáciou tento postup platí aj v tejto nasej úlohe. Teda, otvoríme okno editora dát, potom si nastavíme funkciu ,,pílenia" celého súboru: vstúpime do ponuky Data a zavoláme si dialógový box Split File. V om najprv zapneme prepínac Compare groups (chceme v jednej tabuke ­ komparacnej tabuke ­ sedem korelacných matíc). Vyberieme premennú katob a stlacíme OK. A napokon zadáme rovnaký príkaz ako

136

v úlohe 1 (tejto subkapitoly). Vo výstupe urobíme drobné editorské úpravy a tabuka 3 je na svete.

Spearman´s rho

Kategórie obcí

Spolocné bývanie viacerých rodín v jednej domácnosti: Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia

1,000 ,124 ,005 1,000 -,007 -,005 1,000 -,033 -,114 1,000 ,100 -,152 1,000 ,145 ,024 1,000 ,034 -,076 1,000 -,018 -,043

Vekovú hranicu odchodu do dôchodku treba zvýsi:

,124 1,000 -,300* -,007 1,000 ,237* -,033 1,000 ,292* ,100 1,000 ,000 ,145 1,000 ,037 ,034 1,000 ,282* -,018 1,000 ,177

Súcasná financná situácia Vasej domácnosti:

,005 -,300* 1,000 -,005 ,237* 1,000 -,114 ,292* 1,000 -,152 ,000 1,000 ,024 ,037 1,000 -,076 ,282* 1,000 -,043 ,177 1,000

menej ako 1 tisíc

1 az 2 tisíc

2 az 5 tisíc

5 az 20 tisíc

Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia d á ti Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia d á ti Spolocné bývanie viacerých rodín Veková hranica odchodu do dôch. Súcasná financná situácia d á ti

20 az 50 tisíc

50 az 100 tisíc

Bratislava, Kosice

**.

Tabuka 3: Matica koeficientov poradovej korelácie v súboroch (kategóriách obcí)

137

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VII Opis súboru poda jednej

nominálnej premennnej

kojioôi

(jednorozmerná analýza nominálnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola riesi dva typy úloh: · · sumarizáciu nominálnych dát do tabuky (frekvencná tabuka), vizualizáciu tabuky pomocou grafického vyjadrenia jej obsahu (stpcové grafy, kruhové grafy a polygóny).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s nasledujúcimi

nominálnymi premennými: · typ domácnosti respondenta (typdom), · národnos respondenta (narod), · kategórie hlavného zamestnania (zamest). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

138

Obsah kapitoly je determinovaný nasledujúcimi faktormi. Predmetom analýzy je jedna premenná v jednom súbore. Premenná je nominálna. Obsah a postupnos nastolovaných problémov je urcená uz len jednou gnozeologickou dimenziou, ktorá zostáva nominálnej premennej ­ specificky nominálny rozmer - triedenie dát a jeho grafické vyjadrenie .

]]]

139

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 7. Triedenie nominálnych dát

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Zisti pocetnos (Count, Frequency) hodnôt nominálnej premennej, jej rozdelenie pocetností (Frequency Distribution) a modus (Mode) ­ to sú úlohy, ktoré sme sa v prípade kvantitatívnej premennej riesili v subkapitole 1.1. a v prípade ordinálnej premennej v subkapitole 4.1. V mnohom sú podobné rieseniam, ktoré prezentujeme v tejto kapitole a preto sa na ne budeme opiera. Skladba kapitoly Kapitola má dve casti: · · sumarizácia poradových dát do tabuky (Frekvencná tabuka...), vizualizácia tabuky pomocou grafického vyjadrenia jej obsahu (Grafy...).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Frekvencná tabuka...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Úloha 1

Vypocíta frekvencné tabuky nominálnych premenných: typ dodomácnosti (typdom), národnos respondenta (narod) a zamestnanecká kategória respondenta (zamest). V riesení úlohy pouzijeme príkaz Frequencies. Analyze Descriptive Statistics Frequencies... V ponúknutom zozname dialógového boxu Frequencies vysvietime tri nominálne premenné typdom, narod a zamest. Presunieme urcené premenné do prázdneho rámceka vpravo. Stlacíme tlacidlo OK.

Cesta

Výstup 1

Vo výstupnom okne sa zobrazia tri frekvencné tabuky (tabuka 1 az tabuka 3).

Národnos:

Frequency Valid slovenská maarská iná Total

890 109 31 1030

Percent

86,4 10,6 3,0 100,0

Valid Percent

86,4 10,6 3,0 100,0

Tabuka 1: Triedenie respondentov poda národnosti 140

Typ domácnosti respondenta:

Frequency Valid mladí udia mladá domácnos bezná domácnos dospelá domácnos trojgeneracná domácnos starsia domácnos starí udia iná domácnos Total

30 107 239 274 108 93 157 22 1030

Percent

2,9 10,4 23,2 26,6 10,5 9,0 15,2 2,1 100,0

Valid Percent

2,9 10,4 23,2 26,6 10,5 9,0 15,2 2,1 100,0

Tabuka 2: Triedenie poda typov domácnosti respondentov (frekvencná tabuka)

Zamestnanie:

Frequency Valid nekvalifikovaný, pomocný manuálny pracovník kvalifikovaný manuálny pracovník stredoskolsky vzdelaný odborný pracovník vysokoskolsky vzdelaný odborný pracovník riadite, námestník, politik... samostatne ekonomicky cinný bez zamestnancov samostatne ekonomicky cinný so zamestnancami nepracujúci dôchodca student v domácnosti alebo na materskej dovolenke nezamestnaný Total

99 192 176 59 3 33 12 255 54 40 107 1030

Percent

9,6 18,6 17,1 5,7 ,3 3,2 1,2 24,8 5,2 3,9 10,4 100,0

Valid Percent

9,6 18,6 17,1 5,7 ,3 3,2 1,2 24,8 5,2 3,9 10,4 100,0

Tabuka 3: Triedenie respondentov do zamestnaneckých kategórií

Varianty nominálnej premennej sú klasifikacné kategórie. Medzi nimi v tejto chvíli nehadáme vzahy nerovnosti, ci usporiadanosti. Preto, hoci pocítac vypíse kumulatívne percenta, tie v tejto situácii nie sú pouzitené (abstrahujeme od nich, respektíve pocas editovania ich

141

odstránime). Ostatné informácie, vcítane modusu interpretujeme v súlade s predchádzajúcimi poznatkami o frekvencných tabukách.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Grafy...

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Základné typy grafov Úloha 2

Pripomeme si, ze este stále pozeráme na poradové dáta cez optiku klasifikácie (ich triedenia). Základným produktom triedenia je frekvencná tabuka. Iná mozná forma prezentácia je vizuálna, kedy je obsah frekvencnej tabuky transformovaný do grafu. Mozností je viac a statistické systémy ich ponúkajú. Pre nominálne premenné medzi najvhodnejsie povazujeme nasledujúce dva typy: stpcový graf (Bar Chart), kruhový garf (Pie Chart). Vytvori stpcový graf (Bar Chart) distribúcie nominálnej premennej typ domácnosti (typdom). V riesení úlohy pouzijeme príkaz Bar Charts. Graphs Bar... Nastavenie dialógového boxu Bar Charts ponecháme v ponúknutom standardnom tvare: typ stpcového grafu je jednoduchý (Simple) a údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define. V dialógovom subboxe Summaries for Groups of Cases, do rámceka s názvom os kategórií (Category Axis:) presunieme premennú typdom. V rubrike Bars Represent zapneme tlacidlo % of cases. Specifikujeme tým vertikálnu os. Stpce grafu budú vyjadrova percentuálny výskyt kategórií. Stlacíme tlacidlo Options.... Vo vseobecnosti, ak chceme vylúci z grafu kategórie chýbajúcich hodnôt, v dialógovom subboxe Options preto vypneme stvorcek Display groups defined by missing values. Keze premenná typdom nemá chýbajúce hodnoty, táto operácia nie je potrebná. Stlacíme tlacidlo Continue. A následne stlacíme OK.

Cesta

Výstup 2

Vytvorili sme stpcový graf 1, ktorý prezentuje distribúciu premennej typ domácnosti. Pre prezentáciu distribúcie nominálnej premennej je stpcový graf (spolu s kruhovým grafom) najvhodnejsí. Histogram, císlicový graf a krabickový graf sú pre nominálnu premennú úplne nevhodné.

142

30 25 20

Percenta

15 10 5 0

Graf 1: Distribúcia premennej typ domácnosti (stpcový graf)

s no ác om ád in a di u s rí no sta ác m . do ác ia m rs do sta ná ac er en s jg no tro ác om ád el s sp no do ác om ád s zn no be ác m do dá la m a di u dí la m

Typ domácnosti respondenta

Úloha 3 Cesta

Vytvori kruhový graf (Pie Chart) distribúcie premennej národnos respondenta (narod). V riesení úlohy pouzijeme príkaz Pie Charts. Graphs Pie...

Obraz 1: Dialógový box Pie Charts

Nastavenie v dialógovom boxe Pie Charts ponecháme v ponúknutom standardnom tvare. Údaje sú triedené do kategórií (Summaries for groups of cases) ­ variantov korespondujúcich s variantami frekvencnej tabuky. Stlacíme Define.

143

Obraz 9: Dialógový subbox Define Pie

V subboxe Define Pie: Summaries for gruops of Cases, do rámceka s názvom os Define Slices by: presunieme premennú narod, poda ktorej budú konstruované kruhové výsece (Slices). V rubrike Slices Represents zapneme tlacidlo % of cases. Specifikujeme tým spôsob vyjadrenia podielu kategórií. Kruhové výsece budú opatrené percentuálnym výskytom kategórií. Stlacíme tlacidlo Options.... Ak by bolo potrebné vylúci z kruhového grafu varianty chýbajúcich hodnôt, v dialógovom subboxe Options vypneme stvorcek Display groups defined by missing values. (Premenná národnos respondenta nemá chýbajúce hodnoty.) Stlacíme tlacidlo Continue. A následne stlacíme OK. Výstup 3 Vytvorili sme kruhový graf (graf 2), ktorý zobrazuje distribúciu premennej národnos respondenta (pocítacový systém umozuje vysunú a tak zdôrazni zvolené kruhové výsece). Kruhový graf umozuje vníma pomer celku a jednotlivej kategórie, tiez pomer medzi dvojicami kategórií. Je vhodný na vizuálnu prezentáciu distribúcie nominálnej premennej.

144

Národnos respondenta

iná 3,0% maarská 10,6%

slovenská 86,4%

Graf 2: Distribúcia premennej národnos respondenta (kruhový graf)

145

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VIII Komparácia súborov poda nominálnej premennej

kojioôi

(komparatívna analýza nominálnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola má dve subkapitoly: 8.1. komparácia distribúcií poda percent, 8.2. komparácia súborov poda miery variácie.

]]]

Prvá subkapitola sa skladá z dvoch castí: · · numerická komparácia (tabuka triedenia druhého stupa), vizuálna komparácia (polygóny).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách budeme pracova s dvomi typmi premenných:

1. poradové premenné, ktorými budeme porovnáva súbory: · zamestnanecké kategórie (zamest), · hlavné typy domácností (ot6mult). 2. premenné, ktoré budú vymedzova súbory: · vekostné kategórie obcí (katob), · pohlavie (pohl). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

146

Stojíme pred úlohou porovna viacero súborov z hadiska jednej premennej. Uz sme vykonali univariacnú analýzu nominálnych premenných. Základné úlohy komparácie súborov poda nominálnej premennej budú zalozené na známych pojmoch, ktoré sme si ozrejmili v predchádzajúcich kapitolách. V kazdej úlohe budú vystupova dve premenné: jedna premenná vymedzuje súbory, ktoré chceme komparova a druhá premenná - nominálna, ktorou chceme komparova súbory. K výkladu pridáme este jeden komparacný prostriedok. Je to miera variácie nominálnej premennej, ktorou budeme súbory pomeriava.

]]]

147

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 8.1. Komparácia distribúcií

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Subkapitola sa skladá z dvoch castí: · · numerická komparácia (tabuka triedenia druhého stupa), vizuálna komparácia (stpcový graf).

Skladba subkapitoly

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Numerická komparácia distribúcií... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Úloha 1 Vytvori komparacné tabuky ­ vykona triedenie druhého stupa. V prvej tabuke riadková premenná bude vyjadrova zamestnanecké kategórie (zamest) a stpcová súbory muzov a zien (pohl). V druhej tabuke budeme triedi hlavné typy domácností (ot6mult) poda vekostných kategórií obcí (katob). V bunkách nech sú pocetnosti a stpcové percenta (keze chceme porovnáva skladbu stpcov). Úlohu budeme riesi príkazom Crosstabs. Analyze Descriptive Statistics Crosstabs... V dialógovom boxe Crosstabs do rámceka Row(s): presunieme premenné zamest a ot6mult a do rámceka Column(s): presunieme premenné pohl a katob (zadali sme tým styri tabuky a medzi nimi budú aj tie dve, ktoré sme vymedzili v zadaní úlohy). Stlacíme tlacidlo Cells... . V dialógovom subboxe Cells v rámceku Counts ponecháme zapnutý prepínac s názvom Observed (zaujímajú nás empirické, pozorované pocetnosti). V rámceku Percentages zapneme prepínac Column (chceme vypocíta stpcové percenta). Stlacíme Continue a potom tlacidlo OK. Výstup 1 Výstupom sú tabuky triedenia druhého stupa (tabuka 1 a tabuka 2). Pozrime sa blizsie na tabuku 1. Porovnávame dva súbory, ktoré sú v nej znázornené ako dva stpce. Kazdý stpec tvorí celok, sto percent. Aký je podiel kvalifikovaných manuálnych pracovníkov, respektíve pracovnícok v jednom a v druhom súbore? Tak môze znie jedna z otázok. V súbore je výrazne vyssí ­ predstavuje 25.8%, nez v súbore zien, v ktorom je kvalifikovaných manuálnych pracovnícok len 11.6%. Takto sledujeme podiel ktorejkovek zamestnaneckej kategórie v urcených súboroch. Je tiez vhodné porovna medzi sebou modálne kategórie. V úlohe 2 si ukázeme aj na grafe rozdiely medzi muzmi a zenami z hadiska ich zaradenia do zamestnaneckých kategórií. Tam sa nám modálne kategórie priam ,,núkajú" do pozornosti.

148

Cesta

Pohlavie: muz Zamestnanie: nekvalifikovaný, pomocný manuálny pracovník kvalifikovaný manuálny pracovník stredoskolsky vzdelaný odborný pracovník vysokoskolsky vzdelaný odborný pracovník riadite, námestník, politik... samostatne ekonomicky cinný bez zamestnancov samostatne ekonomicky cinný so zamestnancami nepracujúci dôchodca student v domácnosti alebo na materskej dovolenke nezamestnaný Total

54 10,5% 132 25,8% 68 13,3% 33 6,4% 3 ,6% 25 4,9% 7 1,4% 106 20,7% 27 5,3% 1 ,2% 56 10,9% 512 100,0% 8 1,5% 5 1,0% 149 28,8% 27 5,2% 39 7,5% 51 9,8% 518 100,0%

zena

45 8,7% 60 11,6% 108 20,8% 26 5,0%

Tabuka 1: Distribúcie premennej zamestnanecké kategórie poda pohlavia (tabuka triedenia druhého stupa)

Pocet obyvateov obce: menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc mladá domácnos bezná domácnos dospelá domácnos trojgener.domácnos starsia domácnos starí udia Total

12 8,9% 23 17,0% 36 26,7% 32 23,7% 9 6,7% 23 17,0% 135 100,0% 15 9,0% 41 24,7% 52 31,3% 16 9,6% 9 5,4% 33 19,9% 166 100,0% 13 10,3% 31 24,6% 35 27,8% 16 12,7% 10 7,9% 21 16,7% 126 100,0%

5 az 20 tisíc

23 13,5% 53 31,0% 42 24,6% 11 6,4% 18 10,5% 24 14,0% 171 100,0%

20 az 50 tisíc

20 12,8% 42 26,9% 41 26,3% 12 7,7% 20 12,8% 21 13,5% 156 100,0%

50 az 100 tisíc

12 10,7% 22 19,6% 37 33,0% 14 12,5% 12 10,7% 15 13,4% 112 100,0%

Bratislava, Kosice

12 10,7% 27 24,1% 31 27,7% 7 6,3% 15 13,4% 20 17,9% 112 100,0%

Tabuka 2: Distribúcie premennej hlavný typ domácnosti poda vekostných skupín obcí (tabuka triedenia druhého stupa)

149

Tabuka 2 je základom pre viacnásobnú komparáciu, postup je vsak v princípe rovnaký ako v prípade tabuky 1. ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Grafická (vizuálna) komparácia... ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Úloha 2 Vytvori komparacný stpcový graf - rozdelenie zamestnaneckých kategórií (zamest) v súbore muzov a v súbore zien (pohl). Úlohu budeme riesi príkazom Bar. Graphs Bar ...

Cesta

Obraz 1: Dialógový box Bar Charts

V dialógovom boxe Bar Charts zapneme druhý typ grafu ­ Clustered. V rámceku Data in Chart Are nebudeme robi ziadne zmeny. Stlacíme tlacidlo Define.

Obraz 2: Dialógový subbox Define Clustered Bar

150

V dialógovom subboxe Define Clustered Bar: Summaries for Groups of Cases do rámceka Category Axis: presunieme premennú, poda ktorej budeme tvori stpcové grafy ­ zamest. Do rámceka Define Clusters by: presunieme premennú pohl ­ pre kazdú kategóriu tejto premennej vytvoríme polygón. V rámceku Bars Represent zapneme prepínac % of cases, dosiahneme tým, ze vertikálna os bude zobrazova percenta. Stlacíme tlacidlo Options... . Ak premenná, ktorá definuje súbory má aj chýbajúce hodnoty a nás nezaujíma stpcový graf tejto osobitnej skupiny, potom v dialógovom subboxe Options zrusíme polozku Display groups defined by missing values. (Pripomíname to ako vseobecné pravidlo, hoci v tomto prípade premenná pohl nemá chýbajúce hodnoty.) Výstup 2 Vytvorili sme stpcový graf umozujúci porovna muzov a zena poda zamestnaneckých kategórií (graf 1).

40 35 30 25

Percenta

20 15 10 5 0

ý an tn es m sti za n e cn o á m do v a nt de odc h stu ôc .d s pr . ne .cin ez .ek .b m sa .cin ník t es .ek m m ná sa , . te di prac ria b. od c. s. a vy . pr db .o str rac. ... ý, . p van al kv fiko li ne a kv

Pohlavie:

muz zena

Zamestnanie

Graf 1: Distribúcia zamestnaneckých kategórií osobitne pre súbor muzov a súbor zien (komparacný stpcový graf)

Graf 1 vemi dobre ukazuje heterogenitu distribúcií zamestnania poda pohlavia. Ak by sme sa pokúsili analogicky pomocou komparacného stpcového grafu zobrazi obsah tabuky 2 - distribúcie premennej typ domácnosti poda vekostných skupín obcí, pre veké mnozstvo súborov a v dôsledku toho pre prílisnú prehustenos informácií by graf nebol celkom funkcný.

151

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 8.2. Komparácia súborov poda miery variácie

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Meranie variability, Máme distribúciu s r kategóriami: f1 f2 ... fr rozmanitosti ( fi sú relatívne pocetnosti). distribúcie Casto nás zaujíma miera variability, rozmanitosti distribúcie, ktorú potom porovnávame s variabilitou inej distribúcie. Zadefinujeme si dva najcastejsie ukazovatele rozmanitosti distribúcie nominálnej premennej. Index diverzity (ID): ID = f1 ( 1 - f1 ) + f2 ( 1 - f2 ) + ... + fr ( 1 - fr ) Index entropie (IE): IE = - f1 ln f1 - f2 ln f2- ... ­ fr ln fr Normovanie indexu Maximálna hodnota týchto indexov je podmienená poctom kategórií distribúcie. Index je porovnatený len v rámci distribúcií s rovnakým poctom kategórií. Toto obmedzenie prekonáme uplatnením normalizácie. Index nadobudne minimálnu hodnotu 0, ak sú vsetky prípady (respondenti) v jednej kategórií. Maximálnu hodnotu 1 nadobudne index v situácii, kedy sú prípady rovnomerne rozdelené do vsetkých r kategórií. Normovaný index diverzity (NID): NID = ID r/(r-1) Normovaný index entropie (NIE): NIE = IE / ln r Úloha 3 NIE < 0,1 > NID < 0,1 >

Vypocíta charakteristiky variability premennej hlavné typy domácnosti (ot6mult), osobitne v kazdom súbore vymedzenom poda vekosti obce (katob). Prvýkrát si ukázeme postup výlucne s vyuzitím syntaxovej formy príkazov (cesta prostredníctvom dialógových boxov je aj tu mozná, ale vemi pomalá). Prvý krok spocíva v príprave vstupných dát. Nimi sú pocetnosti hlavných typov domácností v v kategóriách obcí. Tie sa nachádzajú v tabuke 2, v tejto subkapitole. Príkazy k vstupu dát (k nacítaniu do editora dát) sú nasledovné:

data list free/ n1 to n6 . begin data 12 23 36 32 15 41 52 16 13 31 35 16 152

Riesenie

9 9 10

23 33 21

23 53 20 42 12 22 12 27 end data.

42 41 37 31

11 12 14 7

18 20 12 15

24 21 15 20

Relatívne pocetnosti vypocítame príkazmi:

COMPUTE spolu =sum( n1 to n6) . COMPUTE f1 = n1 / spolu . COMPUTE f2 = n2 / spolu . COMPUTE f3 = n3 / spolu. COMPUTE f4 = n4 / spolu . COMPUTE f5 = n5 / spolu . COMPUTE f6 = n6 / spolu . COMPUTE sss =sum( f1 to f6) .

Príkazy k výpoctu mier variability:

compute NID=(1-(f1*f1+f2*f2+f3*f3+f4*f4+f5*f5+f6*f6))*6/5. compute NIE=-1*(f1*LN(f1)+f2*LN(f2)+f3*LN(f3)+f4*LN(f4) +f5*LN(f5)+f6*LN(f6))/LN(6). execute.

Výstup 3

Výstupom sú vypocítané hodnoty NID a NIE pre vekostné kategórie obcí (tabuka 3).

­­­­­­­­­­­­­­­­­­­­­­­NID NIE ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc 5 az 20 tisíc 20 az 50 tisíc 50 az 100 tisíc Bratislava, Kosice ,96 ,94 ,96 ,95 ,96 ,95 ,96 ,94 ,91 ,95 ,93 ,95 ,95 ,94

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tabuka 3: Normovaný index diverzity (NID) a normovaný index entropie (NIE) poda kategórií obcí

Indexy ukazujú, do akej miery sú distribúcie vzdialené od rovnomernej distribúcie. Vieme, ze cím je hodnota indexu väcsia, tým je táto vzdialenos mensia. Môzeme na základe výsledkov konstatova, ze variabilita, rozmanitos je vo vsetkých súboroch vemi vysoká a súbory sa v tejto vlastnosti odlisujú vemi málo. Chybné by bolo z tohto výsledku usudzova, ze medzi súbormi vládne tiez veká homogenita distribúcií. Nasa úloha ukazuje, ze to tak nemusí by. Ak sa vrátime k tabuke 2, zistíme podstatné rozdiely medzi niektorými distribúciami. Heterogenita, prípadne homogenita distribúcií je jeden aspekt problematiky, ktorý nepredurcuje aká bude miera variácie, rozmanitosti týchto distribúcií.

153

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola XI Vzah medzi dvomi

nominálnymi premennými

kojioôi

(bivariacná analýza kvalitatívnych dát)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kapitola riesi úlohu o Cramerovom koeficiente kontingencie.

]]]

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Dáta: V úlohách tejto kapitoly budeme pracova s tromi

premennými: · hlavné typy domácností (ot6mult), · vekostné kategórie obcí (katob), · kraje Slovenska (kraj). ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­-

154

V tejto kapitole sa uz tretíkrát stretneme s úlohami bivariacnej analýzy. V jednom súbore budeme analyzova vzah dvojice kvalitatívnych premenných. Dvojica premenných môze vystupova v dvoch variantoch: dve rôzne kvalitatívne premenné, ktoré zachytávajú vlastnosti jednotiek toho istého súboru, tá istá vlastnos jednotiek toho istého súboru meraná na nominálnej skále v rôznom case zachytená dvomi premennými. Jeden príslusník súboru je reprezentovaný dvojicou kategórií z nominálnych skál. Silu vzahu dvojice premenných ­ kontingenciu ­ budeme mera Cramerovým koeficientom.

]]]

155

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 9. Kontingencia

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Tesnos vzahu medzi dvomi premennými s nominálnou skálou (tesnos kontingencie) najcastejsie meriame Cramerovým koeficientom V. V matematickej statistike je dobre známa velicina chíkvadrát. Jedna z jej foriem je nasledovná:

Chíkvadrát =

(n11 - e11 )2 (n12 - e12 )2

e11 + e12

+ ... +

(nrs - ers )2

ers

.

Pricom nij sú zistené pocetnosti, eij sú ocakávané pocetnosti a r, s sú rozmery druhostupovej tabuky . Ocakávané pocetnosti sú teoreticky vytvorené pocty na základe predpokladu, ze distribúcia (napríklad) prvej premennej sa pri zmene kategórie druhej premennej vôbec nezmení. Cím väcsie sú diferencie medzi empirickými (zistenými) a teoretickými pocetnosami, tým väcsia je hodnota chíkvadrát. Cím väcsia chíkvadrát-hodnota, tým väcsia heterogenita distribúcií ­ tým tesnejsia je súvislos medzi skúmanými kvalitatívnymi premennými. To je dostatocne dobrá vlastnos chíkvadrát veliciny k tomu, aby sa stala základom miery kontingencie. Transformovaná tak, aby jej minimum bolo rovné nule a maximum jednotke je totozná s Cramerovým koeficientom V. Keze premenné sú nominálne, nie je mozné hovori o smere vzahu (sila vzahu tu nemá smer, na rozdiel od koeficienta súcinovej alebo poradovej korelácie). Ak je koeficient V nulový alebo blízky nule, znamená to, ze distribúcia jednej premennej nie je podmienená kategóriami druhej premennej ­ je to stav statistickej nezávislosti dvoch kvalitatívnych premenných. Cím je koeficient V blizsie k jednotke, tým je tesnejsí vzah medzi premennými, alebo inak povedané, tým väcsie sú rozdiely medzi distribúciami jednej premennej pre rôzne kategórie druhej premennej. Na poradí premenných nezálezí. Úloha 1 Vypocíta Cramerovo V ­ mieru vzahu medzi hlavnými typmi domácnosti (ot6mult) a vekostnými kategóriami obcí (katob). Pripomíname, ze druhostupovú frekvencnú tabuku týchto premenných sme vypocítali v subkapitole 8.1. (pozri tabuka 2). Analyze Descriptive Statistics Crosstabs... V dialógovom boxe Crosstabs do rámceka Row(s): presunieme premennú ot6mult a do rámceka Column(s): presunieme premennú katob. Stlacíme tlacidlo Statistics... . V dialógovom subboxe Statistics v rámceku Nominal zapneme polozku Phi and Cramer´s V. Stlacíme

156

Cesta

tlacidlo Continue. Vrátime sa do boxu Crosstabs. Ak nechceme pocíta druhostupovú tabuku, zapneme v om prepínac Suppres tables. Potom stlacíme OK. Výstup 1 Miera kontingencie medzi hlavnými typmi domácnosti a vekostnými kategóriami obcí V = 0.103, co predstavuje pomerne malú silu vzahu. Vyssia miera kontingencie este neznamená, ze ide o kauzálny vzah. Uz sme poukazovali na to, ze v neexperimentálnych výskumoch je kauzálny výklad vemi nárocný. Vyzaduje speciálnu teoretickú a metodologickú konceptualizáciu. V tabuke 1 máme moznos porovna mieru vzahu medzi tými istými premennými v jednotlivých krajoch Slovenska. Zaujímavý je tiez fakt, ze vo vsetkých krajoch je koeficient V výrazne vyssí ako ,,celoslovenské" V.

Kraj:

Dodatok

Cramerovo V

,172 ,208 ,183 ,185 ,209 ,176 ,177 ,216

Bratislavský Trnavský Trenciansky Nitriansky Zilinský Banskobystrický Presovský Kosický

Tabuka 1: Kontingencie medzi hlavnými typmi domácnosti a vekostnými kategóriami obcí poda krajov Slovenska ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Odporúcaná literatúra

Nasledujúca vybraná literatúra je vhodná pre alsie vzdelávanie v oblasti deskripcie dát: Aron 1999, Clauss a Ebner 1988, Kalous 1983, Kähler 1992, Kerlinger 1972, Norusis 1999, Stukovská 1973, Stukovský a Palát 1975, Svec a kol. 1998, Tropper 1998, Wonnacot a Wonnacot 1992.

157

158

III. cas MOZNOSTI VYBRANÝCH PRÍKAZOV SPSS

Prehad vybraných príkazov SPSS

Oblasti:

Príkazy:

Súbor, dáta a premenné

File (1.kap.) Define Variable (2.kap.)

Transformácia dát, premenných

Compute (3.kap.) Recode into Same Variables (4.kap.) Recode into Different Variables (5.kap.)

Spracovanie dát

Frequencies (6.kap.) Explore (7.kap.) Crosstabs (8.kap.) Means (9.kap.)

161

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola I Okná a ponuky SPSS

(celková orientácia v SPSS)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Spustenie SPSS Systém SPSS nastartujeme klasicky, tým, ze stlacíme avé tlacidlo mysi na ikone

Shortcut to spsswin.lnk

Systém SPSS otvorí editor dát (Data Editor):

Obraz 1: Okno editora dát (este prázdne)

162

Na obrazovke vidíme jedno z mnohých typov okien SPSS - okno editora dát s titulným riadkom Untitled ­ SPSS for Windows Data Editor. Editor dát je doposia prázdny a bez mena. Hlavná ponuka Hlavné cinnosti systému SPSS sú riadené príkazmi, ktoré sú sústredené do h l a v n e j p o n u k y. Hlavná ponuka je umiestnená v druhom riadku okna. Skladá sa z nasledujúcich komponentov: 1. Ponuka File obsahuje príkazy, ktorými sa: a) otvárajú nové alebo existujúce súbory (a nacítavajú sa do okien), b) ukladajú na disk alebo tlacia vytvorené obsahy okien. Príklad Chceme otvori dátový súbor s názvom rodina99.sav, ktorý je ulozený v adresári C:\00000001. (Poznamenajme, ze SPSS-dátové súbory majú príponu *.sav.) Ako budeme postupova? V hlavnej ponuke stlacíme avé tlacidlo mysi na polozke FILE. V subponuke nájdeme polozku Open... stlacíme na nej avé tlacidlo mysi. Otvorí sa dialógový box Open File. V budúcnosti takúto postupnos krokov vyjadríme skrátene: File Open...

Obraz 2: Dialógový box Open File

Upravíme dialógový box. V rubrike Look in: nastavíme potrebný adresár, respektíve cestu k násmu dátovému súboru. V zozname dátových súborov (vsimnime si, ze Files of type je zapnutý na typ súboru s príponou *.sav, cize na SPSS-dátový súbor) vyhadáme súbor s názvom rodina99 a stlacíme na om avé tlacidlo mysi. Vzápätí stlacíme tlacidlo Open. Stlacme avé tlacidlo mysi na ikone rodina99 umiestnenej v dolnej casti okna. Editor dát sa naplní dátami, ktoré

163

chceme spracova. rodina99.

V titulnom riadku editora dát je názov súboru

Obraz 3: Okno editora dát naplnené súborom rodina99.sav

Uveme strucne alsie zlozky hlavnej ponuky. 2. Ponuka Edit skladá sa z príkazov, ktoré umozujú manipulova s celým obsahom alebo s casou editora dát, s textovými oknami a s grafmi. 3. Ponuka View umozuje zapoji, resp. zmeni funkcie a obsah zobrazeného okna. 4. Ponuka Data umozuje definova alebo modifikova premenné, manipulova s riadkami i s celou maticou dát. 5. Ponuka Transform obsahuje príkazy, ktorými sa transformujú premenné do nových premenných - vytvárajú sa na základe existujúcich premenných konstrukty. 6. Ponuka Analyze

164

obsahuje dialógové boxy vsetkých statistických procedúr, ktoré SPSS poskytuje. Vyplnením a spustením dialógových boxov sa odstartujú príkazy realizácie statistických procedúr analýzy dát. 7. Ponuka Graphs skladá sa s rozsiahlej skály príkazov tvorby stpcových grafov (Barcharts), kruhových grafov (Piecharts), histogramu (Histogram), krabickového grafu (Box-and-Whisker Plot) spojnicový a korelacný graf (Line and Scatterplot), sekvencné grafy (Sequence Charts) a celý rad alsích. Umozuje tiez interaktívny spôsob práce s grafmi. 8. Ponuka Utilities obsahuje viaceré technické pomôcky, ktoré nám zjednodusujú alebo urýchujú prácu s premennými a podávajú informácie o nich, alej, obsahuje príkazy, ktoré menia niektoré atribúty práce so systémom. 9. Ponuka Window obsahuje príkazy usporiadania, rozmiestnenia okien na obrazovke a ponúka zoznam otvorených aplikácií. 10. Ponuka Help Systém SPSS je vybavený rozsiahlym systémom pomoci. Vychádza zo standardného ,,Helpu" pracujúceho v prostredí Windows a má teda rovnaký princíp a spôsob ovládania. Typy okien SPSS Strucne sme sa zmienili o prvom type okien, o editore dát. V nasej práci budeme potrebova predbezne aspo základné informácie o alsích oknách systému SPSS. Systém má viacero typov okien: Uz spomínané okno editora dát (Data Editor window) okno zobrazuje obsah aktívneho dátového súboru. Editor umozuje priamu manipuláciu v aktívnom dátovom súbore. Výstupné okno (Wiever) v om sú zaznamenané pozadované informácie o premenných, o spustených príkazoch, ich výstupy a správy o priebehu spracovania dát. (Stlacme avé tlacidlo mysi na ikone Output1 umiestnenej v dolnej casti okna. V systéme SPSS môzeme pouzíva este ses alsích typov okien: Výstupné okno s jednoduchou textovou formou (Draft Viewer). Zobrazuje výstup v jednoduchej textovej forme. Editor ,,pivotovania" tabuliek (Pivot Table Editor). Okno, ktoré obsahuje mnozstvo funkcií s moznosami kreovania tabuliek a statistických výstupov do publikovatenej formy.

165

Editor grafov (Chart Editor). Okno, ktoré obsahuje mnozstvo funkcií s moznosami kreovania rozmanitých grafov.

Obraz 4: Výstupné okno (Wiever).

Editor výstupných textov (Text Output Editor). Umozuje editova výstupné texty (typ, stýl, farbu, vekos fontov). Syntaxový editor (Syntax Editor). Systém SPSS do speciálneho syntaxového okna zapisuje po stlacení tlacidla PASTE v dialógovom boxe príkaz v syntaxovej forme. Po stlacení tlacidla RUN v syntaxovom okne spustíme príkaz oznacený kurzorom. V syntaxovom okne môzeme aj priamo zapisova (bez pouzitia dialógových boxov) a spúsa príkazy. Je to vemi efektívny postup pri opakovanom pouzívaní tých istých príkazov na rôzne súbory dát, ale i v iných situáciách. Obsah príkazového okna mozno ulozi na disk a pocas novej schôdzky so systémom ho opätovne nacíta do okna. Editor skriptov (Script Editor). Skripty umozujú automatizova úpravy výstupov statistických procedúr v navigátore. Navigátor je súcas výstupného okna a významne uahcuje prácu s casami výstupu, s ich usporiadaním, kopírovaním, rusením a pod.

166

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola II Príkaz Define Variable

(ponuka Data)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Define Variable definuje nové premenné v aktívnom dátovom súbore alebo mení parametre (v om uz) existujúcich premenných. Podmienkou je, aby bol editor dát aktívny. Cesta Data Define Variable... Otvorí sa dialógový box Define Variable (pozri obrraz 1), ktorý obsahuje:

Obraz 1: Dialógový box Define Variable

Variable Name

Vstupné pole pre názov premennej. Ak je v editore dát aktivovaná bunka v stpci este nedefinovanej premennej, vo vstupnom poli sa objaví default (preddefinovaný) názov, ktorý sa skladá so standardnej casti var a druhú cas predstavuje pämiestne císlo (napríklad var00001, var00002,..., var00156, a podobne).

167

Aj alsie parametre novej premennej sú zadefinované: numerická premenná, s ôsmimi pozíciami, z nich dve pre desatinné miesta, bez identifikácie uzívateských chýbajúcich hodnôt, so zarovnaním hodnôt v stpci "doprava". Avsak, ak je v editore dát aktivovaná bunka v stpci definovanej premennej, vo vstupnom poli sa objaví originálny názov premennej a jej ostatné základné parametre za zobrazia v dialógovom boxe. Variable Description Informacné pole so styrmi polozkami: Type typ premennej, Variable Label oznacenie premennej, Missing Values uzívateské chýbajúce hodnoty, Alignment usporiadanie (zarovnanie) zápisu hodnôt v stpcoch editora dát. Change Settings V tomto poli boxu sú ulozené styri tlacítka (reprezentujúce podpríkazy), ktorými sa vyvolávajú subboxy: Type Labels Missing Values Column Format podpríkazové tlacidlo, ktorým sa otvára subdialógový box Define Variable Type, tlacidlo, ktorým sa otvára subdialógový box Define Labels, tlacidlo, ktoré otvorí subdialógový box Define Missing Values tlacidlo otvorí box Define Column Format.

Measurement

Specifikácia úrovne merania: Scale numerické dáta na intervalovej alebo podielovej skále, Ordinal poradová skála, Nominal nominálna (klasifikacná) skála. Nominálne a poradové dáta môzu by reazcové (alfanumerické) alebo numerické.

Define variable Type

Podpríkaz Type deklaruje typ premennej. Otvorí dialógový subbox Define Variable Type, ktorý obsahuje: a) osem prepínacov (rádiotlacidiel) na výber typu premennej a b) vstupné polia alebo vzory, ktoré konkretizujú typ (formát) premennej.

168

Obraz 2: Dialógový subbox Define Variable Type

Define Labels

Podpríkaz Labels definuje oznacenia hodnôt premennej. Otvorí dialógový subbox Define Labels, ktorý obsahuje:

Obraz 3: Dialógový subbox Define Labels

Variable Label Value Labels

Vstupné pole na oznacenie premennej reazcom dlhým maximálne 120 znakov. Rámcek s týmto menom slúzi na oznacovanie hodnôt premennej. Obsahuje dve vstupné polia: Value na vkladanie hodnoty premennej, Value Label na vkladanie oznacenia tejze hodnoty a tri podpríkazové tlacidla: Add (ak je tlacidlo aktívne, cize obidve vstupné polia sú vyplnené) podpríkaz pripojí oznacenie hodnoty do zoznamu oznacení, Change (ak je tlacidlo aktívne) podpríkaz poda uskutocnenej zmeny oznacenia modifikuje zoznam oznacení hodnôt, Remove vymaze vysvietenú polozku v zozname oznacení hodnôt.

169

Postup pri vytváraní oznacenia hodnoty: 1. krok - vlozíme císelnú hodnotu alebo reazec do vstupného poa Value, 2. krok - do vstupného poa Value Label vlozíme oznacenie hodnoty premennej, 3. krok - stlacíme tlacidlo Add. Postup pri modifikovaní oznacenia hodnoty: 1. krok - v zozname oznacení vysvietime polozku, ktorú mienime zmeni, 2. krok - do vstupného poa Value Label vlozíme nové oznacenie, 3. krok - stlacíme tlacítko Change. Postup pri zrusení oznacenia hodnoty: 1. krok - v zozname oznacení hodnôt vysvietime polozku, ktorú chceme odstráni, vymaza, 2. krok - stlacíme tlacidlo Remove. Missing Values Podpríkaz Missing Values definuje chýbajúce hodnoty premennej. Otvorí dialógový subbox Define Missing Values, ktorý umozuje definova uzívateské chýbajúce hodnoty premennej. Subbox obsahuje styri prepínace (rádiotlacidla): No missing values Discrete missing values Range of missing values pre premennú bez uzívateskej chýbajúcej hodnoty, umozuje definova jednu az tri chýbajúce hodnoty, umozuje definova interval, z ktorého ktorákovek hodnota je definovaná ako chýbajúca, umozuje definova okrem intervalu navyse este jeden diskrétny variant ako uzívateskú chýbajúcu hodnotu.

Range plus one discrete missing value

Obraz 4: Dialógový subbox Define Missing Values 170

Poznámka

V práci s SPSS je potrebné odlisova uzívateské chýbajúce hodnoty (user-missing values) od systémových chýbajúcich hodnôt (system-missing values). Bunka numerickej premennej, prvotne bez informácie, je oznacená bodkou. Bodka tu predstavuje systémovú chýbajúcu hodnotu.

Define Column Format

Podpríkaz Column Format definuje rozsah a usporiadanie (formát) stpca v editore dát. Otvorí dialógový subbox Define Column Format, ktorý obsahuje:

Obraz 5: Dialógový subbox Define Column Format

Column Width Text Alignment

do vstupného poa mozno vlozi pozadovanú sírku stpca, umozuje voli spôsob zápisu hodnoty (zarovnanie textu) v bunke editora dát medzi tromi moznosami: Left zápis zacína celkom zava (je vhodný a aj standardný pre reazcovú premennú), Center zápis v bunke je centrovaný, Right zápis v bunke koncí celkom vpravo (je vhodný a aj standardný pre numerickú premennú).

Poznámky

Je treba rozlisova medzi sírkou stpca (column width) a sírkou premennej (width of a variable). Ak je prvá mensia nez druhá, má to za následok len ten fakt, ze sa hodnota premennej v editore dát prejaví bez useknutej casti, reálne sa vsak sírka premennej nemení. Z podobných dôvodov môze tiez dôjs k useknutiu mena premennej v editore dát. Dialógový box Define Variable mozno otvori tiez dvojnásobným Stlacením avého tlacidla mysi v ktoromkovek stpci "nultého" riadku editora dát.

171

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola III Príkaz Compute

(ponuka Transform)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Compute zadefinovaným spôsobom vytvorí (pre kazdý alebo stanovené prípady) novú alebo modifikuje existujúcu premennú aktívneho súboru. Cesta Transform Compute... Otvorí sa dialógový box Compute Variable, ktorý obsahuje:

Obraz 1: Dialógový box Compute

Target Variable

Vstupné pole pre cieovú premennú. Do neho môzeme zapísa nový názov premennej alebo zo zoznamu uz existujúcich premenných môzeme pouzi zvolený názov.

Numeric Expression Vstupné pole, v ktorom skomponujeme numerický výraz. Pritom môzeme pouzi zoznam existujúcich premenných, konstanty, aritmetické operátory (moznos pouzitia poa s kalkulátorovými tlacidlami) a funkcie (moznos aplikácie rozmanitých funkcií z ponúknutého zoznamu funkcií). Type & Label Podpríkazové tlacidlo, ktorým otvoríme dialógový subbox Type and Label (pozri alej).

172

Functions If

Zoznam viac nez 70 druhov funkcií, ktoré môzeme pouzi pri konstrukcii numerického výrazu (pozri alej). Podpríkazové tlacidlo otvorí dialógový subbox If Cases, v ktorom môzeme definova logické podmienky pre výber prípadov. Cieová premenná bude definovaná v týchto podmienkach (pozri nizsie). Aritmetické operátory: + scítanie - odcítanie * násobenie ** umocnenie / delenie () zátvorky

Kalkulátorové tlacidlá

Podpríkaz Type and Label

Podpríkaz Type and Label otvorí dialógový subbox, ktorý umozuje zadefinova oznacenie cieovej premennej a v prípade potreby zmeni typ premennej. Subbox obsahuje:

Obraz 2: Dialógový subbox Type and Label

Label

Polícko s dvomi rádiotlacítkami: Label ak je prepínac zapnutý, môzeme do vstupného poa vlozi oznacenie cieovej premennej (maximálne 120 znakov),

Use expression as label ak je aktivovaný prepínac, bude numerický výraz alebo jeho cas (maximálne 110 znakov) uplatnený ako oznacenie premennej. Type Polícko s dvomi prepínacmi: Numeric String preddefinovaná alternatíva deklaruje cieovú premennú ako numerickú, zapnutím prepínaca definujeme premennú ako textovú, vstupné pole Width umozuje nastavi sírku premennej.

Podpríkaz If Cases

Podpríkaz If Cases s pouzitím logického výrazu redukuje súbor vsetkých prípadov len na tú podmnozinu, ktorá vyhovuje zadefino173

vaným podmienkam. Podpríkaz otvorí dialógový subbox If Cases, ktorý obsahuje dva prepínace:

Obraz 3: Dialógový subbox If Cases

Include all cases premennej Include if case satisfies condition

Preddefinovaná alternatíva znamená, ze hodnoty cieovej budú vypocítané pre vsetky prípady. Zapnutím prepínaca kladieme na prípady (riadky v aktívnom súbore) podmienky, ktoré deklarujeme vo vstupnom poli, kam zapíseme logický výraz podmienok; môzeme pritom pouzi zoznam premenných aktívneho súboru, kalkulátorové tlacidlá a ponuku funkcií. Pri komponovaní logického výrazu pouzívame relacné a logické operátori: Relacné operátory: < mensí nez > väcsí nez <= mensí alebo rovný >= väcsí alebo rovný = rovný ~= nerovný Logický výraz a chýbajúca hodnota: výraz implikácia 1 AND 1 1 1 AND 0 0 0 AND 0 0 1 AND miss miss miss AND miss miss 1 AND miss 0* Poznámky: 1 pravdivý výraz

174

Logické operátory: & AND logický súcin | OR logický súcet

~ NOT negácia

výraz implikácia 1 OR 1 1 1 OR 0 1 0 OR 0 0 1 OR miss 1* miss OR miss miss 1 OR miss miss

0 miss *

nepravdivý výraz chýbajúca informácia implikácia z nekompletnej informácie

Príklady podmienok (logických výrazov): VEK > 15 AND POHL = 2 clovek s hodnotou premennej POHL rovnej 2 a zárove starsí nez 15, textová premenná SPOK1 má hodnotu 'vemi' alebo premenná SPOK2 má hodnotu 'vôbec',

SPOK1 = 'vemi' OR SPOK2 = 'vôbec'

(X2 - X1) GT (X3 - X4)

rozdiel hodnôt dvoch premenných je väcsí nez rozdiel hodnôt iných dvoch premenných, absolútna hodnota rozdielu hodnôt dvoch premenných je mensia nez 100,

ABS(Y94-Y89) LT 100

MEAN(Z1 TO Z23) LE 23 priemerná hodnota z 23 hodnôt premenných mensia alebo rovná 23.

175

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Príkaz Recode into Same Kapitola IV

Variables

(ponuka Transform)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Recode into Same Variables prirauje mnozinám pôvodných hodnôt premennej nové hodnoty. Cesta Transform Recode Recode into Same Variables... Otvorí sa dialógový box s obsahom:

Obraz 1: Dialógový box Recode into Same Variables

Numeric Variables

Pole, do ktorého prenásame zo zoznamu premenných aktívneho súboru vybrané premenné - premenné, ktoré chceme modifikova. Podpríkazové tlacidlo otvorí dialógový subbox If Cases, v ktorom môzeme definova logické podmienky pre výber prípadov. Modifikované premenné budú definované v týchto podmienkach (rovnako ako v prípade príkazu Compute alebo Count).

If

Old and New Values Podpríkazové tlacidlo, ktoré otvorí subbox Old and New Values (pozri alej). Podpríkaz Old and Podpríkaz Old and New Values specifikuje spôsob vytvárania nových New Values variantov premennej alebo premenných:

176

Obraz 2: Dialógový subbox Old and New Values

Old Value

Pole pre definovanie starých (pôvodných) hodnôt, obsahujúce sedem prepínacov: Value System-missing System- or user-missing vstupné pole pre specifikovanú hodnotu, sytémová chýbajúca hodnota, systémová alebo uzívateská chýbajúca hodnota, Range interval hodnôt (pre numerické premenné), Range: Lowest through n rozpätie hodnôt od najnizsej prítomnej az po urcenú hodnotu n, Range: n through highest rozpätie hodnôt od urcenej hodnoty n az po najvyssiu prítomnú hodnotu, All other values vsetky ostatné hodnoty.

New Value

Pole s dvoma prepínacmi: Value System-missing vstupné polícko na vkladanie novej hodnoty, nová hodnota je definovaná ako systémová chýbajúca hodnota.

Old New

Rámcek obsahujúci informáciu o vzahu medzi starými a novými hodnotami (podpríkazové tlacidlá Add, Change a Remove fungujú standardným spôsobom, pozri vyssie).

177

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Príkaz Recode into Different Kapitola V

Variables

(ponuka Transform)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Recode into Different Variables transformuje poda stanoveného predpisu do novej (cieovej) premennej hodnoty premennej z aktívneho dátového súboru. Cesta Transform Recode Recode into Different Variable... Otvorí sa dialógový box Recode into Different Variable s nasledujúcim obsahom:

Obraz 1: Dialógový box Recode into Different Variables

Numeric Variable Output variable

Vybrané premenné z aktívneho súboru (ktoré chceme pouzi pri transformácii) vysvietime v avej casti boxu a po deklarovaní názvu novej premennej stlacíme tlacidlo s trojuholníckom a výsledok sa zapíse do rámceka Numeric Variable Output Variable. Rámcek s dvoma vstupnými poliami a podpríkazovým tlacidlom: Name vstupné pole pre názov novej premennej; meno novej premennej bude korespondova s aktuálne vysvieteným

178

Output Variable

Label Change If

menom starej premennej, obidve premenné sú toho istého typu, vstupné pole pre oznacenie novej premennej (maximálne 120 znakov), Podpríkazové tlacidlo zmeny.

Podpríkazové tlacidlo otvorí dialógový subbox If Cases, v ktorom môzeme definova logické podmienky pre výber prípadov. Modifikované premenné budú definované v týchto podmienkach (rovnako ako v prípade príkazu Compute alebo Count).

Old and New Values Podpríkazové tlacidlo, ktoré otvorí subbox Old and New Values (pozri alej). Podpríkaz Old and Podpríkaz Old and New Values specifikuje spôsob vytvárania nových New Values variantov premennej alebo premenných:

Obraz 2: Dialógový subbox Old and New Values

Old Value

Pole pre definovanie starých (pôvodných) hodnôt, obsahujúce sedem prepínacov: Value System-missing System- or user-missing vstupné pole pre specifikovanú hodnotu systémová chýbajúca hodnota, systémová alebo uzívateská chýbajúca hodnota, Range interval hodnôt (pre numerické premenné), Range: Lowest through n rozpätie hodnôt od naj nizsej prítomnej az po urcenú hodnotu n, Range: n through highest rozpätie hodnôt od urcenej hodnoty n az po najvyssiu prítomnú hodnotu, All other values vsetky ostatné hodnoty.

179

New Value

Pole s dvoma prepínacmi: Value System-missing vstupné polícko na vkladanie novej hodnoty, nová hodnota je definovaná ako systémová chýbajúca hodnota.

Old New

Rámcek obsahujúci informáciu o vzahu medzi starými a novými hodnotami (podpríkazové tlacidlá Add, Change a Remove fungujú standardným spôsobom, pozri vyssie). Ak majú by výstupné premenné textové, aktivujeme tento prepínac; sírku premenných môzeme voli z intervalu 1 az 255 znakov a vlozi do vstupného poa Width. Ak sú vstupné premenné textové a chceme ich konvertova na numerické premenné, zapneme prepínac (v zátvorke je ukázka konverzie hodnoty textovej premennej '5' na numerickú hodnotu 5).

Output variables are strings

Convert numeric strings to numbers

180

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VI Príkaz Frequencies

(ponuka Analyze, Descriptive Statistics)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Frequencies umozuje riesi tri okruhy úloh: - vytvára tabuky prvého stupa triedenia - graficky zobrazi distribúcie - vypocíta deskriptívne statistiky jednotlivých numerických a alfanumerických premenných. Analyze Descriptive Statistics Frequencies...

Cesta

Príkaz Frequencies Príkaz otvorí dialógový box Frequencies, ktorý obsahuje:

Obraz 1: Dialógový box Frequencies

Variable(s)

Zoznam premenných v avej casti boxu ponúka vsetky numerické a krátke alfanumerické (textové) premenné aktívneho dátového súboru. Z neho presunieme do rámceka Variable(s) vsetky premenné, ktoré chceme spracova. Preddefinovaná voba pozaduje zobrazenie frekvencných tabuliek. Standardný výstup frekvencnej tabuky zacína názvom premennej a ak je definovaný, aj opisom premennej. Prvý stpec tabuky (Value Label) opisuje hodnoty premennej, zapísané do druhého stpca

181

Display frequency tables

(Value). Pocet jednotiek urcitej kategórie je uvedený v treom stpci (Frequency). Podiel jednotiek danej kategórie voci celému súboru jednotiek, vyjadrený v percentách sa nachádza vo stvrtom stpci (Percent). Percentuálny podie jednotiek urcitej kategórie, vypocítaný zo základu súboru valídnych jednotiek je zapísaný do piateho stpca (Valid Percent). Za valídne jednotky (Valid Cases) povazujeme tie jednotky, ktoré nemajú hodnotu analyzovanej premennej oznacenú ako chýbajúcu hodnotu (Missing Value). Jednotky s chýbajúcou hodnotou nazývame v tomto kontexte chýbajúcimi jednotkami (Missing Cases). Posledný stpec tabuky (Cum Percent) obsahuje kumulatívne percentá v hraniciach súboru valídnych jednotiek. Riadky tabuky sú standardne usporiadané poda hodnôt premennej, u numerickej premennej vzostupne, u alfanumerickej premennej poda abecedného poriadku. Ako posledné sú uvedené chýbajúce hodnoty. Tri podpríkazové tlacidlá dialógového boxu Frequencies: Statistics Podpríkazové tlacidlo, ktoré otvorí dialógový subbox Frequencies Statistics (pozri nizsie) s ponukou deskriptívnych statistík. Podpríkazové tlacidlo, ktoré otvorí dialógový subbox Frequencies Charts (pozri nizsie) s moznosou specifikácie grafov. Podpríkazové tlacidlo, ktoré otvorí dialógový subbox Frequencies Format (pozri nizsie). Jeho prostredníctvom môzeme stanovi formu výstupnej tabuky. Podpríkaz Format otvorí dialógový subbox Frequencies Format, ktorý obsahuje:

Chart

Format

Podpríkaz Format

Obraz 2: Dialógový subbox Format

Order by V rámceku je ponuka styroch mozností usporiadania variantov premennej v tabuke: Ascending values usporiadanie variantov premennej vzostupne poda jej hodnôt alebo poda abecedného poriadku, Descending values usporiadanie variantov premennej zostupne poda jej hodnôt alebo poda obráteného abecedného poriadku, Ascending counts

182

usporiadanie variantov premennej od najmenej pocetného po najpocetnejsí, Descending counts usporiadanie variantov premennej od najpocetnejsieho po najmenej pocetný. Multiple Variables Rámcek poskytuje moznos voby medzi dvomi spôsobmi výstupu tabuliek z viacerých premenných: Compare variables forma výstupu, umozujúca porovnanie statistík viacerých premenných, Organize output by variables výstup je organizovaný osobitne pre kazdú premennú. Suppress tables with more then n categories tabuka je vytvorená v standardnej forme, pokia pocet variantov premennej neprevysuje specifikovanú hodnotu. V opacnom prípade je aplikovaná zhustená forma výstupu. Podpríkaz Statistics Podpríkaz Statistics otvorí dialógový subbox Frequencies Statistics, v ktorom sa nachádza:

Obraz 3: Dialógový subbox Statistics

Percentile Values

V tomto rámceku sú moznosti voby výpoctu percentilových hodnôt: Quartiles moznos zapnú podpríkaz pre výpocet kvartilov (25-ty, 50-ty a 75-ty percentil) Cut points for equal groups podpríkaz rozdelí súbor do pozadovaného poctu ekvidistantných skupín a vypocíta pre ne kvantily Percentiles

183

Central Tendency

s vyuzitím príkazového tlacidla Add zadáme zoznam hodnôt (medzi 0 a hodnotou 100), ku ktorým budú vypocítané kvantily. V tomto rámceku sú moznosti voby výpoctu opisných statistík úrovne (centrálnej tendencie): Mean - priemer, Median - medián, Mode - modus, Sum - súcet. Rámcek ponúka moznosti výberu medzi opisnými statistikami variability: Std. deviation - standardná odchýlka, Variance - rozptyl, Range - variacné rozpätie, Minimum - minimálna hodnota, Maximum - maximálna hodnota, S.E. mean - standardná chyba priemeru. Ponuka umozuje vypocíta základné charakteristiky tvaru distribúcie: Skewness - koeficient sikmosti a jeho standardná chyba, Kurtosis - koeficient spicatosti a jeho standardná chyba.

Dispersion

Distribution

Values are group Voba umozuje hodnotu premennej chápa a pouzi ako stred midpoints inervalu (výpocet kvantilov zohladuje a je ovplyvnený touto specifikáciou). Podpríkaz Charts otvorí dialógový subbox Frequencies Charts, ktorý obsahuje:

Podpríkaz Charts

Obraz 4: Dialógový subbox Charts

Chart Type

Chart Type V rámceku volíme medzi tromi alternatívami: None nepozadujeme ziaden graf,

184

Bar chart(s) pozadujeme stpcový diagram, respektíve viaceré stpcové diagramy; stpcový diagram je forma grafu rozdelenia pocetností najvhodnejsia pre kategorizované premenné horizontálna os grafu je osou kategórií (zobrazené sú len varianty premennej s nenulovou frekvenciou), Histogram(s) pre numerické premenné je mozné a väcsinou aj vhodné pozadova tvorbu histogramu - horizontálna os je tu osou intervalovou (dáta sú rozdelené do maximálne 21 intervalov); zapnutím voby With normal curve je do grafu vlozená normálna krivka definovaná empirickým priemerom a rozptylom. Axis Label Display Axis Label Display V tomto rámceku sa riesi otázka formy vertikálnej osi pre stpcové diagramy: Frequencies os je oznacená ako stupnica frekvencií, Percentages os je oznacená ako stupnica percentuálnych hodnôt. Po stlacení tlacidla Continue v subboxe sa vraciame do hlavného boxu, kde stlacením príkazového tlacidlá OK spustíme príkaz. Výsledky spracovania dát vo forme tabuliek a statistík sa objavia v aktívnom Output window.

185

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VII Príkaz Explore

(ponuka Analyze, Descriptive Statistics)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Explore poskytuje rozsiahlu ponuku mozností analýzy a grafického zobrazenia (závislých) premenných, aj poda rôznych podskupín vymedzených pomocou faktorov (nezávislých premenných); pocíta deskriptívne statistiky, robustné odhady úrovne, testy normality a homogenity rozptylov; vytvára frekvencné tabuky a výsledky prezentuje v rozmanitých formách grafov (histogram, krabickový a císlicový graf apod.); tiez identifikuje extrémne hodnoty. Cesta Analyze Descriptive Statistics Explore... Príkaz Explore otvorí dialógový box, ktorý má nasledujúci obsah:

Príkaz Explore

Obraz 1: Dialógový box Explore

Dependent List Factor List

Zoznam závislých (numerických) premenných tvoríme presunom názvov premenných z avej strany boxu. Zoznam faktorov (nezávislých premenných - môzu to by numerické alebo krátke ,,stringové" premenné) tvoríme tiez presunom názvov premenných z avej strany boxu. Na oznacenie prípadov s extrémnymi hodnotami môzeme pouzi

186

Label Cases by

zvolenú premennú. Display Rámcek s tromi rádiotlacidlami: Both zeláme si produkciu aj statistík aj grafov, Statistics zeláme si len výpocet statistík, Plots zeláme si len tvorbu grafov. Podpríkazové tlacidlo Statistics, ktoré otvorí dialógový subbox Explore Statistics na vobu statistík (pozri alej). Podpríkazové tlacidlo Plots, ktoré umozní v dialógovom subboxe Explore Plots specifikova nase poziadavky na tvorbu grafov (pozri alej). Podpríkazové tlacidlo Options, ktoré otvorí dialógový subbox Explore Options na urcenie spôsobu práce s chýbajúcimi hodnotami (pozri alej).

Statistics Plots

Options

Podpríkaz Statistics Podpríkaz Statistics otvorí dialógový subbox Explore Statistics, v ktorom definujeme nase poziadavky na výpocet statistík:

Obraz 2: Dialógový subbox Statistics

Descriptives

Aktivovaný stvorcek zabezpecuje výstup univariacných statistík: priemer s jeho intervalom spoahlivosti (hodnotu spoahlivosti v rozpätí 1 az 99.99% vkladáme do vstupného poa Confidence interval for Mean), medián, 5% useknutý priemer (priemer po vylúcení 5% najmensích a 5% najväcsích hodnôt), standardná chyba priemeru, rozptyl, standardná odchýlka, minimálna hodnota, maximálna hodnota, variacné a kvartilové rozpätie, koeficient sikmosti a koeficient strmosti s ich standardnými chybami. Výpocet M-odhadov (robustných maximálne vierohodných odhadov strednej hodnoty). Vypíse pä najmensích a pä najväcsích hodnôt ako extrémne hodnoty (Extreme Values).

187

M-estimators Outliers

Percentiles Podpríkaz Plots

Vypocíta nasledujúce percentily: 5, 10, 25, 50, 75, 90 a 95. Podpríkaz Plots otvorí dialógový subbox Explore Plots, ktorý ponúka nasledujúce moznosti:

Obraz 3: Dialógový subbox Plots

Descriptive

Rámcek ponúka dva typy grafov: Stem-and-leaf Tvorba císlicového grafu - "stebla s listami". Císelné hodnoty premennej sú fixne rozdelené na dve casti císlic, na "steblo" a na "list". Císlicový graf je speciálny horizontálny stpcový graf, kde v "steble" sú obsiahnuté jednotlivé kategórie premennej a vpravo od nich sú ako "listy" jednotlivých hodnôt, ktoré tak vizuálne zobrazujú výskyt prípadov v príslusnej kategórii. Pod grafom je informácia o tom aká je sírka stebla a koko prípadov reprezentuje jeden list. Graf zobrazuje aj extrémne hodnoty. Histogram Tvorba histogramu - stpcového grafu vhodného pre spojité premenné (stpce, na rozdiel od stpcového diagramu, sú tu nakreslené tesne veda seba, keze intervaly na seba bezprostredne nadväzujú). Tvorba krabickového grafu (Box-and-wiskers plot - "krabicka s bokombradmi"). "Krabicka" je obdznik, ktorého vodorovné strany zodpovedajú dolnému a hornému kvartilu, spojnica vo vnútri obdznika oznacuje medián. Z "krabicky" hore i dole vychádzajú "bokombrady" (názov "krabicky s bokombradmi" vznikol z horizonálneho grafu, otoceného o pravý uhol). "Bokombrady" sú maximálne 1.5-krát dlhsie nez dzka "krabicky" - kvartilové rozpätie). Za nimi sú znázornené individuálne vybocujúce pozorovania (outliers). Zvlás vzdialené body, ktoré sú od kvartilu vzdialené viac nez trojnásobok kvartilovej odchýlky sa oznacujú ako extrémne hodnoty (extremes). Volíme jednu z troch mozností:

188

Boxplots

Factor levels together krabickové grafy (situované veda seba) jednej závislej premennej poda podskupín (komparácia jednej premennej v skupinách), Dependents together krabickové grafy (veda seba) viacerých závislých premenných (komparácia premenných v jednom grafe), None ziaden krabickový graf. Normality plots with tests Normálny graf (normal probability plot) - dvojrozmerný graf, kde na horizontále sú znázornené pozorované hodnoty a na vertikále ich ocakávané hodnoty z normálnej distribúcie. V prípade normality premennej ocakávame, ze body v grafe budú leza priblizne na priamke (diagonále). Testy normality - Shapiro-Wilkov test pre malé výbery (do 50 prípadov), - Lilliefors test (modifikovaný Kolmogorov Smirnovov test). V rámceku sú ponuky tvorby grafov "rozpätie versus poloha" a testovanie homogenity rozptylov Leveneovým testom.

Spread vs. Level with Levene Test

Podpríkaz Options Podpríkaz Options otvorí dialógový subbox Explore Options, v ktorom volíme spôsob práce s chýbajúcimi hodnotami:

Obraz 4: Dialógový subbox Options

Missing Values

V rámceku si vyberieme jednu z troch nasledujúcich mozností: Exclude cases listwise ak aspo jedna z analyzovaných premenných (závislých premenných alebo faktorov) má v urcitom prípade (v riadku v editore dát) systémovú alebo uzívateskú chýbajúcu hodnotu, prípad je vylúcený z analýzy, ci tvorby grafu, Exclude cases pairwise prípad s chýbajúcou hodnotou je vylúcený len z tej casti spracovania, do ktorej vstupuje chýbajúca hodnota, Report values prípady s chýbajúcimi hodnotami závislých premenných sú vylúcené zo spracovania a vo výstupe je o nich podaná informácia; chýbajúce hodnoty faktorov (ako také) sú zahrnuté do spracovania.

189

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola VIII Príkaz Crosstabs

(ponuka Analyze, Descriptive Statistics)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Crosstabs umozuje vytvori viacdimenzionálne kontingencné tabuky, pricom ako dimenzie tu môzu vystupova okrem základných premenných aj mnoziny viacnásobných odpovedí, ci mnoziny viacnásobných dichotómií. Cesta Analyze Descriptive Statistics Explore...

Príkaz Crosstabs

Príkaz Crosstabs otvorí dialógový box, ktorý obsahuje nasledujúce polozky:

Obraz 1: Dialógový box Crosstabs

Row(s)

Rámcek, do ktorého presunieme zo zoznamu v avej casti boxu vybrané riadkové (nespojité) premenné.

190

Column(s) Layers

Rámcek, do ktorého presunieme vybrané stpcové (nespojité) premenné. Na zadanie treostupových a viacstupových tabuliek pouzijeme prostriedky v tomto rámceku Previeus a Next. Pokyn k tvorbe klastrových stpcových grafov. Aktívny stvorcek zrusí príkaz na tvorbu tabuliek. Príkazové tlacidlo, ktorým otvoríme dialógový subbox Crosstabs Statistics (pozri alej). Príkazové tlacidlo, ktorým otvoríme dialógový subbox Crosstabs Cell Display (pozri alej). Príkazové tlacidlo, ktorým otvoríme dialógový subbox Crosstabs Table Format (pozri alej).

Display clustered Bar charts Suppres tables Statistics Cells Format

Podpríkaz Statistics Podpríkaz Statistics otvorí dialógový subbox Crosstabs Statistics s nasledujúcou ponukou:

Obraz 2: Dialógový subbox Statistics

Chi-square

Chí-kvadrát statistika - testuje hypotézu o nezávislosti riadkovej a stpcovej premennej. Statistika chí-kvadrát tu vystupuje v dvoch formách, (bezný) Pearson chi-square a ako alternatíva Likelihood Ratio chi-square zalozený na teórii maximálnej vierohodnosti (pre väcsie výbery sú výsledky obidvoch testovacích kritérií vemi podobné). Vo výstupe je informácia o výskyte nízkych hodnôt

191

ocakávaných pocetností (expected number of observations) ocakávaných v prípade platnosti hypotézy o nezávislosti. Mantel-Haenszel chi-square je asia chí-kvadrát statistika. Meria lineárny vzah medzi dvomi poradovými premennými kontingencnej tabuky. D.F. (stupne vonosti) je parameter distribúcie chí-kvadrát. Jeho hodnota tu závisí na pocte riadkov a stpcov kontingencnej tabuky. Signifikancia je minimálna hladina, na ktorej este mozno zamietnu hypotézu o nezávislosti. Correlations Nominal Data Aktívny stvorcek zabezpecuje výpocet tradicného Pearsonovho koeficientu korelácie pre dve kvantitatívne premenné. V rámceku je ponuka mier asociácie medzi dvomi nominálnymi premennými: Contingency coefficient (koeficient kontingencie), Phi and Cramer´s V, Lambda, Uncertainely coefficient (koeficient zalozený na miere neurcitosti). V rámceku sú miery vzahu medzi dvomi ordinálnymi premennými: Gamma, Somer´s d, Kendall´s tau-b, Kendall´s tau-c.

Ordinal Data

Nominal by Interval Miera závislosti Eta (korelacný pomer). Kappa Risk McNemar Cochran´s and Mantel-Haenszel Statistics Podpríkaz Cells Cohenova kappa - miera zhody hodnotenia (posudzovania). Relatívne riziko (pri stúdiu kohort, pri retrospektívnych alebo prospektívnych stúdiách), pre tabuku 2x2. Neparametrický test pre dva závislé výbery. Testovanie nezávislosti medzi dvoma dichotomickými premennými v definovaných podmienkach, fixovaných alsími nominálnymi premennými. Podpríkaz Cells otvorí dialógový subbox Crosstabs Cell Display, v ktorom sa nachádzajú nasledujúce moznosti voby výpoctu hodnôt pre bunky: Výber dvoch druhov pocetností pre ich vyjadrenie v bunkách: Observed empirické (pozorované) pocetnosti, Expected teoretické pocetnosti - pocetnosti ocakávané v prípade platnosti hypotézy o nezávislosti premenných.

Counts

192

Obraz 3: Dialógový subbox Cell Dislplay

Percentages

Výber troch druhov percentuálnych hodnôt: Row riadkové percenta Column stpcové percenta Total percentá z celku. Formy reziduálnych pocetností - diferencie medzi pozorovanými a ocakávanými pocetnosami v jednotlivých bunkách: Unstandardized nestandardizované reziduálne pocetnosti, Standardized standardizované reziduálne pocetnosti, Adj. standardized adjustované reziduálne pocetnosti. Podpríkaz Format otvorí dialógový subbox Crosstabs Table Format, v ktorom volíme parametre formy výstupu tabuliek:

Residuals

Podpríkaz Format

Obraz 4: Dialógový subbox Table Format

Row Order

Rámcek umozuje nastavenie usporiadania riadkov v kontingencnej tabuke: Ascending hodnoty riadkovej premennej budú usporiadané vzostupne, Descending hodnoty riadkovej premennej budú usporiadané zostupne.

193

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Kapitola IX Príkaz Means

(ponuka Analyze, Compare Means)

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príkaz Means pocíta deskriptívne jednorozmerné statistiky kvantitatívnych (závislých) premenných v podskupinách, definovaných pomocou jednej alebo viacerých kategorizovaných (nezávislých) premenných. Cesta Analyze Compare means Means... Príkaz Means otvorí dialógový box Means s nasledujúcou ponukou:

Príkaz Means

Obraz 1: Dialógový box Means

Counts

Výber dvoch druhov pocetností pre ich vyjadrenie v bunkách: Observed empirické (pozorované) pocetnosti, Expected teoretické pocetnosti - pocetnosti ocakávané v prípade platnosti hypotézy o nezávislosti premenných. Rámcek, do ktorého presunieme vybrané závislé premenné (dependent variables). Tieto premenné chceme prostredníctvom ich deskriptívnych statistík porovnáva z pohadu rôznych podskupín.

194

Dependent List

Independent List Previos a Next Options Podpríkaz Options

Rámcek s deklarovanými nezávislými (skupinotvornými) premennými (independent variables) na prvej úrovni. Tlacidlá umozujúce pracova s alsími úrovami nezávisle premennných. Podpríkazové tlacidlo. Podpríkaz Options otvorí dialógový subbox Means Options, obsahuje:

Obraz 2: Dialógový subbox Options

Statistics

V rámceku je ponuka deskriptívnych jednorozmerných statistík, ktoré budú vypocítané pre kazdú definovanú kategóriu definovanú nezávislými premennými: Sum Number of Cases Mean Median Std. Error of Mean Minimum Maximum Range First Last Standard Deviation Variance Kurtosis Std. Error of Kurtosis

195

spolu hodnôt, pocet prípadov, priemer, medián, standardná chyba priemeru, minimálna hodnota, maximálna hodnota, variacné rozpätie, prvá hodnota závisle premennej, posledná hodnota závisle premennej, standardná odchýlka, rozptyl, koeficient strmosti, stand. chyba koef. strmosti,

Skewness Std. Error of Skewness Percentage of Total Sum Percentage of Total N Geometric Mean Harmonic Mean Statistics for First Layer

koeficient asymetrie , stand. chyba koef. asymetrie, percenta z celkovej sumy, percenta z celkového poctu, geometrický priemer, harmonický priemer.

Výstupy pre závisle premenné a nezávisle premenné z prvej úrovne: ANOVA table and eta pokyn k tvorbe tabuliek jednoduchej analýzy rozptylu pre urcené závisle premenné versus nezávisle premenné (len z prvej úrovne). Podpríkaz tiez vypocíta koeficient determinácie eta a jeho kvadrát. Test of linearity pre dvojicu - závisle premennú a nezávisle premennú (tiez numerickú) z prvej úrovne vypocíta okrem predchádzajúceho este test linearity, koeficient lineárnej korelácie (R) a jeho kvadrát (R Squared).

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Odporúcaná literatúra Literatúra vhodná pre alsie vzdelávanie v oblasti aplikácie SPSS: Bártová a ehák 1993, Kähler 1990, Norusis 1991, 1993 a 1999, Ritomský a Hankes 1994, Ritomský 1998.

196

Záverecné zhrnutie Ctená citateka, citate! Pomerne podrobne si presla, presiel úlohami deskripcie dát. Zijem v nádeji, ze a text oslovil. Ze más cistejsiu predstavu o témach a spôsoboch analýzy dát. Ukázali sme si, co sa a za akých podmienok dá s dátami zmysluplne robi. Z meritórneho hadiska je zásadnou otázkou s akým typom premenných pracujeme. A alej, ci nás koncept smeruje iba k jednému súboru, vtedy je rec o univariacnej, bivariacnej (vzahovej) analýze (ním sme sa venovali) alebo multivariacnej analýze. Ak je nasim zámerom empiricky skúma viacero súborov, uplatníme metódy porovnávacej (komparacnej) analýzy. Tie jednoduchsie komparacné metódy sme si mali moznos osvoji. Sírka a hbka prebraných otázok slúzi ako základ, na ktorom je mozné vrstvi alsie poznatky - jednak poznatky o multivariacnej analýze (vzahovej analýze skupiny premenných v jednom súbore) a o nárocnejsích metódach komparacnej analýzy, jednak vedomosti a spôsob usudzovania, ktorému sa hovorí statistická inferencia (usudzovanie z výberového ­ reprezentatívneho súboru na celú skúmanú populáciu). Stýl práce s pocítacovým statistickým systémom sa dobre osvojuje pri riesení jednoduchsích úloh analýzy dát. Predpokladám, ze aj Ty teraz, milý citate, oceujes význam takého nástroja, akým je SPSS. A mozno mi dás za pravdu, ak poviem, ze práca s ním nie je komplikovaná. Uznávam, ze analýza dát nebýva ,,prechádzkou ovocným sadom". Ale, ver mi, ze nezriedka prichádzajú krásne chvíle satisfakcie za tvrdú prácu, chvíle ,,zberu zdravého a savnatého ovocia". Zelám Ti co najviac takých chví (mozno si vtedy spomenies na moje slová) ...

197

198

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príloha

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

V prílohe sú uvedené: 1. otázky z výskumu rodín a domácností na Slovensku (1999), 2. spôsob kódovania odpovedí a pocítacové atribúty premenných, 3. frekvencné tabuky.

199

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Spolocné bývanie viacerých rodín Otázka v dotazníku

.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

1. ,,Na Slovensku nie je zriedkavosou, ke v jednej domácnosti býva viacero rodín. Aký je Vás názor na spolocné bývanie viacerých rodín v jednej domácnosti - je to výhodné?"

1 = je jednoznacne výhodné, prinása pre vsetkých len výhody 2 = prinása síce isté problémy, ale z celkového pohadu je výhodné 3 = prinása dos problémov, ale v urcitom období je takýto spôsob bývania najvýhodnejsí 4 = prinása viac problémov ako výhod 5 = je jednoznacne nevýhodné - prinása vsetkým len problémy 6 = iný názor, aký? 9 = nevie ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ spolbyv Spolocné bývanie viacerých rodín v jednej domácnosti Measurement Level: Ordinal Format: F1 Value 1 2 3 4 5 6 9 Label je jednoznacne výhodné prinása isté problémy prinása dos problémov prinása vea problémov je jednoznacne nevýhodné iný názor neviem

Atribúty premennej

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Tabuka pocetností

Spolocné bývanie viacerých rodín v jednej domácnosti

Pocetnos je jednoznacne výhodné prinása isté problémy prinása dos problémov prinása vea problémov je jednoznacne nevýhodné iný názor neviem Spolu

46 160 247 290 263 12 12 1030

%

4,5 15,5 24,0 28,2 25,5 1,2 1,2 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Veková hranica pre odchod do dôchodku Otázka v dotazníku

.

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

2. ,,Na Slovensku je veková hranica pre odchod do dôchodku 60 rokov a menej. Vo viacerých krajinách je tento vek vyssí. Do akej miery

200

súhlasíte alebo nesúhlasíte s tým, aby bola na Slovensku zvýsená veková hranica odchodu do dôchodku?"

1 = úplne súhlasím 2 = skôr súhlasím 3 = skôr nesúhlasím 4 = vôbec nesúhlasím 9 = nevie ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej odchdoch Vekovú hranicu odchodu do dôchodku treba zvýsi Measurement Level: Ordinal Format: F1 Value Label 1 úplne súhlasím 2 skôr súhlasím 3 skôr nesúhlasím 4 vôbec nesúhlasím 9 neviem ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tabuka pocetností

Vekovú hranicu odchodu do dôchodku treba zvýsi

Pocetnos úplne súhlasím skôr súhlasím skôr nesúhlasím vôbec nesúhlasím neviem Spolu

29 70 210 688 33 1030

%

2,8 6,8 20,4 66,8 3,2 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Vysporiadanie dedicských zálezitostí

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku

3. ,,Teraz by sme chceli pozna Vás názor na mozno trochu neobvyklú tému - riesenie dedicských zálezitostí. Co si myslíte, je alebo nie je vhodné vysporiada dedicské zálezitosti este pocas zivota?"

1 = je dobré, ak si udia jasne vysporiadajú dedicstvo este pocas svojho zivota (testamentom, prepisom majetku...) 2 = ak sú v rodine dobré vzahy, nie je potrebné vysporiada dedicstvo pocas zivota, ale pri zlých vzahoch by to bolo vhodné 3 = nie je vhodné, ak sa udia zaujímajú o dedicské zálezitosti pocas zivota, treba to ponecha na ich dedicov 4 = iný názor, aký? anketár, vypíste! 9 = neviem, nemám na to vyhranený názor ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ dedic Je vhodné vysporiada dedicské zálezitosti este pocas zivota Measurement Level: Ordinal Format: F1 201

Atribúty premennej

Value Label 1 áno 2 je to relatívne 3 nie 4 iný názor 9 nevie ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tabuka pocetností

Je vhodné vysporiada dedicské zálezitosti este pocas zivota?

Pocetnos áno je to relatívne nie iný názor neviem Spolu

594 224 122 6 84 1030

%

57,7 21,7 11,8 ,6 8,2 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Súcasná príjmová situácia domácnosti

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku

4. ,,Pokúste sa, prosím, zhodnoti, aká je súcasná príjmová (financná) situácia Vasej domácnosti?"

1 = príjmy stacia na vsetko 2 = príjmy stacia na vsetko, ale hospodárime úsporne 3 = musíme vea setri, aby sme si mohli kúpi drahsie veci 4 = máme dos peazí len na nákup najlacnejsích vecí 5 = peniaze stacia len na základné potraviny 6 = nemáme dos peazí ani na nákup základných potravín 9 = nevie posúdi ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej finsit Súcasná financná situácia Vasej domácnosti? Measurement Level: Ordinal Format: F1 Value 1 2 3 4 5 6 9 Label príjmy stacia na vsetko príjmy stacia na vsetko, ale hospodárime úsporne musíme vea setri, aby sme si mohli kúpi drahsie veci máme dos peazí len na nákup najlacnejsích vecí peniaze stacia len na základné potraviny nemáme dos peazí ani na nákup základných potravín neviem to posúdi

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

202

Tabuka pocetností

Aká je súcasná financná situácia Vasej domácnosti?

Pocetnos príjmy stacia na vsetko príjmy stacia na vsetko, ale hospodárime úsporne musíme vea setri, aby sme si mohli kúpi drahsie veci máme dos peazí len na nákup najlacnejsích vecí peniaze stacia len na základné potraviny nemáme dos peazí ani na nákup základných potravín neviem to posúdi Spolu

27 246 306 158 219 42 32 1030

%

2,6 23,9 29,7 15,3 21,3 4,1 3,1 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Pocet clenov domácnosti

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 5. Pocet clenov domácnosti (vrátane respondenta a detí): ,,Koko osôb zije vo Vasej domácnosti vrátane Vás a detí?" Pod pojmom "domácnos" rozumieme: osoby bývajúce v jednom byte alebo rodinnom dome, ktoré spolocne hospodária, t.j. spolocne hradia hlavné výdavky domácnosti, ako strava, nájomné, údrzba bytu/domu a pod." Atribúty premennej

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ pocdom Pocet clenov domácnosti: Measurement Level: Scale Format: F2

Tabuka pocetností

Pocet clenov domácnosti:

Pocetnos 1 2 3 4 5 6 7 8 9 10 Spolu

101 215 221 271 148 47 16 6 3 2 1030

%

9,8 20,9 21,5 26,3 14,4 4,6 1,6 ,6 ,3 ,2 100,0

203

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Typ domácnosti

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku

6. Typ domácnosti respondenta:,,Mohli by ste mi, prosím, poda týchto mozností poveda, v akom type domácnosti zijete?"

1 = mladí udia (bezdetní, 1-2 dospelí, do 35 rokov) 2 = mladá domácnos (1-2 rodicia, deti prevazne vo veku do 7 rokov) 3 = bezná domácnos (1-2 rodicia, deti prevazne vo veku 7-18 rokov) 4 = dospelá domácnos (1-2 rodicia s prevazne dospelými demi) 5 = trojgeneracná domácnos (deti, 1-2 rodicia, 1-2 starí rodicia) 6 = starsia domácnos (1-2 dospelí vo veku 35-60 rokov, bez detí v domácnosti) 7 = starí udia (1-2 dospelí vo veku viac ako 60 rokov, bez detí v domácnosti) 8 = iná domácnos ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Atribúty premennej

typdom

Typ domácnosti respondenta: Measurement Level: Nominal Format: F1

Value Label 1 mladí udia 2 mladá domácnos 3 bezná domácnos 4 dospelá domácnos 5 trojgeneracná domácnos 6 starsia domácnos 7 starí udia 8 iná domácnos ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tabuka pocetností

Typ domácnosti respondenta:

Pocetnos mladí udia mladá domácnos bezná domácnos dospelá domácnos trojgeneracná domácnos starsia domácnos starí udia iná domácnos Spolu

30 107 239 274 108 93 157 22 1030

%

2,9 10,4 23,2 26,6 10,5 9,0 15,2 2,1 100,0

204

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Príjem domácnosti

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 7. Príjem domácnosti respondenta: ,,Mohli by ste mi, prosím, poveda priblizne aký bol celkový cistý príjem Vasej domácnosti v minulom mesiaci? Ide o súcet mesacných príjmov vsetkých clenov domácnosti, vrátane dôchodkov, prídavkov na deti, mimoriadnych príjmov (napr.z prenájmu casti domu) a pod."

1 = 31 000 Sk a viac 2 = 29 000 Sk - 30 999 Sk 3 = 27 000 Sk - 28 999 Sk 4 = 25 000 Sk - 26 999 Sk 5 = 24 000 Sk - 24 999 Sk 6 = 23 000 Sk - 23 999 Sk 7 = 22 000 Sk - 22 999 Sk 8 = 21 000 Sk - 21 999 Sk 9 = 20 000 Sk - 20 999 Sk 10 = 19 000 Sk - 19 999 Sk 11 = 18 000 Sk - 18 999 Sk 12 = 17 000 Sk - 17 999 Sk 13 = 16 000 Sk - 16 999 Sk 14 = 15 000 Sk - 15 999 Sk 15 = 14 000 Sk - 14 999 Sk 16 = 13 000 Sk - 13 999 Sk 17 = 12 000 Sk - 12 999 Sk 18 = 11 000 Sk - 11 999 Sk 19 = 10 000 Sk - 10 999 Sk 20 = 9 000 Sk - 9 999 Sk 21 = 8 000 Sk - 8 999 Sk 22 = 7 000 Sk - 7 999 Sk 23 = 6 000 Sk - 6 999 Sk 24 = 5 000 Sk - 5 999 Sk 25 = 4 000 Sk - 4 999 Sk 26 = 3 000 Sk - 3 999 Sk 27 = 2 000 Sk - 2 999 Sk 28 = menej ako 2 000 Sk 88 = nechce uvies 99 = nevie ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Atribúty premennej

prijdom

Príjem domácnosti respondenta: Measurement Level: Scale Format: F2

Value Label 1 31 000 Sk a viac 2 29 000 Sk - 30 999 Sk 3 27 000 Sk - 28 999 Sk .. ..................... 26 3 000 Sk - 3 999 Sk 27 2 000 Sk - 2 999 Sk 28 menej ako 2 000 Sk 88 nechce uvies 99 nevie ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

205

Tabuka pocetností

Príjem domácnosti respondenta:

Pocetnos 31 000 Sk a viac 29 000 Sk - 30 999 Sk 27 000 Sk - 28 999 Sk 25 000 Sk - 26 999 Sk 24 000 Sk - 24 999 Sk 23 000 Sk - 23 999 Sk 22 000 Sk - 22 999 Sk 21 000 Sk - 21 999 Sk 20 000 Sk - 20 999 Sk 19 000 Sk - 19 999 Sk 18 000 Sk - 18 999 Sk 17 000 Sk - 17 999 Sk 16 000 Sk - 16 999 Sk 15 000 Sk - 15 999 Sk 14 000 Sk - 14 999 Sk 13 000 Sk - 13 999 Sk 12 000 Sk - 12 999 Sk 11 000 Sk - 11 999 Sk 10 000 Sk - 10 999 Sk 9 000 Sk - 9 999 Sk 8 000 Sk - 8 999 Sk 7 000 Sk - 7 999 Sk 6 000 Sk - 6 999 Sk 5 000 Sk - 5 999 Sk 4 000 Sk - 4 999 Sk 3 000 Sk - 3 999 Sk 2 000 Sk - 2 999 Sk menej ako 2 000 Sk nechce uvies nevie Spolu

8 2 3 5 7 6 7 12 20 17 20 24 35 43 35 39 57 30 62 66 54 48 33 29 32 18 7 9 149 153 1030

%

,8 ,2 ,3 ,5 ,7 ,6 ,7 1,2 1,9 1,7 1,9 2,3 3,4 4,2 3,4 3,8 5,5 2,9 6,0 6,4 5,2 4,7 3,2 2,8 3,1 1,7 ,7 ,9 14,5 14,9 100,0

206

Údaje o respondentovi

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Pohlavie

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 8. Pohlavie:

1 = muz 2 = zena ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej pohl Pohlavie: Measurement Level: Nominal Format: F1 Value Label 1 muz 2 zena ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Tabuka pocetností

Pohlavie:

Pocetnos muz zena Spolu

512 518 1030

%

49,7 50,3 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Vek

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 9. Vek:

............ rokov ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej vek1 Vek: Measurement Level: Scale Format: F2 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

207

Tabuka pocetností

Vek:

Pocetnos 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55

49 21 13 16 14 18 16 21 25 18 17 19 22 15 20 38 30 27 23 19 29 18 11 24 17 27 22 17 16 14 17 14 15 11 22 14 15 17

%

4,8 2,0 1,3 1,6 1,4 1,7 1,6 2,0 2,4 1,7 1,7 1,8 2,1 1,5 1,9 3,7 2,9 2,6 2,2 1,8 2,8 1,7 1,1 2,3 1,7 2,6 2,1 1,7 1,6 1,4 1,7 1,4 1,5 1,1 2,1 1,4 1,5 1,7

Vek:

Pocetnos 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 82 84 85 87 89 Spolu

11 11 18 9 16 16 18 19 14 15 14 19 17 11 14 8 6 7 4 4 3 3 3 2 1 2 1 1 1 1 1030

%

1,1 1,1 1,7 ,9 1,6 1,6 1,7 1,8 1,4 1,5 1,4 1,8 1,7 1,1 1,4 ,8 ,6 ,7 ,4 ,4 ,3 ,3 ,3 ,2 ,1 ,2 ,1 ,1 ,1 ,1 100,0

208

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Vzdelanie

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 10. Vzdelanie: "Aké máte najvyssie ukoncené vzdelanie?"

1 = základné 2 = stredoskolské bez maturity (vyucený/á) 3 = stredoskolské s maturitou 4 = vysokoskolské ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej vzdel Vzdelanie: Measurement Level: Ordinal Format: F1 Value 1 2 3 4 Label základné stredoskolské bez maturity stredoskolské s maturitou vysokoskolské

Vzdelanie:

Tabuka pocetností

Pocetnos základné stredoskolské bez maturity stredoskolské s maturitou vysokoskolské Spolu

363 311 273 83 1030

%

35,2 30,2 26,5 8,1 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Národnos

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 11. Národnos:

1 = slovenská 2 = maarská 3 = iná ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej narod Národnos: Measurement Level: Nominal Format: F1 Value Label 1 slovenská 2 maarská 3 iná ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

209

Tabuka pocetností

Národnos:

Pocetnos slovenská maarská iná Spolu

890 109 31 1030

%

86,4 10,6 3,0 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Hlavné zamestnanie

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 12. ,,Zarate sa, prosím, do jednej z nasledujúcich kategórií poda Vásho hlavného zamestnania, t.j. poda pracovnej cinnosti, z ktorej máte rozhodujúci príjem peazí."

1 = nekvalifikovaný, pomocný manuálny pracovník v ponohospodárstve, priemysle, v sluzbách 2 = kvalifikovaný manuálny pracovník (remeselník, opravár, predavac, obsluha strojov a zariadení...) 3 = výkonný (stredoskolsky vzdelaný) odborný pracovník (pracovník v administratíve, zdravotník, vychovávate...) 4 = tvorivý (vysokoskolsky vzdelaný) odborný pracovník (technik, státny lekár, pedagóg, právnik, vedec, informatik, umelec...) 5 = riadite, námestník, politik... 6 = samostatne ekonomicky cinný (podnikate, zivnostník, súkromný lekár, súkromný právnik...) bez zamestnancov 7 = samostatne ekonomicky cinný (podnikate, zivnostník,...) so zamestnancami 8 = nepracujúci dôchodca 9 = student 10 = v domácnosti alebo na materskej dovolenke 11 = nezamestnaný 12 = iné, co? anketár, vypíste zamestnanie! ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Atribúty premennej

zamest

Zamestnanie: Measurement Level: Nominal Format: F2 Value 1 2 3 4 5 6 7 210 Label nekvalifikovaný, pomocný manuálny pracovník kvalifikovaný manuálny pracovník stredoskolsky vzdelaný odborný pracovník vysokoskolsky vzdelaný odborný pracovník riadite, námestník, politik... samostatne ekonomicky cinný bez zamestnancov samostatne ekonomicky cinný so zamestnancami

nepracujúci dôchodca student v domácnosti alebo na materskej dovolenke 11 nezamestnaný ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

8 9 10

Tabuka pocetností

Zamestnanie:

Pocetnos nekvalifikovaný, pomocný manuálny pracovník kvalifikovaný manuálny pracovník stredoskolsky vzdelaný odborný pracovník vysokoskolsky vzdelaný odborný pracovník riadite, námestník, politik... samostatne ekonomicky cinný bez zamestnancov samostatne ekonomicky cinný so zamestnancami nepracujúci dôchodca student v domácnosti alebo na materskej dovolenke nezamestnaný Spolu

99 192 176 59 3 33 12 255 54 40 107 1030

%

9,6 18,6 17,1 5,7 ,3 3,2 1,2 24,8 5,2 3,9 10,4 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Pocet obyvateov obce

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 13. Pocet obyvateov obce:

1 = menej ako 1 tisíc obyvateov 2 = 1 az 2 tisíc obyvateov 3 = 2 az 5 tisíc obyvateov 4 = 5 az 20 tisíc obyvateov 5 = 20 az 50 tisíc obyvateov 6 = 50 az 100 tisíc obyvateov 7 = Bratislava, Kosice ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Atribúty premennej katobc Pocet obyvateov obce: Measurement Level: Scale Format: F1 Value Label 1 menej ako 1 tisíc 2 1 az 2 tisíc 3 2 az 5 tisíc 4 5 az 20 tisíc 5 20 az 50 tisíc 6 50 az 100 tisíc 7 Bratislava, Kosice ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

211

Tabuka pocetností

Pocet obyvateov obce:

Pocetnos menej ako 1 tisíc 1 az 2 tisíc 2 az 5 tisíc 5 az 20 tisíc 20 az 50 tisíc 50 az 100 tisíc Bratislava, Kosice Spolu

144 176 126 180 167 120 117 1030

%

14,0 17,1 12,2 17,5 16,2 11,7 11,4 100,0

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Kraj

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Otázka v dotazníku 14. Kraj:

1 = Bratislavský 2 = Trnavský 3 = Trenciansky 4 = Nitriansky 5 = Zilinský 6 = Banskobystrický 7 = Presovský 8 = Kosický ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Atribúty premennej

kraj

Kraj: Measurement Level: Nominal Format: F2 Value Label

1 Bratislavský 2 Trnavský 3 Trenciansky 4 Nitriansky 5 Zilinský 6 Banskobystrický 7 Presovský 8 Kosický ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

212

Tabuka pocetností

Kraj:

Pocetnos Bratislavský Trnavský Trenciansky Nitriansky Zilinský Banskobystrický Presovský Kosický Spolu

93 107 120 145 137 138 144 146 1030

%

9,0 10,4 11,7 14,1 13,3 13,4 14,0 14,2 100,0

213

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Literatúra

­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ ARON,A. ­ Aron E.: Statistics for Psychology (2nd Ed). New Jersey 1999. BÁRTOVÁ,I. - EHÁK,J.: Základy SPSS/PC+. Praha, SC&C 1993. BOOTH,D.,J.: A First Course In Statistics (2nd Ed). London, DP Publications 1992. CLAUSS,G.- EBNER,H.: Základy statistiky pre psychológov, pedagógov a sociológov. Bratislava, SPN 1988. CYHELSKÝ,L.: Teorie statistiky I, Praha, SNTL 1990. CYHELSKÝ,L. ­ KAHOUNOVÁ,J. ­ HINDLS,R.: Elementární statistická analýza. Praha, Management Press 1996. DIAMANTOPOULOS,A., SCHLEGELMILCH,B.B.: Taking the Fear Out of Data Analysis. A Step-by-Step Approach. London, The Dryden Press 1997. DISMAN,M.: Jak se vyrábí sociologická znalost. Praha, Karolinum 1993. GAVORA,P.: Kvalitatívny výskum v pedagogike. Výchova a vzdlávání, roc.1, 1990-91, c. 8, s. 170-172.. GAVORA,P.: Výskumné metódy v pedagogike. Bratislava, Univerzita Komenského 1996. HANOUSEK,J.- CHARAMZA,P.: Moderní metody zpracování dat.(Matematická statistika pro kazdého). Praha, Educa´99 1992. HEIMAN,G.,W.: Research Methods in Psychology. Boston, Houghton Mifflin Company 1995. HIRNER,A.: Ako sociologicky analyzova. Bratislava, Ústav skolských informácií 1976. HOWELL,D.,C.: Statistical Methods for Psychology (2nd Ed). Boston, PWS-KENT Publishing Company 1987. JANOUSEK,J. a kol.: Metody sociální psychologie. Praha, SPN 1986. KALOUS,J.: Vyuzití statistiky v pedagogickém vyzkumu. In: Skalková, J. a kol.: Úvod do metodologie a metod pedagogického výzkumu. Praha, SPN 1983. KÄHLER,W.: Statistiche datenanalyse mit SPSS/PC+. Braunschweig, Vieweg 1990. KÄHLER,W.: Einführung in die Statistiche Datenanalyse. Braunschweig, Vieweg 1995. KERLINGER,F.N.: Základy výzkumu chování. Pedagogický a psychologický výzkum. Praha, Academia 1972. LINDQUIST,E.,F.: Statistická analýza v pedagogickém výzkumu. Praha, SPN 1967. MARSÁLOVÁ,L.: Metodologické základy psychologického výskumu. Bratislava, Psychodiagnostické a didaktické testy 1985. MARSÁLOVÁ,L. - MIKSÍK,O. a kol.: Metodológia a metódy psychologického výskumu. Bratislava, SPN 1990. McCLAVE,J.,T. - DIETRICH,F.,H.: Statistics. San Francisco, London, Division of Macmillan, Inc. 1988. MITTENECKER,E.: Plánování a statistické hodnocení experiment. Praha, SPN 1968. NORUSIS,M.,J.: SPSS/PC+ V4.0 (Base Manual). Chicago, SPSS Inc. 1991. NORUSIS,M.,J.: SPSS for Windows. Base System User´s Guide, Release 9.0. Chicago, SPSS Inc. 1999. NORUSIS,M.,J.: SPSS for Windows. Syntax System User´s Guide, Release 6.0. Chicago, SPSS Inc. 1993. NOWAK,S.: Metodologie sociologických výzkum. Obecné problémy. Praha, Nakladatelství Svoboda 1975. PELIKÁN,J.: Základy empirického výzkumu pedagogických jev. Praha, Karolinum 1998.

214

RADICOVÁ,I.: Typologická metóda v sociológii. Bratislava, Univerzita Komenského 1991. RADICOVÁ,I.: Krízne cesty sociálneho poznania. Bratislava, Katedra politológie FFUK 1996. REISENAUER,R.: Metody matematické statistiky. Praha, SNTL ­ Práce, 2.vyd., 1970. RITOMSKÝ,A.: Statistické spracovanie pedagogických výskumných dát pocítacom. Pedagogická revue, roc. 46, 1994, c.9-10, s.475-493. RITOMSKÝ,A. ­ HANKES,L.: SPSS pre Windows. Bratislava, CTS 1994. RITOMSKÝ,A.: Základné funkcie SPSS. Bratislava, Univerzita Komenského 1998. RITOMSKÝ,A.: Deskripcia dát pomocou systému STATISTICA. Bratislava, Katedra psychológie FFUK 1998. ÍCAN,P.: Úvod do psychometrie. Bratislava, Psychodiagnostické a didaktické testy 1977. SWOBODA,H.: Moderní statistika. Praha, Svoboda 1977. STUKOVSKÁ,M.: Metódy merania korelácie I. Vzah medzi dvoma kvantitatívnymi znakmi. Informácie Slov. Dem. Stat. Spol. pri SAV, 6, 1973, 3-4, s. 28-37. STUKOVSKÝ,R.: Súcasné smery v statistických metódach. Informácie Slov. Dem. Stat. Spol. pri SAV, 6, 1973, 1-2, s. 42-50. STUKOVSKÝ,R. - PALÁT,M.: Exkurzie do klinickej statistiky I. Statistika ako náuka o metódach zvládnutia variability. Rehabilitácia, roc. 8, 1975, s. 43-52. STUKOVSKÝ,R. - PALÁT,M.: Exkurzie do klinickej statistiky II. Zaobchádzanie s desatinnými císlami. Rehabilitácia, roc. 8, 1975, s. 107-114. STUKOVSKÝ,R. - PALÁT,M.: Exkurzie do klinickej statistiky III. Jeden súbor a jeho intervalové triedenie. Rehabilitácia, roc. 8, 1975, s. 155-166. STUKOVSKÝ,R. - PALÁT,M.: Exkurzie do klinickej statistiky IV. Problém poctu stupov vonosti ­ princípy a pouzitie. Rehabilitácia, roc. 8, 1975, s. 217-230. SVEC,S. a kol.: Metodológia vied o výchove. Kvantitatívno-scientistické a kvalitatívnohumanistické prístupy v edukacnom výskume. Bratislava, IRIS 1998. TROPPER,R.: The Interpretation of Data. An Introduction to Statistics for the Behavioral Sciences. London. Brooks/Cole Publishing Company 1998. WONNACOT,T.,H. - WONNACOT,R.,J.: Statistika pro obchod a hospodáství. Praha, Victoria Publishing 1992.

215

Information

215 pages

Report File (DMCA)

Our content is added by our users. We aim to remove reported files within 1 working day. Please use this link to notify us:

Report this file as copyright or inappropriate

686244