-
Sběr dat
-
Kvalita dat
Dělení znaků
Při získávání dat často provádíme tyto činnosti:
- Klasifikaci
- Zařazení prvku do jedné ze dvou nebo více podskupin podle hodnoty zvoleného znaku
Př.: znak : rodinný stav
podskupiny: svobodný, ženatý (vdaná), rozvedený, vdovec (vdova)
- Uspořádání
- Vyjádření hodnoty znaku ve stupnici vytvořené podle předem dohodnutých pravidel
Př.: bodové ohodnocení závažnosti poranění
Stupnice může být tvořena čísly, písmeny abecedy nebo počtem křížků (+)
-
Měření
- Hodnotě znaku se přiřadí odpovídající hodnota na číselné ose
Př.: teplota, tlak krve
Klasifikace, uspořádání a měření je proces přiřazování určitého kódu (většinou čísla) nějakému znaku, tj. vlastnosti sledovaného děje nebo pozorovaných objektů. Podle toho, jaká pravidla pro přiřazení kódu výsledkům měření nebo pozorování použijeme, je můžeme zobrazit na různých měrných stupnicích (škálách).
Nejprve se ale věnujme jednotlivým typům znaků.
Znaky, tj. vlastnosti statistických jednotek, můžeme dělit různými způsoby.
Přehled dělení znaků uvádí následující obrázek.
Znaky určující
- umožňují rozpoznat, zda prvek do souboru patří nebo ne
Znaky zkoumané
Chceme-li zpracovat výsledky měření nebo pozorování, musíme správně rozlišit, jaký typ znaku zkoumáme, abychom pro zpracování výsledků vybrali odpovídající metodu.
Proto podle S. S. Stevense (známého také jako autora mocninové závislosti počitu na podnětu) znaky dělíme do těchto skupin:
- Znaky nominální
- mohou nabývat dvou (binární znaky) nebo více hodnot (množné znaky), ale nemá smysl mezi sebou porovnávat velikost těchto hodnot
Př.: znak binární: pohlaví, kuřák/nekuřák
znak množný: zaměstnání, rodinný stav, mezinárodní klasifikace nemocí
- Znaky pořadové (= ordinální)
- kategorie znaku lze mezi sebou porovnávat a určit jejich pořadí, ale nemá smysl provádět s nimi aritmetické operace, např. určovat jejich rozdíl
Př.: závažnost poranění: těžké, stření, lehké
spokojenost pacienta s léčbou: velmi spokojen, spíše spokojen, spíše nespokojen, nespokojen
- Znaky intervalové
- lze určit velikost rozdílu mezi libovolnými dvěma hodnotami znaku, ale nemá význam určovat jejich podíl
Př.: teplota ve stupnici Celsiově; mezi teplotou -10 °C a teplotou +10 °C je rozdíl 20 °C, ale podíl teplot = -1 nemá žádný smysl
- Znaky poměrové
- podíl dvou různých hodnot má reálný význam
Př.: osoba s hmotností 100 kg je dvojnásobně těžká než osoba s hmotností 50 kg.
Jiné dělení hodnot znaků je na
Kvantitativní data, tj. číselná vyjádření hodnoty znaku, mohou být
- nespojitá (diskrétní)
- spojitá
Nespojitá data jsou celá čísla a obvykle uvádějí počet (např. počet dětí v rodině, počet trombocytů). Spojitá data mohou nabývat libovolné hodnoty v určitém intervalu. Přesto často mají, vzhledem k rozlišení použité metody, charakter dat diskrétních (např. věk v rocích, tlak krve měřený tonometrem). Kvantitativní data někdy transformujeme na data ordinální (např. nízký, normální, vysoký krevní tlak; mikrocyt, normocyt, makrocyt).
Data kategorická jsou jejich opakem. Vyjádřují se pomocí hodnot znaků nominálních.
Data vyjádřená v ordinálních stupnicích se někdy nazývají jako semikvantitavní.
Měrné stupnice
Čtyři výše uvedené skupiny znaků (nominální, pořadové, intervalové a poměrové) se zobrazují na odpovídajících stupnicích podle předem stanovených jednoznačných pravidel
Nominální stupnice
umožňuje přiřadit kód hodnotě znaku
Př.: kuřák = 0, nekuřák = 1;
národnost: česká = 0, slovenská = 1, maďarská = 2
Ordinální (pořadová) stupnice
umožňuje uspořádat prvky podle hodnoty znaku, ale nikoli určit velikost rozdílů mezi nimi
Př.: základní škola, střední škola, vysoká škola; známkovací stupnice 1 – 5 nebo A – E
Intervalová stupnice
podle polohy libovolných dvou prvků můžeme určit, který z nich je větší a o kolik
nemá reálnou nulu, nulová hodnota je stanovena dohodou (poměr dvou hodnot nemá smysl)
Př.: teplota ve stupních Celsiových (tvrzení, že 10°C je –1 krát více než –10°C nedává smysl)
Poměrová stupnice
Poměr dvou hodnot má smysl, stupnice má reálnou nulu.
Př.:- hmotnost, výška, teplota v termodynamické stupnici (v Kelvinech)
Blok 0202 - Příklady - znaky a měrné stupnice
(Pro zobrazení odpovědi klikni na otázku.)
1)Kvalitativní data, u kterých nelze rozumným způsobem definovat pořadí, se nazývají?
nominální
2) Byla studována závislost mezi hladinou cholesterolu v krvi a věkem. Věk byl rozdělen do následujících kategorií: do 30 let, 30 - 39 let, 40 - 49 let, 50 - 59 let, 60 a více let.
Které řazení dat odpovídá pořadí stupnic nominální, ordinální a poměrová?
pohlaví, věk, hladina cholesterolu
3)Určete, o jaký typ znaku jde:
A) doba přežívání zubního implantátu
B) profese
C) s recidivou nemoci / bez recidivy
D) teplota ve stupních Celsia
E) počet hospitalizovaných osob
F) podváha / normální váha / mírná obezita / silná obezita
A) doba přežívání zubního implantátu - znak poměrový
B) profese - znak nominální
C) s recidivou nemoci / bez recidivy - znak nominální
D) teplota ve stupních Celsia - znak intervalový
E) počet hospitalizovaných osob - znak poměrový
F) podváha / normální váha / mírná obezita / silná obezita - znak ordinální
4) Znaky určující jsou?
Znaky, dle jejichž hodnot lze rozlišit, zda prvek patří do vyšetřované populace nebo ne.
5) Které z následujících znaků lze zobrazit na poměrové stupnici?
A) počet dětí v rodině
B) teplota ve stupních Fahrenheita
C) rodinný stav
D) krevní tlak nízký / normální / vysoký
E) tělesná výška
Počet dětí v rodině, tělesná výška.
Jednotka statistického šetření.
Kontrolní otázky: