01

Základní statistické pojmy

Vymezení pojmů statistika, populace a výběr

  1. 1 Statistika a její členění
  2. 2 Populace a výběr
  3. 3 Znáhodňování výběru
  4. 4 Statistický pokus a statistické šetření

1 Statistika a její členění

  • Statistika a její členění

Statistika je matematická disciplína zabývající se sběrem, prezentací, analýzou a interpretací dat. Daty rozumíme údaje, které slouží k popisu jevů nebo vlastností pozorovaných objektů. Můžeme je získat měřením nebo pozorováním. (Informací se data stávají až v okamžiku, kdy mohou ovlivnit chování příjemce). Statistiku, jako řadu jiných vědních disciplín, můžeme rozdělit na teoretickou (matematická statistika) a aplikovanou. Matematická statistika se zabývá výzkumem a popisem nových metod, zatímco aplikovaná statistika tyto metody používá v konkrétních situacích v různých oborech lidské činnosti, například v přírodních či společenských vědách, v politice nebo v lékařství.

Slovo statistika může mít různý význam. Jednak, jak již bylo uvedeno, označuje vědní disciplínu, ale používá se také k označení určité vlastnosti sledované veličiny (např. aritmetický průměr je jedním z možných vyjádření její střední hodnoty, směrodatná odchylka vyjadřuje její variabilitu a obě veličiny jsou statistiky) nebo k označení souhrnu údajů (např. zdravotnická statistika je souhrn údajů popisujících zdravotní stav obyvatelstva). Samo jméno statistika vzniklo k označení metod popisujících a shrnujících údaje potřebné k řízení státu.

Stejně jako lékařství má mezi vědními disciplinami zvláštní postavení (řada přírodovědců stále považuje lékařství spíše za umění než vědu) má i statistika aplikovaná do medicíny určité specifické rysy, které opravňují i užití zvláštního označení této disciplíny. Jako nejvhodnější nám připadá označení Lékařská statistika. Jako jiné aplikované statistiky můžeme i lékařskou statistiku rozdělit na dvě základní části:

  • Statistiku deskriptivní, zabývající se numerickým nebo grafickým popisem získaných dat
  • Statistiku inferenční neboli induktivní, která se používá k vyhledávání zákonitostí v datech naměřených na vzorku jedinců nebo objektů a zobecňováním těchto zákonitostí na skupinu, z níž byl vzorek vybrán. Inferenční statistika vychází z počtu pravděpodobnosti.

Dříve než se budeme zabývat podrobnostmi, uvedeme základní pojmy, usnadňující pochopení probírané látky.


2 Populace a výběr

Jednotky statistického šetření (statistické jednotky)
Statistické jednotky jsou objekty, jejichž vlastnosti chceme zkoumat. Dohromady tvoří statistický soubor.
Př.: osoby, krvinky, města, státy, hmotnosti, úrazy


Statistický soubor
Statistický soubor je množina prvků, statistických jednotek, definovaná pro účely statistického šetření. Prvky musí být VĚCNĚ, PROSTOROVĚ a ČASOVĚ vymezeny, a to tak, abychom o libovolném objektu mohli rozhodnout, zda do daného statistického souboru patří nebo nepatří.


Př.: studenti přijatí na lékařskou fakultu v Hradci Králové v letech 1997 – 1999


Vymezení
věcné prostorové časové

Základní soubor (POPULACE)
Základní soubor je úplná množina prvků, jejichž vlastnosti chceme zjistit. Může být konečný (např. obézní děti školního věku ve východočeském regionu) nebo nekonečný (např. opakovaná měření jedné veličiny za stejných podmínek).


Výběrový soubor (VÝBĚR, VZOREK)
Výběr je soubor, který obsahuje tu část prvků ze základního souboru, jejíž vlastnosti skutečně pozorujeme nebo měříme. Prvky výběru musí být vybrány náhodně nebo podle znaku, který nesouvisí se znakem vyšetřovaným (viz Metody provádění výběru).


Př.:

základní soubor výběrový soubor
všechny červené krvinky pacienta XY červené krvinky získané jedním odběrem krve pacienta XY

Proč bychom se ale měli spokojit se zkoumáním výběrového souboru? Nebylo by lepší provést příslušná měření na všech jednotkách populace? Výsledky takto získané by byly správné, přesto máme většinou velmi dobrý důvod spokojit se s průzkumem vzorku. Takovým důvodem může být například hledisko etické, finanční nebo časové (nemůžeme odebrat pacientovi všechnu krev, abychom zjistili, jestli jeho průměrná velikost červených krvinek je ve fyziologických mezích; nemáme dostatek prostředků ani času k tomu, abychom pro zkoumání vztahu mezi věkem a řídnutím vlasového porostu mužů bělošského typu spočítali všechny vlasy na hlavě všem příslušným mužům).


Data získaná na výběrovém souboru lze popsat metodami deskriptivní statistiky. Jestliže výběr prvků provedeme náležitým způsobem, můžeme z takto získaného vzorku pomocí nástrojů inferenční statistiky vyvodit závěry pro celou populaci.


3 Znáhodňování výběru

Metody provádění výběru

Pravděpodobnostní výběr – každý prvek základního souboru musí mít stejnou pravděpodobnost být vybrán.

Příklady způsobů pravděpodobnostního výběru:

  1. Náhodný výběr prostý
    • Provádí se losováním nebo pomocí generátoru (tabulek) náhodných čísel. V Excelu je generátor náhodných čísel v činnosti Analýza dat pod volbou Random Number Generation


  2. Výběr systematický (mechanický)
    • Prvkům základního souboru náhodně přidělíme pořadová čísla. Můžeme vybrat každý desátý prvek, každý prvek s pořadovým číslem končícím číslicí 5 apod.
    • Systematický výběr lze provést i tak, že vybereme osoby, jejichž příjmení začíná určitými písmeny nebo se narodily v určité dny. Příslušná písmena či dny vybereme náhodně.


  3. Výběr oblastní (stratifikovaný)
    • Základní soubor rozdělíme do několika podskupin. Z každé skupiny vybereme odpovídající počet prvků prostým náhodným nebo systematickým výběrem.

Př.: Základní soubor tvoří 100 000 mužů. Z toho 20 000 do 30 let, 50 000 od 30 do 60 let, 30 000 nad 60 let. Chceme vybrat 100 osob. Vybereme tedy 20 osob z 1. skupiny, 50 osob ze 2. skupiny a 30 osob ze 3. skupiny. Tento postup zaručí, že u znaků, podle nichž došlo k dělení do podskupin, bude stejné zastoupení ve výběru jako v základním souboru.


4 Statistický pokus a statistické šetření

Populaci můžeme vyšetřovat buď formou statistického pokusu nebo statistického šetření.


STATISTICKÝ POKUS

Pokus spočívá v tom, že sledujeme působení námi ovlivňovaných faktorů na vyšetřované znaky. Pokus obvykle provádíme tak, že vyšetřovanou skupinu rozdělíme na podskupinu pokusnou a kontrolní. Pokusnou skupinu vystavíme působení změněných faktorů (např. podání kyseliny acetylsalycilové při prevenci recidivy infarktu myokardu), u skupiny kontrolní změnu neprovedeme. Výsledky v obou skupinách vyhodnotíme a porovnáme. Je-li lékař, který vyhodocuje výsledky pokusu informován o tom, jak jsou pacienti do skupin rozděleni, jedná se o tzv. kontrolovaný pokus .
Jestliže pacient nebo lékař vyhodnocující výsledky pokusu neví, kdo je ve které skupině, jde o tzv. slepý pokus . V medicíně v naprosté většině případů pacient neví, ve které je skupině.
Neví-li lékař ani pacienti, do které skupiny byli zařazeni (např. zda berou lék nebo placebo), jedná se o dvojitě slepý pokus .



STATISTICKÉ ŠETŘENÍ

V případě, že není možné (nebo etické) provést pokus, můžeme využít metody statistického šetření neboli pozorovací studie, která spočívá v tom, že pozorujeme a zaznamenáváme, jak probíhají změny, aniž bychom podmínky sami plánovitě ovlivňovali.



RETROSPEKTIVNÍ A PROSPEKTIVNÍ STUDIE

Jiným hlediskem je, zda jsou studie retrospektivní nebo prospektivní. Retrospektivní studie se zabývá událostmi minulými, čili používáme hodnoty již v minulosti změřené. Při prospektivním přístupu naplánujeme, které objekty a subjekty budeme studovat a měřit. Při retrospektivní studii nemůžeme již data ovlivnit, při prospektivní se teprve rozhodujeme, jak a které zkoumané objekty či subjekty ovlivnit.



Blok 0101 - Základní pojmy statistiky - Příklady

(Pro zobrazení odpovědi klikni na otázku.)

1) V čem spočívá systematický výběr?

2) Která z následujících tvrzení o statistickém pokusu jsou pravdivá?
a) Statistický pokus spočívá v tom, že sledujeme působení námi ovlivňovaných faktorů na vyšetřované znaky.
b) Nazývá se též statistické šetření.
c) Statistický pokus spočívá v pozorování a zaznamenávání změn, aniž by pozorovatel plánovitě ovlivňoval podmínky.
d) Obvykle se provádí tak, že vyšetřovanou skupinu rozdělíme na pokusnou a kontrolní podskupinu. V pokusné skupině podmínky změníme, v kontrolní skupině ne. Výsledky porovnáme.


3) Která z následujících tvrzení o správně provedeném pravděpodobnostním výběru jsou pravdivá?
a) Při provádění náhodného výběru má každý prvek základního souboru stejnou pravděpodobnost být vybrán.
b) Systematický výběr provádíme tak, že prvky do výběru vybíráme podle znaku, který nesouvisí se znakem zkoumaným.
c) Náhodným výběrem prostým získáme výběr velikosti n tak, že vybereme prvních n prvků ze základního souboru.
d) Oblastní výběr provádíme tak, že základní soubor rozdělíme do několika podskupin a z každé z nich libovolným způsobem vybereme stejný počet prvků.
e) Náhodný výběr prostý lze provést losováním.


4) Co je to výběrový soubor?

5) Statistická jednotka je:

Kontrolní otázky: