Induktivní statistika

Úvod do testování hypotéz

  1. Testování hypotéz - základní pojmy

Testování hypotéz - základní pojmy

Ve statistice se hovoří o několika způsobech uvažování. První z nich je způsob deduktivní, který není nic jiného než použití matematiky k odvozování metod ve statistice. Dalším způsobem je myšlení induktivní, tj. zobecňující, jehož výsledkem jsou znalosti o celé studované populaci. Induktivní teorie se skládají z teorie odhadu a testování hypotéz.
V teorii odhadu je dána populace, ale nejsou známy její charakteristiky. Úkolem statistiky je tyto charakteristiky odhadnout tak, aby informace daná výběrem umožnila co nejlépe stanovit charakteristiky celé populace, čili vlastnosti výběru zobecnit na celou populaci.
Při testování hypotéz se nejprve uvede hypotéza o populaci a na základě vlastností výběru se buď rozhodneme o jejím přijetí nebo nepřijetí.

Příklad:
V učebnicích se dočteme, že průměrná velikost červených krvinek je 7,2 µm. Tím je míněn populační průměr. Zajímá nás, jestli je průměr velikosti erytrocytů u kuřáků stejný nebo jiný než 7,2 µm.
Provedeme náhodný výběr z populace kuřáků, ale výběrový průměr je velmi pravděpodobně jiný než průměr získaný z celé populace kuřáků a tento skutečný populační průměr se nikdy nedozvíme. To znamená, že samotná odlišnost výběrového průměru od toho teoretického průměru z literatury nám nic moc neřekne a musíme hledat jiný přístup pro rozhodnutí.
Rozhodovat se musíme mnohokrát denně. Občas děláme vážná rozhodnutí. Informací je někdy málo, přesto se musíme rozhodnout. Jen správný rozhodovací postup zajistí dobré rozhodnutí, protože v prostředí nejistoty to ideálně správné rozhodnutí nelze učinit pokaždé. Dva rozhodovací postupy mohou být různé, ale můžeme prohlásit, že jeden postup je lepší než druhý, pokud je to možné ověřit jejich kvalitu dlouhodobým a opakovaným použitím.

Základní pojmy lze dobře ilustrovat na příkladě:
Dítě ráno vstává a tvrdí, že je nemocné a nemůže jít do školy. Matka musí rozhodnout, zda je skutečně nemocné nebo se mu jen nechce do školy třeba kvůli diktátu. Změří dítěti teplotu. Když je teplota v pořádku, dítě je prohlášeno za zdravé. Pro rozhodnutí potřebujeme ale přesný postup. Musíme si předem stanovit, při jaké teplotě prohlásíme dítě za zdravé. Stanovíme si tedy, jak je obvyklé, že do 37 °C. Potom teplotu změříme a provedeme rozhodnutí.
Rozhodnutí může být správné ve dvou případech: když je dítě zdravé a má teplotu nižší než 37 °C nebo je nemocné a má teplotu větší nebo rovnu 37 °C.
Rozhodnutí může být chybné také ve dvou případech: jestliže je dítě zdravé a teplota je větší nebo rovna 37 °C nebo když je dítě je nemocné a teplota je menší než 37 °C.
A jak na to se statistickou terminologií? To, že dítě je zdravé, je hypotéza, které se říká nulová hypotéza. To, že dítě je nemocné, se nazývá alternativní hypotéza. Nulová hypotéza se vždy značí H0, alternativní Ha nebo H1.
Teplota, se kterou porovnáváme výsledky měření, se nazývá kritická hodnota. Výsledek měření nebo číslo vypočítané z výsledků měření a používané pro porovnání s kritickou hodnotou se nazývá testové kritérium. V našem příkladě je kritickou hodnotou 37 °C a změřená teplota je testové kritérium. Interval hodnot menších než kritická hodnota se nazývá obor přijetí, čímž je myšleno, že padne-li testové kritérium (zde naměřená teplota) do tohoto oboru, tak nulovou hypotézu nezamítneme. Hodnoty větší nebo rovné kritické hodnotě tvoří obor zamítnutí. Když mluvíme o oboru přijetí či zamítnutí, máme vždy na mysli nezamítnutí či zamítnutí nulové hypotézy, neboť to je hypotéza, kterou testujeme.

Chyba prvního druhu
Jestliže je dítě zdravé, čili platí nulová hypotéza, mohou nastat dva případy:

  1. Testové kritérium padne do oboru přijetí, přijmeme tedy nulovou hypotézu, že dítě je zdrávo a tím učiníme správné rozhodnutí.
  2. Testové kritérium padne do oboru zamítnutí, pak zamítneme nulovou hypotézu, že dítě je zdravé, přikloníme se tak k alternativní hypotéze, že dítě je nemocné, a tím učiníme chybné rozhodnutí.


Chyba druhého druhu
Jestliže je dítě nemocné, čili platí alternativní hypotéza, mohou též nastat dva případy:

  1. Testové kritérium padne do oboru zamítnutí, přijmeme tudíž alternativní hypotézu a tím učiníme správné rozhodnutí.
  2. Testové kriterium padne do oboru přijetí, přijmeme nulovou hypotézu, že dítě je zdravé, ale učiníme tím chybné rozhodnutí.

Taková chyba se nazývá chybou druhého druhu.
Začátečníkům se to často plete, pokročilým někdy také a statistikům, co jsou dlouho na penzi, se to už plete též. Proto je vhodné uspořádání do tabulky.


skutečnost
H0 Ha
Přijato H0 správně Chyba II.druhu
Ha Chyba I.druhu správně

Tuto terminologii je nutné si zapamatovat.
Základem je nulová hypotéza, proto se rozhodnutí, při němž zamítneme ve skutečnosti platnou nulovou hypotézu, nazývá chybou prvního druhu.
Určitá nezvyklost při formulaci nulové hypotézy je dána tím, že většinou vyjadřuje opak toho, co chceme prokázat. Chceme-li například prokázat, že lék A je účinnější než lék B, formulejme H0 tak, že řekneme, že není rozdíl v jejich účinnosti (účinnost léků je stejná). Důvod pro takovýto přístup spočívá v tom, že statistické testování je založeno na tom, zda zjištěná data odporují nulové hypotéze (testuje se významnost nalezeného rozdílu). Jinými slovy, platnost nulové hypotézy nikdy nemůžeme dokázat, ale podaří-li se ji zamítnout, můžeme přijmout hypotézu alternativní. Ne vždy je zamítnutí nulové hypotézy žádoucím výsledkem. Předpokládejme, že chceme prokázat vliv provozu jaderné elektrárny na délku života obyvatel, žijících v určitém okruhu od zařízení. Očekávání výsledku testování nulové hypotézy se jistě bude zásadně lišit podle toho, kdo bude zadavatelem studie (Jihočeské matky nebo majitel elektrárny Temelín).
Alternativní hypotéza může být oboustranná nebo jednostranná. Ptáme-li se například, zda se průměrná délka života obyvatel žijících v určitém okruhu od jaderné elektrárny liší od průměrné délky života v celé České republice, jde o alternativní hypotézu oboustrannou (porovnávané průměrné délky života se liší), kdežto ptáme-li se, zda je průměrná délka života obyvatel žijících v určitém okruhu od jaderné elektrárny kratší než průměrná délka života v celé České republice, jde o alterativu jednostrannou.
Nyní je třeba zavést náhodné veličiny. Ve statistice je testové kritérium náhodnou veličinou. I v tom nejjednodušším příkladě, jakým je jedno měření teploty, se jednalo o náhodnou veličinu. Tím dospíváme k tomu, že rozhodování má pravděpodobnostní charakter a hovoříme o pravděpodobnosti toho, že uděláme nějaké rozhodnutí správně nebo chybně.

Hladina významnosti
Platí-li H0 a testové kritérium padne do oboru zamítnutí, jde o chybu prvního druhu. Pravděpodobnost chyby prvního druhu se nazývá hladina významnosti a značí se řeckým písmenem α. Její hodnota se volí předem, obvykle 0,05 nebo 0,01. Někdy se uvádí v procentech jako pětiprocentní hladina významnosti či jednoprocentní hladina významnosti.

Platí-li Ha a testové kriterium padne do oboru přijetí, jde o chybu druhého druhu. Pravděpodobnost takové chyby se značí β. Většinou není známá, ale víme o ní, že se zvyšuje s klesající hodnotou α.
Nyní se zaměřme na pravděpodobnost správného přijetí Ha. Tato pravděpodobnost se nazývá síla testu a rovná se 1- β. Pojem síly testu se zavádí hlavně proto, že má smysl hovořit o silnějším testu, což znamená, že má menší β . Jako cvičení je dobré si tuto terminologii promyslet také tak, že si řekneme, jaké situace mohou nastat. Dospějeme samozřejmě ke stejným závěrům, zbývá jen použít správnou terminologii.
Základní rozdělení testů hypotéz vychází z typu dat a jejich rozdělení. Pokud se jedná o spojitá kvantitavní data, u kterých nemůžeme zamítnout nulovou hypotézu o jejich normalitě, tj. že nepocházejí z populace, která má Gaussovo rozdělení, použijeme tzv. testy parametrické. Testů na ověření normality dat ve zkoumaném výběru existuje celá řada a nelze jednoznačně říci, který z nich je nejvhodnější. Ve všech ostatních případech (data nejsou gaussovská, nebo jsou diskrétní, ordinální či nominální) musíme použít testy neparametrické. Parametrická statistika byla vybudována mnohem dříve než metody neparametrické a stále tvoří základ při výkladu o testování hypotéz. Proto se také další text nejdříve věnuje parametrickým testům.



Blok 0502 - Příklady - úvod do testování hypotéz

(Pro zobrazení odpovědi klikni na otázku.)

1) Hladina významnosti je:
A) chyba I. druhu
B) chyba II. druhu
C) pravděpodobnost chyby I. druhu
D) pravděpodobnost chyby II. druhu


2) O chybě druhého druhu platí:
A) Její pravděpodobnost je stejná jako hladina významnosti.
B) Pravděpodobnost této chyby je doplňkem k síle testu.
C) Nastane při zamítnutí H0, která platí.
D) Nastane při nezamítnutí H0, která neplatí.


3) Padne-li hodnota testového kritéria do oboru přijetí, tak:
A) H0 platí
B) H0 neplatí
C) došlo k chybě II. druhu
D) H0 zamítneme
E) H0 nezamítneme


4) Platí-li H0, hladina významnosti je 5 % a síla testu je 92%, jaká je pravděpodobnost, že testové kritérium padne do oboru přijetí?
A) 5 %
B) 95 %
C) 92 %
D) 8 %


5) Hladina významnosti je 1 % a síla testu je 90 %. Jestliže platí HA, jaká je pravděpodobnost, že testové kritérium padne do oboru zamítnutí?
A) 1 %
B) 99 %
C) 90 %
D) 10 %


Kontrolní otázky: