04
Účelem počtu pravděpodobnosti je zkoumání skutečného světa pomocí matematického modelu. Takovému modelu se říká pravděpodobnostní model nebo stochastický model. Někdy je vhodné zavést ještě pomocný model, na kterém se dá matematický model snadno vysvětlit. Tento přístup je používán i v jiných oborech, ale i tam musí být konečným měřítkem porovnání výsledků matematického modelu s reálným světem.
Takovým jednoduchým modelem mohou být hrací kostky nebo mince. To neznamená, že s nimi skutečně hrajeme. Pomocí modelu si pouze některé situace snadněji představíme a svůj přístup si snadno ověříme. Sama hra v kostky nás málo zajímá.
Jinak tomu ale bylo v počátcích vývoje počtu pravděpodobnosti. Ten skutečně vznikl původně při studiu hazardních her, neboť bylo velikou záhadou, jak vlastně fungují, a proč někdo vyhraje, zatímco jiný prohraje. To ale bylo před třemi sty lety. Dnes je počet pravděpodobnosti a statistika důležitou součástí mnoha oborů.
Definice
Výsledkem pokusu může být jeden z N stejně možných výsledků. Jestliže z těchto N možných výsledků NA výsledků znamená jev A, pak pravděpodobnost jevu A definujeme jako P(A) = NA / N.
Toto vypadá jako definice kruhem, protože stejně možný znamená stejně pravděpodobný. To je obecně zakázáno, takže v tomto případě je nutné dát nějaké vysvětlení. Nejprve probereme pomocný model, například hrací kostku. Ta má šest stran, hrany a vrcholy. Vylučujeme možnost, že po hodu kostka zůstane stát na hraně nebo na vrcholu. Pokud se jedná o strany, výraz stejně možné strany můžeme interpretovat tak, že si představujeme kostku jako dokonalou krychli (dokonale symetrickou), takže nepředpokládáme, že by některá strana padala častěji než jiná. V případě matematického modelu se jedná o myšlenkový experiment. Je to předpoklad, že výsledky jsou stejně možné, čili stejně pravděpodobné. Když prohlásíme, že pravděpodobnost každého výsledku experimentu je stejná, potom jistě náš předpoklad je ekvivalentní tvrzení, že každý výsledek má pravděpodobnost 1/N, takže jejich součet musí dát jedničku. (Takový předpoklad má smysl, protože se stanoví jako hypotéza, na jejímž základě se vybuduje nějaká teorie a výsledky takové teorie se pak porovnávají s daty. Ptáme se pak, zda taková hypotéza platí nebo ne.)
Pro výpočet pravděpodobnosti jevu A potřebujeme znát, jak v čitateli počet výsledků experimentu, které mají za následek jev A, tak ve jmenovateli počet všech možných výsledků. Pro ilustraci vypočítáme pravděpodobnost toho, že při hodu jednou hrací kostkou padne jednička, což označíme jako jev A. Předpokládáme, že kostka je ideálně symetrická, takže všech šest výsledků je stejně možných. Tento počet se zapíše do jmenovatele. Pravděpodobnost jevu A je tedy P(A) = 1/6. To odpovídá tomu, že jsme si řekli, že výsledky jsou stejně možné. I zbývajících pět výsledků by dle definice mělo pravděpodobnost 1/6. To je jistě totéž jako říci, že jsou stejně možné.
Nyní za stejných předpokladů vypočteme, jaká bude pravděpodobnost, že padne sudé číslo, což označíme jako jev B. Do jmenovatele zapíšeme šestku a do čitatele počet výsledků, při kterých padne sudé číslo. Sudá čísla, která připadají v úvahu, jsou 2, 4, 6, jejich počet je tři, takže P(B) = 3/6 = 1/2.
Předpokládejme opět, že hovoříme o N stejně možných výsledcích pokusů. Tyto výsledky se nazývají elementární jevy. Mějme jev A skládající se z NA elementárních jevů. Jeho pravděpodobnost je pak definována jako počet elementárních jevů, ze kterých se skládá jev A, dělený celkovým počtem elementárních jevů.
Jev jistý S se skládá ze všech elementárních jevů. Jeho pravděpodobnost je P(S)= N/N =1. Jev nemožný se skládá z nulového počtu elementárních jevů, je to tedy prázdná množina elementárních jevů. Pravděpodobnost nemožného jevu je 0/N = 0. Předpokládejme, že se jev A skládá z NA elementárních jevů a jev B se skládá z NB elementárních jevů. Jevy A a B se nazývají NESLUČITELNÉ neboli DISJUNKTNÍ, jestliže nemají žádný společný elementární jev. Sjednocením A\cupB jevů A a B se nazývá jev, který nastane právě tehdy, když nastane jeden nebo oba z jevů A, B. Sjednocení je možné také psát jako A nebo B a také jako A+B. Jsou-li jevy A a B disjunktní, můžeme počet elementárních jevů, ze kterých se skládá jejich sjednocení, vypočítat jako součet NA + NB, takže máme vzorec pro výpočet pravděpodobnosti sjednocení dvou disjunktních jevů
`P(A\cup B)=\frac{(N_A+N_B)}{N}=\frac{N_A}{N}+\frac{N_B}{N}=P(A)+P(B)`.
Tato vlastnost se nazývá ADITIVITA.
Je-li dán nějaký jev A, nazveme jeho DOPLŇKEM ten jev B, který nastane právě tehdy, když A nenastane. To je totéž, jako říci, že jev B se skládá přesně z těch elementárních jevů, které nepatří do A. Doplněk se zapíše jako S-A, kde S je množina všech elementárních jevů. Když B je doplňkem k A, je S = A \cup B, tudíž P(A \cup B) = P(S) = 1. Protože jsou disjunktní podle definice, platí P(A \cup B)=P(A) + P(B). Je tedy 1 = P(A)+P(B) a odtud požadovaný výsledek P(B) = 1 - P(A).
Jsou případy, kdy je vhodné jako matematický model použít plošné útvary. Předpokládejme, že je možné všechny možné výsledky experimentu znázornit pomocí nějakého geometrického obrazce S, neboli základního obrazce S, tedy jev jistý odpovídá tomuto základnímu obrazci. Dále víme, že jevu, jehož pravděpodobnost chceme stanovit, odpovídá část A základního obrazce S. Taková představa umožní ztotožnit jevy s obrazci v rovině.
Definice
Pravděpodobnost jevu A definujeme jako P(A) = a(A)/a(S), kde a značí plochu obrazce (area). Z takové definice plyne, že vlastnosti pravděpodobnosti budou takové, jaké jsou vlastnosti plochy.
I v geometrické definici používáme intuitivní představu, že pro plochy stejně velké jsou i pravděpodobnosti stejně velké a že pravděpodobnosti jsou úměrné velikostem ploch, pokud je vztahujeme k témuž základnímu obrazci reprezentujícímu všechny výsledky experimentu.
Tato úměrnost je obdobou stejně možných výsledků pokusů u klasické definice pravděpodobnosti. Jedná se o modelovou situaci a v našem jednoduchém příkladě je takový model totožný s hypotézou, že nezáleží na ostatních okolnostech jako například na barvě listu papíru.
Zatímco v případě klasické definice hovoříme o N stejně možných výsledcích pokusů, v případě geometrické definice je možných výsledků reprezentovaných body, ze kterých se obrazce skládají, nekonečně mnoho. Nemůžeme mluvit o jejich počtu, ale zvolili jsme jinou míru a tou je v rovině plocha.
Jednotlivé body ale analogicky nazýváme elementární jevy a množství elementárních jevů, ze kterých se skládá jev A, se měří jeho plochou a(A).
Požadavek, aby v histogramu byly plochy sloupců úměrné relativním četnostem, může nalézt zdůvodnění právě v názoru, že plochy mají být úměrné pravděpodobnostem. Někdy je vidět i použití úseček umístěných ve středech intervalů, což je také v pořádku. Jindy se ale používají trojrozměrná tělesa a v takovém případě je třeba si dát pozor. Pokud objemy, například kvádrů, jsou úměrné relativním četnostem, je to v pořádku. To může nastat typicky tak, že podstavy kvádrů jsou stejné a výšky kvádrů jsou úměrné relativním četnostem.
Velikou chybou, často záměrnou, je, když jsou na obrázku všechny tři rozměry úměrné relativní četnosti. Dojde-li pak k tomu, že v jedné kategorii je hodnota dvakrát větší než v druhé, pak má těleso znázorňující tu první kategorii objem osmkrát větší než těleso znázorňující tu druhou. To je pak podstatné zkreslení, i když na první pohled docela nenápadné.
Nevychýlenost relativních četností (nepovinné)
To, že nemůžeme přesně odvodit pravděpodobnosti, ještě neznamená, že jsme bezmocní. Pravděpodobnosti sice neodvodíme deduktivně a přesně, ale můžeme je odhadnout opakováním experimentů a pomocí relativních četností. Ukazuje se, že to není tak špatné, protože ani splnění předpokladů, kterých se používá při přesném deduktivním odvození pravděpodobnosti nemusí být naprosto dokonalé, protože se jedná o matematický model a ten stejně skutečnost nevystihne dokonale přesně.
V tomto stadiu znalostí jsme schopni uvést jen jednoduchý příklad, abychom viděli, co je předmětem studia takových oborů jako počet pravděpodobnosti a statistika. Předpokládejme, že máme zjistit, jaká je pravděpodobnost poškození buněk při nějaké jasné definici takového poškození. Mohli bychom teoreticky použít klasické definice pravděpodobnosti, ale je jasné, že takovou pravděpodobnost nemůžeme deduktivně odvodit, ale můžeme prohlásit, že se o pravděpodobnost jedná.
Předpokládejme, že celkový počet buněk, které by mohly tvořit základní množinu označíme jako NS a počet poškozených buněk označíme NB. Ani NS ,ani NB nám nejsou známy, ale jsou to čísla, která mohou být libovolně velká.
Buňkám poškozeným přiřadíme jedničku a buňkám nepoškozeným přiřadíme nulu. Tím jsme získali číselné ohodnocení buněk a můžeme definovat populační průměr jako průměrné číselné ohodnocení, což je počet poškozených buněk dělený celkovým počtem buněk (1NB + 0(NS-NB))/NS= NB/NS. Jak je vidět, takto získaný populační průměr není nic jiného než populační relativní četnost a je to také totéž jako pravděpodobnost definovaná pomocí klasické definice, avšak jen teoreticky, protože ani NB, ani NS neznáme, což je v této úvaze podstatné.
Na základě tohoto pohledu zkoumáme N různých náhodně vybraných buněk, což vlastně provádíme pomocí výběru bez vracení. Výběrový průměr je výběrová relativní četnost jevu B. O výběrovém průměru víme, že je nevychýleným odhadem populačního průměru, tedy výběrová relativní četnost je nevychýleným odhadem populační relativní četnosti, což je pravděpodobnost poškození buňky.
Tyto úvahy se dají shrnout tak, že výběrová relativní četnost nám v průměru dává pravděpodobnost poškození buňky. To nám říká, že použití relativní četnosti pro odhad pravděpodobnosti má smysl. Teorie pravděpodobnosti odvozuje další vlastnosti takového odhadu, avšak zde nejsou k dispozici potřebné znalosti, proto byl tento příklad zvolen jen pro ilustraci.
Cesta k axiomatické definici pravděpodobnosti
Doposud jsme se zabývali buď tím, jaké vlastnosti relativních četností by pravděpodobnost měla mít, nebo tím, že jsme na základě nějaké hypotézy odvodili pravděpodobnost a zjistili, že má požadované vlastnosti. Na základě experimentů pak hypotéza může podle určitých pravidel být přijata nebo zamítnuta, pravděpodobnosti mohou být odhadnuty. Budování teorie na základě nějaké hypotézy a konstrukce odhadů jsou v počtu pravděpodobnosti a ve statistice tím základním přístupem, což nám opět připomíná, že má smysl zabývat se jen jevy hromadnými nebo opakovatelnými.
Základním předpokladem bývá tvrzení o nějaké rovnoměrnosti nebo stejné možnosti. Jakmile je takový předpoklad nevhodný a nemůžeme předem říci jak pravděpodobnosti odvodit, například nemůžeme přesně říci, čemu jsou úměrné, nemůžeme použít metody analogické geometrické či klasické definici. Tyto geometrické a klasické definice nejsou jediné přístupy a existuje samozřejmě mnohem více postupů jak dospět k pravděpodobnostem, to ale na věci nic nemění.
V příkladě výpočtu pravděpodobnosti toho, že muška sedne na list papíru, který leží na stole, jsme uvažovali jen plochu listu papíru. Jestliže ale záleží i na barvě nebo umístění listu papíru, nevěděli bychom jak dál, protože pravděpodobnosti neumíme odvodit deduktivně. Umíme ale opakovat pokusy, vypočítat relativní četnosti.
Jestliže přesný mechanismus není znám, nemůže ani existovat postup, jak odvodit pravděpodobnosti. Musíme se spokojit s tím, že konstatujeme, že výsledky experimentu mají náhodný charakter a že nějaké pravděpodobnosti existují, avšak přesné odvození vzorců neznáme. Podstatné je to, že po takovém prohlášení s pravděpodobnostmi umíme počítat. Abychom s nimi dovedli počítat, musí mít základní vlastnosti, které jsme odpozorovali u relativních četností a odvodili u klasické a geometrické definice. Ono je to spíš tak, že jakmile vyslovíme slovo pravděpodobnost, máme na mysli splnění těch základních požadavků. Ty je možné shrnout do několika axiomů.
Axiomatická definice pravděpodobnosti
Jsou dány možné výsledky experimentů, elementární jevy. Souhrny elementárních jevů se nazývají jevy. Souhrn všech elementárních jevů se nazývá jev jistý S. Je-li dán jev A a jev B, jejich sjednocení A U B je definováno jako ty elementární jevy, které tvoří jev A nebo jev B. Jevy A a B se nazývají neslučitelné, když nemohou nastat zároveň, to znamená, že není elementární jev, který by měly společný.
Pravděpodobností se nazývá funkce, která jevům přiřazuje číslo P a splňuje tato pravidla
Pravidla 1. a 2. jsou celkem samozřejmá a snadno splnitelná. Podstatnější ale je pravidlo 3. aditivnost. Je to pravidlo, bez něhož by jakékoliv výpočty byly nemožné.
(Pro zobrazení odpovědi klikni na otázku.)
1) Jaká je pravděpodobnost toho, že při hodu jednou kostkou padne jednička nebo sudé číslo.