Pravděpodobnost

Podmíněná pravděpodobnost a nezávislost jevů

  1. Podmíněná pravděpodobnost
  2. Nezávislost jevu

Podmíněná pravděpodobnost

Je-li dána nějaká základní množina elementárních jevů, neboli jev jistý, můžeme si představit, že je na jejich podmnožinách, tedy jevech, definována pravděpodobnost. Jakákoliv definice pravděpodobnosti je vždy vztažena k nějaké základní množině. Například při geometrické definici se plocha základní množiny vyskytuje ve jmenovateli. Kdybychom jako základní množinu zvolili množinu jinou a s jinou plochou, byla by podle toho přizpůsobena definice pravděpodobnosti daného jevu, totiž tím, že by došlo ke změně ve jmenovateli.

Častým případem je situace, kdy o daném jevu je k dispozici nějaká částečná informace. Obvykle se uvažuje, že není znám kompletní výsledek experimentu, ale jen částečná informace. Taková informace může změnit naši znalost natolik, že vede k úpravě definice pravděpodobnosti. Například házíme hrací kostkou a zajímá nás, jaká je pravděpodobnost, že padne šestka. Podle klasické definice víme, že je tato pravděpodobnost rovna P=1/6. Byl proveden hod kostkou, nevíme přesně, jaký je výsledek, ale je nám dostupná informace, že padlo číslo sudé. Tím se celá situace mění. Počet všech možných výsledků již není šest, ale tři, protože se jedná o padnutí sudých čísel 2, 4 a 6, z nichž jeden výsledek je ten námi žádaný, a to šestka, takže v takové situaci pravděpodobnost není 1/6, ale 1/3. Hovoříme o podmíněné pravděpodobnosti. Lépe se potřebný vzorec odvodí z geometrické definice. Představme si, že je dán základní obrazec S představující jistý jev. V základním obrazci jsou pomocí obrazců A a B vyznačeny dva jevy a jejich průnik A B, který může být neprázdný. Plochu obrazců budeme značit písmenem a. Pravděpodobnosti vypočteme jako P(A) = a(A)/a(S), dále P(B) = a(B)/a(S) nebo P(A ∩ B) = a(A ∩ B)/a(S). Nyní je nám ale řečeno, že byl proveden experiment a s jistotou už víme, že nastal jev B a máme vypočítat pravděpodobnost jevu A za tohoto předpokladu. Za nové změněné situace je pak jevem jistým jev B. Tím se nám také mění okolnosti pro definici pravděpodobnosti. Ve jmenovateli musí být a(B) a v čitateli je pak jen plocha té části A, která je zároveň v B. Ta část A, která není v B nepřipadá v úvahu, protože víme, že se stalo B. Takto vidíme, že se jedná o průnik A ∩ B.

Podmíněná pravděpodobnost je rovna P(A/B) = a(A∩B)/a(B), předpokládáme-li, že a(B)>0. Symbol pro podmíněnou pravděpodobnost P(A/B) se čte pravděpodobnost A podmíněno B nebo A za podmínky, že B. Nikdy A lomeno B. Mohlo by nás zajímat, zda a jak se dá vypočítat podmíněná pravděpodobnost pomocí původních pravděpodobností. Dá se to udělat dělením čitatele i jmenovatele plochou původního jistého jevu.


`P(A/B) = \cfrac {a(A∩B)} {a(B)} = \cfrac {a(A ∩ B)/a(S)} {a(B)/a(S)} = \cfrac {P(A ∩ B)} {P(B)}`


Toto vyjádření je důležité, protože umožňuje zapsat podmíněnou pravděpodobnost jen pomocí pravděpodobností původních bez jakéhokoliv odkazu na původní definici pomocí ploch. Píšeme prostě


`P(A/B) = \cfrac {P(A ∩ B)} {P(B)}`


V případě hodu hrací kostkou jsme dostali P(A/B)=1/3, kde jev A je padnutí šestky a podmínkou je jev B, padnutí sudého čísla. Zapišme P(A/B)=1/3=(1/6)/(3/6)=P(A∩ B)/P(B). Tím je vzorec ověřen i pro tento případ.

Obecně pro definici podmíněné pravděpodobnosti pro klasickou definici potřebujeme označit počet výsledků NS, ze kterých se skládá jev jistý S, počet výsledků NA, ze kterých se skládá jev A, počet výsledků NB, ze kterých se skládá jev B a počet výsledků NA∩B, ze kterých se skládá průnik A,B. Pokud máme informaci, že nastal jev B, nastává nová situace a podle klasické definice bude ve jmenovateli počet NB výsledků, ze kterých se skládá jev B a v čitateli bude počet NA ∩ B, protože jen výsledky, které jsou zároveň v A i v B jsou ty, při kterých může nastat jev A. Pak můžeme zapsat pravděpodobnosti P(A)= NA/NS , P(B)=NB/NS a P(AB)= NAB/NS. Tak jako v geometrické definici, když P(B)>0, zapíšeme podmíněnou pravděpodobnost pomocí klasické definice a přepíšeme ji do tvaru, který používá jen původní pravděpodobnosti.


`P(A/B) = \cfrac {N(A∩B)} {N(B)} = \cfrac {N(A ∩ B)/N(S)} {N(B)/N(S)} = \cfrac {P(A ∩ B)} {P(B)}`


Opět vidíme, že podmíněná pravděpodobnost se dá zapsat jen pomocí pravděpodobností původních a na počty výsledků v jednotlivých jevech se nemusíme odkazovat.

Je snadné si představit, že stejný vzorec bychom dostali pro jakoukoliv aditivní množinovou funkci, kterou bychom použili pro definici pravděpodobnosti. Dále je dobré si promyslet, že ani takové množinové funkce použít nemusíme a můžeme použít definici podmíněné pravděpodobnosti pro pravděpodobnosti definované axiomaticky. Podmíněná pravděpodobnost pak je


`P(A/B) = \cfrac {P(A ∩ B)} {P(B)}`


Základní vlastnosti podmíněné pravděpodobnosti (nepovinné)
Při definici pravděpodobnosti, i když axiomatické, je třeba si představit nějakou pevně definovanou základní množinu tvořící jistý jev. Pravděpodobnosti jsou pak definovány právě ve vztahu k takové základní množině. To nám říká, že pravděpodobnost je v tomto smyslu definována podmíněně. Je možné samozřejmě tuto základní množinu rozšířit. Pokud ji zúžíme, máme běžnou definici podmíněné pravděpodobnosti. V tomto duchu je také možné se dívat ve statistice na definici populace. Nejen si uvědomit, co znamená požadavek, aby populace byla homogenní a jakou to může mít souvislost třeba s klasickou definicí pravděpodbnosti, ale můžeme vidět, co znamená rozšíření či zúžení populace.

Vzorce pro výpočet podmíněných pravděpodobností P(A/B)=P(AB)/P(B) platí jen za předpokladu, že tyto původní pravděpodobnosti jsou definovány vzhledem ke stejné základní množině tvořící jistý jev. Někdy dochází ke směšování a tudíž k chybným úvahám. Je nutné si říci, že to není povoleno, neboť pro takový případ vzorce neplatí. Bylo by možná přípustné použít odhadu pravděpodobnosti z jiné základní množiny, ale je nutné na to upozornit a vědět, že je to odhad. Typické je používání odhadů z loňského roku pro rok letošní, kde se jistě nejedná o stejnou základní množinu a je třeba o tom informovat. V tom případě se předpokládá, na základě zkušeností, že víme, že základní množina se mění jen zanedbatelně. Jinou otázkou může být, jak toto můžeme předpokládat pro roky budoucí a dělat předpovědi.
Bylo již naznačeno, že jakmile se řekne pravděpodobnost, platí aditivnost, nezápornost a omezení jednou. To si musíme ukázat i pro podmíněnou pravděpodobnost. Uvažujme základní množinu S, jevy A, B a podmiňovat je budeme jevem C, kde P(C)>0. Jestliže A∩B je jev nemožný, je i (A ∩ C) ∩ (B ∩ C) jako jeho podmnožina též jev nemožný, tudíž P((A ∩ C) U (B ∩ C)) = P(A ∩ C)+P(B ∩ C). Tím ukážeme aditivnost

`P(A \cup B/C) = \cfrac {P((A \cup B)∩ C)} {P(C)} = \cfrac {P((A ∩ C)\cup (B∩C))} {P(C)} = \cfrac {P(A ∩ C) + P (B ∩ C)} {P(C)} = P (A/C) + P (B/C)`


Nezávislost jevu

Nezávislé jevy
Je dána základní množina S a dvě její podmnožiny A a C. Pro pravděpodobnost předpokládejme, že P(A)>0 a P(C)>0. To, že pravděpodobnost jevu A nezávisí na podmínce C vyjádříme pomocí podmíněné pravděpodobnosti jako P(A)=P(A/C), čili pravděpodobnost jevu A není ovlivněna podmínkou C. Jelikož P(A/C) = P(A ∩ C)/P(C), můžeme nezávislost jevu A na podmínce C zapsat jako P(A) = P(A ∩ C)/P(C), což je totéž jako P(A)P(C) = P(A∩ C). Obráceně, to, že C nezávisí na A, zapíšeme jako P(C) = P(A ∩ C)/P(A), což je totéž jako P(A)P(C) = P(A∩C). Jak je vidět, je podmínka pro nezávislost A na C totožná s podmínkou pro nezávislost C na A. To znamená, že můžeme říkat, že jevy A a C jsou nezávislé. Když chceme ověřit, jestli dva jevy jsou nezávislé, stačí ověřit jen jednu ze tří uvedených podmínek a další dvě z toho plynou. Samozřejmě musí být P(A)>0 a P(C)>0.

Vyzkoušíme to na příkladě: P(A) = 0,28; P(AB) = 0,07 a P(B) = 0,25.
P(A/B) = P(A∩B)/P(B) = 0,07/0,25 = 0,28, což je rovno P(A).
P(B/A) = P(A∩B)/P(A) = 0,07/0,28 = 0,25, což je rovno P(B).
P(A).P(B) = 0,28.0,25 = 0,07, což je rovno P(A∩B).

Ověřili jsme tři podmínky, ale stačilo ověřit jen jednu z nich a už bychom bez dalšího počítání věděli, že další dvě podmínky musí být také splněny.


Doplňkové podmínky pro nezávislost (nepovinné)
Jestliže řekneme, že jev A má stejnou pravděpodobnost nezávisle na tom, že nastal jev B, je to totéž jako že nenastal jev B, že nastal doplněk nonB jevu B. Tato podmínka nezávislosti na nonB se dá zapsat jako P(A) = P(A/nonB) = P(A ∩ nonB)/P(nonB). Když S značí jev jistý a 0< P(B)< 1, přepíšeme podmínku jako

P(A) = P(A ∩(S-B))/P(S-B) = P(A-AB)/(1-P(B)) = P(A)-P(A B)/(1-P(B)).

Rovnost platí právě tehdy, když P(A)(1-P(B)) = P(A)-P(A ∩ B), tedy

P(A)-P(A)P(B)=P(A)-P(A ∩ B), čili -P(A)P(B) = -P(A∩ B) a to je jedna z již uvedených podmínek pro nezávislost.

Tato podmínka pro nezávislost je rovnocenná dalším dvěma:

P(nonB) = P(nonB/A) a P(A ∩ nonB)=P(A)P(nonB). Mohli bychom také vyměnit A za nonA a tak podobně. Celkem bychom dostali velký počet ekvivalentních podmínek. Ty mají hlavní smysl pro pochopení věci.


Základní vlastnosti a poznámky (nepovinné)

Zdálo by se, že když dvojice jevů A a B je nezávislá a dvojice B a C je nezávislá, že i dvojice A a C by snad měla být nezávislá. Je to jen špatný pohled na věc. Zkusme si představit nezávislou dvojici jevů A a B a nezávislou dvojici jevů B a C tak, že A a C jsou disjunktní, P(A)>0, P(A ∩ B)>0, P(B)>0, P(B ∩ C)>0 a P(C)>0, zatímco P(A ∩ C)=0. Z toho plyne P(A/C)=P(A∩C)/P(C)=0/P(C)=0, avšak P(A)>0 znamená závislost. Vhodný je diagram s P(A)=0,1; P(A ∩ B)=0,01; P(B)=0,1; P(B∩C)=0,01; P(C)=0,1; P(A∩C)=0.
Často se po prvním čtení pletou pojmy neslučitelný a nezávislý. Ukážeme si že neslučitelnost má za následek závislost a nezávislost má za následek to, že jevy nejsou neslučitelné.
Jestliže A a B jsou neslučitelné, P(A)>0 a P(B)>0, pak P(A) ≠P(A/B) = P(A∩B)/P(B) = 0/P(B) = 0. To znamená, že jsou závislé.
Jestliže dvojice A a B je nezávislá, je 0< P(A)=P(A/B)=P(A ∩ B)/P(B), odtud P(A∩ B)>0 a množina
A ∩ B je neprázdná, čili A a B nejsou disjunktní.


Pravidlo o součinu v kombinatorice (nepovinné)
Pravidlo pro násobení je velmi důležité pro počítání s pravděpodobnostmi. Zjednodušují a zobecňují se výpočty, které by jinak byly velmi obtížné, a tím se otvírají další možnosti pro počet pravděpodobnosti.

Příklad: Předpokládejme, že budeme házet dvakrát ideální kostkou. Pravděpodobnost, že při jednom hodu padne šestka je 1/6. Jestliže dva hody jsou nezávislé, je pravděpodobnost padnutí dvou šestek rovna součinu 1/6 . 1/6=1/36. To jsme dokázali vypočítat, aniž bychom nutně museli vyjmenovat všechny dvojice, které mohou padnout. V tomto lehkém příkladě je jich 6 . 6 = 36 a klasická definice dá 1/36. V kombinatorice zní pravidlo o násobení takto: Jestliže se jedna věc může stát M způsoby a druhá věc N způsoby nezávisle na tom, kterým z M způsobů se první věc stala, pak celkový počet, kolika způsoby se obě věci mohou stát, je dán součinem M . N. Toto pravidlo je možné aplikovat pro klasickou definici při opakování experimentů. Jestliže je při prvním experimentu M možných výsledků a při druhém experimentu N možných výsledků, pak při uvažování dvojice experimentů dohromady je M . N možných výsledků.

Analogicky, jestliže při prvním experimentu má MA z možných výsledků za následek jev A a při druhém experimentu má NB z možných výsledků druhého experimentu za následek jev B, nezávisle na tom, který z výsledků prvního experimentu nastal, pak je celkem MA . NB výsledků, které mají za následek to, že nastane jev A v prvním a zároveň jev B v druhém experimentu. Navíc potřebujeme pro klasickou definici splnění toho, že všechny z možných M . N výsledků experimentů jsou stejně možné. Jestliže i toto je v modelu splněno, pak pravděpodobnost je definována jako

P = (MA . NB)/(M . N) = (MA/M) . (NB/N).

To znamená, že pravidlo o násobení je splněno a tudíž dvojice jevů A a B je nezávislá.
Tento výklad je možné si představit pomocí kartézského součinu. Prvky takového kartézského součinu jsou všechny uspořádané dvojice výsledků prvního a druhého experimentu. Těch je M . N. Těch dvojic, které odpovídají jevu A a zároveň B, je MA . NB. Musíme ještě zvážit předpoklad, že všechny dvojice jsou stejně možné. Pak můžeme použít klasickou definici a dostaneme nezávislost.

Nezávislost bývá zásadní požadavek pro budování matematického modelu. Nezávislost v matematickém modelu je někdy možné představit si pomocí nezávislosti v ideálním pomocném modelu. V reálném fyzikálním světě při opakování experimentů avšak je jen možné usilovat, abychom udělali vše pro to, aby jevy byly nezávislé. Nezávislost bývá přitom při opakování experimentů jedním z nejdůležitějších požadavků při budování pravděpodobnostního modelu a jeho ověřování.


Nezávislé klasifikace (nepovinné)
Seznam kategorií, které jsou neslučitelné a vyčerpávající se nazývá klasifikace. Budeme se snažit popsat, co znamenají dvě nezávislé klasifikace. Jako příklad si uvedeme barvu očí jako jednu z klasifikací a barvu vlasů jako druhou klasifikaci. Otázkou je, zda barva očí a barva vlasů jsou na sobě nezávislé. Pro barvu očí zavedeme kategorie modrá, zelená, hnědá a ostatní. Pravděpodobnosti, že osoba z nějaké populace je v těchto kategoriích označme po řadě Pm, Pz, Ph, Po a platí Pm+Pz+Ph+Po=1. Pro barvu vlasů zaveďme kategorie světlé, hnědé, tmavé.
Jejich pravděpodobnosti po řadě označíme Qs, Qh a Qt, a platí Qs+Qh+Qt=1. ?

Jestliže barva očí a barva vlasů na sobě nezávisí, pak každá dvojice kategorií barvy očí a barvy vlasů je nezávislá. Pak pravděpodobnost jejich současného výskytu se vypočítá jako součin příslušných pravděpodobností. Například to, že osoba z populace má modrou barvu očí a zároveň hnědé vlasy má mít pravděpodobnost PmQh. Hypotéza o nezávislosti se pak dá vyjádřit pomocí matice
PmQs, PzQs, PhQs , PoQs
PmQh, PzQh, PhQh, PoQh
PmQt, PzQt, PhQt, PoQt

Součet pravděpodobností v prvním řádku je PmQs + PzQs + PhQs + PoQs = (Pm+Pz+Ph+Po)Qs = Qs. Podobně součet druhého řádku je Qh a součet třetího řádku vyjde Qt. Součet všech prvků matice je možné napsat jako součet součtů řádků Qs+Qh+Qt=1. Takový výsledek by nás neměl překvapit. Je to jen ověření toho, že musí vždycky platit, že součet pravděpodobností na prvním řádku dá Qs a podobně pro ostatní řádky.

Je zřejmé, že prvky matice jsou pravděpodobnosti, protože vyhovují axiomatické definici. Tím jsme běžný pojem nezávislosti převedli na pravděpodobnostní model. Nezávislost si můžeme ověřit i tak, že předpokládáme splnění nějaké podmínky pro barvu očí, třeba oči modré, a dostaneme podmíněné pravděpodobnosti (PmQs)/Pm=Qs, (PmQh)/Pm=Qh a (PmQt)/Pm=Qt. I při jiné barvě očí dostaneme vždy stejné pravděpodobnosti pro barvu vlasů, to znamená, že jsou nezávislé na barvě očí.



Blok 0403 - Příklady - podmíněná pravděpodobnost a nezávislost jevů

(Pro zobrazení odpovědi klikni na otázku.)

1) Pravděpodobnost obezity v populaci třicetiletých žen je 30 %. Pravděpodobnost zvýšeného krevního tlaku v téže populaci je 20 %. Oba znaky se vyskytují s pravděpodobností 15 %.
Která z následujících tvrzení jsou pravdivá?

A) Obezita a krevní tlak v této populaci jsou nezávislé náhodné veličiny.
B) Pravděpodobnost, že osoba z této populace, jestliže je obézní, má zvýšený krevní tlak je 0,5.
C) Pravděpodobnost, že náhodně vybraná žena z dané populace trpí aspoň jednou z těchto poruch je 0,5.
D) Pravděpodobnost, že náhodně vybraná žena z této populace není ani obézní ani nemá zvýšený krevní tlak je 0,65.


2) V populaci je 25 % kuřáků. Pravděpodobnost onemocnění chronickou bronchitidou je u kuřáků 70 %, u nekuřáků 10 %. Kolik nemocných s chronickou bronchitidou je ve stotisícové populaci?

3) Počáteční stadium rakoviny se vyskytuje u 3 z tisíce lidí. Pro její včasné zjištění byl vyvinut velmi spolehlivý test. Pouze 5 % zdravých má tento test pozitivní (falešný poplach) a pouze 2 % nemocných má výsledek negativní (skrytý průběh). Kolik procent z těch, kteří mají výsledek pozitivní má rakovinu?

4) Test A je pozitivní u 70 % pacientů, test B je pozitivní u 45 % pacientů. U 30 % pacientů jsou pozitivní oba testy zároveň. Jaká je pravděpodobnost, že u náhodně vybraného pacienta bude alespoň jeden test pozitivní?

Kontrolní otázky: