條件機率
A+醫學百科 >> 條件機率 |
示例:就是事件 A 在另外一個事件 B 已經發生條件下的發生機率。條件機率表示為 P(A|B),讀作「在 B 條件下 A 的機率」。
如:根據大量的統計,大熊貓活到十歲的機率是0.8,活到十五歲的機率是0.6,若現有一隻大熊貓已經十歲了,則他活到十五歲的機率是多少?
聯合機率:表示兩個事件共同發生的機率。A 與 B 的聯合機率表示為 P(AB) 或者 P(A,B)。
邊緣機率:是某個事件發生的機率,而與其它事件無關。邊緣機率是這樣得到的:在聯合機率中,把最終結果中不需要的那些事件合併成其事件的全機率而消失(對離散隨機變數用求和得全機率,對連續隨機變數用積分得全機率)。這稱為邊緣化(marginalization)。A的邊緣機率表示為 P(A),B 的邊緣機率表示為 P(B)。
需要注意的是,在這些定義中 A 與 B 之間不一定有因果或者時間順序關係。A 可能會先於 B 發生,也可能相反,也可能二者同時發生。A 可能會導致 B 的發生,也可能相反,也可能二者之間根本就沒有因果關係。
例如考慮一些可能是新的信息的機率條件性可以通過貝葉斯定理實現。
目錄 |
定義
在同一個樣本空間 Ω 中的事件或者子集 A 與 B,如果隨機從 Ω 中選出的一個元素屬於 B,那麼下一個隨機選擇的元素屬於 A 的機率就定義為在 B 的前提下 A 的條件機率。
統計獨立性
若且唯若兩個隨機事件 A 與 B 滿足 P(A∩B)=P(A)P(B).
的時候,它們才是統計獨立的,這樣聯合機率可以表示為各自機率的簡單乘積。
同樣,對於兩個獨立事件 A 與 B 有P(A|B) = P(A)
以及P(B|A) = P(B)
換句話說,如果 A 與 B 是相互獨立的,那麼 A 在 B 這個前提下的條件機率就是 A 自身的機率;同樣,B 在 A 的前提下的條件機率就是 B 自身的機率。
互斥性
若且唯若 A 與 B 滿足 P(A∪B)=P(A)+P(B)
且 P(A∩B)=0
, 的時候,A 與 B 是互斥的。
因此,
換句話說,如果 B 已經發生,由於 A 不能 B 在同一場合下發生,那麼 A 發生的機率為零;同樣,如果 A 已經發生,那麼 B 發生的機率為零。
其它
如果事件 B 的機率 P(B) > 0,那麼 Q(A) = P(A | B) 在所有事件 A 上所定義的函數 Q 就是機率測度。 如果 P(B) = 0,P(A | B) 沒有定義。 條件機率可以用決策樹進行計算。
條件機率謬論
條件機率的謬論是假設 P(A|B) 大致等於 P(B|A)。數學家John Allen Paulos 在他的《數學盲》一書中指出醫生、律師以及其他受過很好教育的非統計學家經常會犯這樣的錯誤。這種錯誤可以通過用實數而不是機率來描述數據的方法來避免。
P(A|B) 與 P(B|A)的關係如下所示:
下面是一個虛構但寫實的例子,P(A|B) 與 P(B|A)的差距可能令人驚訝,同時也相當明顯。
若想分辨某些個體是否有重大疾病,以便早期治療,我們可能會對一大群人進行檢驗。雖然其益處明顯可見,但同時,檢驗行為有一個地方引起爭議,就是有檢出假陽性的結果的可能:若有個未得疾病的人,卻在初檢時被誤檢為得病,他可能會感到苦惱煩悶,一直持續到更詳細的檢測顯示他並未得病為止。而且就算在告知他其實是健康的人後,也可能因此對他的人生有負面影響。
這個問題的重要性,最適合用條件機率的觀點來解釋。
假設人群中有1%的人罹患此疾病,而其他人是健康的。我們隨機選出任一個體,並將患病以disease、健康以well表示:
P(disease) = 1% = 0.01 and P(well) = 99% = 0.99. 假設檢驗動作實施在未患病的人身上時,有1%的機率其結果為假陽性(陽性以positive表示)。意即:
P(positive | well) = 1%,而且P(negative | well) = 99%. 最後,假設檢驗動作實施在患病的人身上時,有1%的機率其結果為假陰性(陰性以negative表示)。意即:
P(negative | disease) = 1%且P(positive | disease) = 99%。 現在,由計算可知:
是整群人中健康、且測定為陰性者的比率。
是整群人中得病、且測定為陽性者的比率。
是整群人中被測定為假陽性者的比率。
是整群人中被測定為假陰性者的比率。
進一步得出:
是整群人中被測出為陽性者的比率。
是某人被測出為陽性時,實際上真的得了病的機率。
這個例子裡面,我們很輕易可以看出 P(positive|disease)=99% 與 P(disease|positive)=50% 的差距:前者是你得了病,而被檢出為陽性的條件機率;後者是你被檢出為陽性,而你實際上真得了病的條件機率。由我們在本例中所選的數字,最終結果可能令人難以接受:被測定為陽性者,其中的半數實際上是假陽性。
離散機率分布:均勻 • 伯努利 • 幾何 • 二項 • 泊松 • 超幾何 • 多項 • 負二項 • 玻爾茲曼 • 複合泊松 • 退化 • 高斯-庫茲明 • 對數 • 拉德馬赫 • Skellam
• Yule-Simon • ζ • 齊夫 • 齊夫-曼德爾布羅特 • 拋物線分形
連續機率分布:均勻 • 正態 • 指數 • β(貝塔) • β'(第二類) • 柯西 • χ²(卡方) • δ(德爾塔) • Erlang • 廣義誤差 • F • 衰落 • Fisher的z
• Fisher-Tippett • γ(伽瑪) • 廣義極值 • 廣義雙曲 • 半邏輯 • Hotelling的T平方 • 雙曲正割 • 超指數 • 逆χ² • 逆高斯 • 廣義逆高斯
• 逆γ • Kumaraswamy • Landau • 拉普拉斯 • 列維 • 穩定 • 邏輯 • 對數正態•麥克斯韋-玻爾茲曼•麥克斯韋速率分布律 • 玻色-愛因斯坦
• 費米-狄拉克 • Pareto • Pearson • 極角 • 餘弦平方 • 瑞利 • 相對論的Breit-Wigner • 萊斯 • t(學生氏) • 三角 • 第一類Gumbel
•第二類Gumbel • Voigt • von Mises • 韋氏 • Wigner半圓形
其它分布:康托爾分布 • 條件機率 • 指數分布族 • infinitely divisible • location-scale family • marginal • maximum entropy • phase-type • posterior
• prior • 擬機率 • 抽樣分配 • singular
多隨機變數:狄利克雷 • 肯特 • 矩陣常態分配 • 多變數常態分配 • von Mises-Fisher • Wigner擬機率 • Wishart Ewens抽樣公式
關於「條件機率」的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |