貝葉斯公式(發(fā)表于1763年)為:
這就是著(zhù)名的“貝葉斯定理”,一些文獻中把P(B[1])、P(B[2])稱(chēng)為基礎概率,P(A│B[1])為擊中率,P(A│B[2])為誤報率。
貝葉斯定理在檢測吸毒者時(shí)很有用。假設一個(gè)常規的檢測結果的敏感度與可靠度均為99%,也就是說(shuō),當被檢者吸毒時(shí),每次檢測呈陽(yáng)性(+)的概率為99%。而被檢者不吸毒時(shí),每次檢測呈陰性(-)的概率為99%。從檢測結果的概率來(lái)看,檢測結果是比較準確的,但是貝葉斯定理卻可以揭示一個(gè)潛在的問(wèn)題。假設某公司將對其全體雇員進(jìn)行一次鴉片吸食情況的檢測,已知0.5%的雇員吸毒。我們想知道,每位醫學(xué)檢測呈陽(yáng)性的雇員吸毒的概率有多高?令“D”為雇員吸毒事件,“N”為雇員不吸毒事件,“+”為檢測呈陽(yáng)性事件??傻?/p>
P(D)代表雇員吸毒的概率,不考慮其他情況,該值為0.005。因為公司的預先統計表明該公司的雇員中有0.5%的人吸食毒品,所以這個(gè)值就是D的先驗概率。
P(N)代表雇員不吸毒的概率,顯然,該值為0.995,也就是1-P(D)。
P(+|D)代表吸毒者陽(yáng)性檢出率,這是一個(gè)條件概率,由于陽(yáng)性檢測準確性是99%,因此該值為0.99。
P(+|N)代表不吸毒者陽(yáng)性檢出率,也就是出錯檢測的概率,該值為0.01,因為對于不吸毒者,其檢測為陰性的概率為99%,因此,其被誤檢測成陽(yáng)性的概率為1-99%。
P(+)代表不考慮其他因素的影響的陽(yáng)性檢出率。該值為0.0149或者1.49%。我們可以通過(guò)全概率公式計算得到:此概率 = 吸毒者陽(yáng)性檢出率(0.5% x 99% = 0.00495)+ 不吸毒者陽(yáng)性檢出率(99.5% x 1% = 0.00995)。P(+)=0.0149是檢測呈陽(yáng)性的先驗概率。用數學(xué)公式描述為:
根據上述描述,我們可以計算某人檢測呈陽(yáng)性時(shí)確實(shí)吸毒的條件概率P(D|+):
P(D|+) = P(+|D)P(D)/(P(+|D)P(D)+P(+|N)P(N))=0.99 *0.005/0.0149=0.332215
盡管我們的檢測結果可靠性很高,但是只能得出如下結論:如果某人檢測呈陽(yáng)性,那么此人是吸毒的概率只有大 約33%,也就是說(shuō)此人不吸毒的可能性比較大。我們測試的條件(本例中指D,雇員吸毒)越難發(fā)生,發(fā)生誤判的可能性越大。
但如果讓此人再次復檢(相當于P(D)=33.2215%,為吸毒者概率,替換了原先的0.5%),再使用貝葉斯定理計算,將會(huì )得到此人吸毒的概率為98.01%。但這還不是貝葉斯定理最強的地方,如果讓此人再次復檢,再重復使用貝葉斯定理計算,會(huì )得到此人吸毒的概率為99.8%(99.9794951%)已經(jīng)超過(guò)了檢測的可靠度。
貝葉斯定理用于投資決策分析是在已知相關(guān)項目B的資料,而缺乏論證項目A的直接資料時(shí),通過(guò)對B項目的有關(guān)狀態(tài)及發(fā)生概率分析推導A項目的狀態(tài)及發(fā)生概率。如果我們用數學(xué)語(yǔ)言描繪,即當已知事件Bi的概率P(Bi)和事件Bi已發(fā)生條件下事件A的概率P(A│Bi),則可運用貝葉斯定理計算出在事件A發(fā)生條件下事件Bi的概率P(Bi│A)。按貝葉斯定理進(jìn)行投資決策的基本步驟是:
1 列出在已知項目B條件下項目A的發(fā)生概率,即將P(A│B)轉換為 P(B│A);
2 繪制樹(shù)型圖;
3 求各狀態(tài)結點(diǎn)的期望收益值,并將結果填入樹(shù)型圖;
4 根據對樹(shù)型圖的分析,進(jìn)行投資項目決策。
搜索巨人Google和Autonomy,一家出售信息恢復工具的公司,都使用了貝葉斯定理(Bayesian principles)為數據搜索提供近似的(但是技術(shù)上不確切)結果。研究人員還使用貝葉斯模型來(lái)判斷癥狀和疾病之間的相互關(guān)系,創(chuàng )建個(gè)人機器人,開(kāi)發(fā)能夠根據數據和經(jīng)驗來(lái)決定行動(dòng)的人工智能設備。