貝葉斯決策

時間：2023-05-01 00:57:10 資料我要投稿

相關(guān)推薦

貝葉斯決策

模式識別

第2章貝葉斯決策理論與統(tǒng)計判別方法

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

學(xué)習(xí)指南

主要內(nèi)容是說明分類識別中為什么會有錯分類, 在何種情況下會出現(xiàn)錯分類?錯分類的可能性會有多大?在理論上指明了怎樣才能使錯分類最少? 不同的錯分類造成的危害是不同的,有的錯分類種類造成的危害更大,因此控制這種錯分類則是更重要的.為此引入了一種"風(fēng)險"與"損失" 概念,希望做到使風(fēng)險最小.要著重理解"風(fēng)險" 與"損失"的概念,以及在引入"風(fēng)險"概念后的處理方法.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

理解這一章的關(guān)鍵是要正確理解先驗概率, 類概率密度函數(shù),后驗概率這三種概率, 對這三種概率的定義,相互關(guān)系要搞得清清楚楚.Bayes公式正是體現(xiàn)這三者關(guān)系的式子,要透徹掌握.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.1 引言

模式識別是一種分類(classify)問題,即根據(jù) 識別對象所呈現(xiàn)的觀察值,將其分到某個類別中去.統(tǒng)計決策理論是處理模式分類問題的基本理論之一,對模式分析和分類器(classifier)的設(shè)計起指導(dǎo)作用.貝葉斯決策理論是統(tǒng)計模式識別中的一個基本方法, 我們先討論這一決策理論,然后討論涉及統(tǒng)計判別方法的一些基本問題.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

特征向量與特征空間

例:蘋果的直徑尺寸限定在7厘米到15厘米之間,它們的重量在3兩到8兩之間變化. 如果直徑長度x用厘米為單位,重量y以兩為單位.那么,由x值從7到15,y值從3到8 包圍的二維空間就是對蘋果進(jìn)行度量的特征空間.

總體概率分布已知要決策分類的類別數(shù)一定

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

貝葉斯決策理論所要討論的問題

各類別ωi=1,2,…,c的先驗概率P(ωi)及類條件概率密度函數(shù)p(x|ωi)已知的條件下,如何對某一樣本按其特征向量分類的問題. 幾種常用的決策規(guī)則正態(tài)分布時統(tǒng)計決策的問題以及錯誤概率等問題

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.2 幾種常用的決策規(guī)則

不同的決策規(guī)則反映了分類器設(shè)計者的不同考慮,對決策結(jié)果有不同的影響.其中最有代表性的是: 基于最小錯誤率的貝葉斯決策基于最小風(fēng)險的貝葉斯決策

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.2.1 基于最小錯誤率的貝葉斯決策

分類識別中為什么會有錯分類,在何種情況下會出現(xiàn) 錯分類?錯分類的可能性會有多大? 當(dāng)某一特征向量值X只為某一類物體所特有,即

對其作出決策是容易的,也不會出什么差錯.問題在于出現(xiàn)模棱兩可的情況.此時,任何決策都存在

判錯的可能性. 條件概率 :P(*|#)是條件概率的通用符號,P(ωK|X) 是表示在X出現(xiàn)條件下,樣本為ωK類的概率.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

先驗概率,后驗概率,概率密度函數(shù)

先驗概率 P(ω1) 及P(ω2)

由先驗知識在識別前就得到的概率

后驗概率 P(ω1|X) 概率密度函數(shù) P(X|ω1) 及P(X|ω2) 聯(lián)合概率 P(X, ωi)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

先驗概率,后驗概率,概率密度函數(shù)

Bayes(貝葉斯)公式是根據(jù)聯(lián)合概率這一概念推出的 P(x,ωi)=P(x|ωi)P(ωi)=P(ωi|x)P(x)

貝葉斯公式實質(zhì)上是通過觀察x,把狀態(tài)的先驗概率P(i)轉(zhuǎn)化為后驗概率P(i|x)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.1

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.2

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

基于最小錯誤率的貝葉斯決策

基于最小錯誤概率的貝葉斯決策理論就是按后驗概率的大小作判決的 (1)后驗概率: 如果則

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

(2)如果則 (3)似然比: 如果則

否則

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

(4)似然比寫成相應(yīng)的負(fù)對數(shù)形式: 如果

則否則

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例2.1

假設(shè)在某地區(qū)切片細(xì)胞中正常(ω1)和異常 (ω2)兩類的先驗概率分別為P(ω1)=0.9, P(ω2)=0.1.現(xiàn)有一待識別細(xì)胞呈現(xiàn)出狀態(tài) x,由其類條件概率密度分布曲線查得 p(x|ω1)=0.2,p( x|ω2)=0.4,試對細(xì)胞x 進(jìn)行分類. 解:利用貝葉斯公式,分別計算出狀態(tài)為x 時ω1與ω2的后驗概率

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

P(ω1|x)=0.818>P(ω2|x)=0.0182 因此判定該細(xì)胞為正常細(xì)胞比較合理.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

基于最小錯誤率的貝葉斯決策的證明

平均錯誤率 :在觀測值可能取值的整個范圍內(nèi)錯識率的均值

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

兩類別情況:

當(dāng)P(w2|x)>p(w1|x)時決策為w2,對觀測值x有P(w1|x)概率的錯誤率

R1:作出w1決策的所有觀測值區(qū)域,條件錯誤概率為p(w2|x) R2: 條件錯誤概率為p(w1|x).因此平均錯誤率P(e)可表示成

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

在R1區(qū)內(nèi)任一個x值都有P(w2|x)

(2-9)

武漢大學(xué)電子信息學(xué)院

模式識別

錯誤率為圖中兩個劃線部分之和, 對應(yīng)的錯誤率區(qū)域面積為最小.

武漢大學(xué)

電子信息學(xué)院

貝葉斯決策理論

模式識別

C類別情況 :

最小錯誤率貝葉斯決策規(guī)則: 如果則 X∈ω i (2-10) 用先驗概率與類條件概率密度相聯(lián)系的形式,得 : 如果

武漢大學(xué)電子信息學(xué)院

(2-11)

貝葉斯決策理論

模式識別

計算平均正確分類概率P(c)即

(2-12)

平均錯誤率 :P(e)=1-P(c)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例: 應(yīng)用貝葉斯決策的膚色提取

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

利用貝葉斯原理,可以建立簡單的膚色模型,并用來從圖像中提取手部,臉部膚色,進(jìn)而得到人的身體姿勢. 1.先在一副訓(xùn)練圖象中手工描繪出膚色區(qū)域, 2.然后統(tǒng)計每種顏色點在膚色區(qū)域中出現(xiàn)的次數(shù) 和在區(qū)域外出現(xiàn)的次數(shù)的比值,作為這種顏色是膚色的概率

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

3.這樣就得到了一張查找表,表中的每個元素是這個點是膚色的概率.我們就得到了一個點是不是膚色的概率分布.以上的"顏色訓(xùn)練結(jié)果窗口"就是這樣一張表的直觀顯示.實際表格是三維的(HSI顏色空間,32×32×8)把這個條形區(qū)域分成八塊以后,每一塊是個32×32 的正方形,表示HS空間下的概率分布,顏色越亮,說明這種顏色是膚色的概率越大. 4.再加上域值限制之后,認(rèn)為只有概率大于一定域值的才是膚色.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.2.2基于最小風(fēng)險的貝葉斯決策

使錯誤率最小并不一定是一個普遍適用的最佳選擇. 一個與損失有關(guān)聯(lián)的,更為廣泛的概念——風(fēng)險

(2-13) 觀測樣本X實屬類別j,而被判為狀態(tài)i時所造成的損失, Ri則表示了觀測值X被判為i類時損失的均值分類則依據(jù)Ri,(i=1,…,c)中的最小值,即最小風(fēng)險來定.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例 :病理切片

ω1表示病理切片正常 ω2表示病理切片異常 P(ω1|X)與P(ω2|X)分別表示了兩種可能性的大小 : X確實是癌細(xì)胞(ω2),但被判作正常(ω1) 損失 : X確實是正常(ω1),卻被判定為異常(ω2) 損失

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

定義:

自然狀態(tài) :指待識別對象的類別 A={ α1,α2,……αn} 狀態(tài)空間:由所有自然狀態(tài)所組成的空間 , Ω={ω1,ω2,…,ωc} 決策 :不僅包括根據(jù)觀測值將樣本劃歸哪一類別(狀態(tài)),還可包括其它決策,如"拒絕"等決策空間 :由所有決策組成的空間

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

損失函數(shù)λ(αi|ωj)(或?qū)懗搔?αi,ωj) ) 觀測值X條件下的期望損失R(αi|X), i=1,2,…,a (2-14) Ri: 條件風(fēng)險

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

最小風(fēng)險貝

葉斯決策規(guī)則

如果期望風(fēng)險R 則α=αk

(2-15)

(2-16)

它表示對所有X取值所作的決策α(X)所帶來的平均風(fēng)險

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

最小風(fēng)險貝葉斯決策步驟

根據(jù)貝葉斯公式計算出后驗概率 : j=1,…,x 利用計算出的后驗概率及決策表,計算出采取αi,i=1,…,a的條件風(fēng)險

j=1,…,x

找出使條件風(fēng)險最小的決策αk,即

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例2.2

P(ω1)=0.9, P(ω2)=0.1 p(X|ω1)=0.2, p(X|ω2)=0.4 λ11=0, λ12=6, λ21=1, λ22=0 后驗概率 P(ω1|X)=0.818, P(ω2|X)=0.182

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

條件風(fēng)險

模式識別

由于R(α1|X)>R(α2|X) 判待識別的細(xì)胞X為ω2類——異常細(xì)胞比較例2.1 P(ω1|X)=0.818, P(ω2|X)=0.182 ,正常細(xì)胞

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

兩種決策方法之間的關(guān)系

基于最小錯誤率的決策是基于最小風(fēng)險決策的一個特例設(shè)損失函數(shù)為

式中假定對C類只有C個決策,即不考慮 "拒絕"等其它情況,(2-17)表明,當(dāng)作出正確決策(即i=j)時沒有損失,而對于任何錯誤決策,其損失均為1.這樣定義的損失函數(shù)稱為0—1損失函數(shù).

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

兩種決策方法之間的關(guān)系

根據(jù)(2-14)式條件風(fēng)險為

最小錯誤率貝葉斯決策就是在0—1損失函數(shù)條件下的最小風(fēng)險貝葉斯決策

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.4

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.3 與圖2.4

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.2.4判別函數(shù),決策面與分類器設(shè)計

決策域 :待識別的特征向量落在哪個決策域,該樣本就被判為哪一類. 決策面 :決策域的邊界面判別函數(shù) :用于表達(dá)決策規(guī)則的某些函數(shù)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例 :兩類別問題按最小錯誤率作決策

相應(yīng)的判別函數(shù): gi(X)=P(ωi|X), i=1,2 決策面方程 : g1(X)=g2(X) 決策規(guī)則如果gi(X)>gj(X) i,j=1,2 且 i≠j 則X∈ωi

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

多類別情況決策規(guī)則:

如果則將X歸于ωi類決策面 : 當(dāng)ωi的決策域與ωj的決策域相鄰時,以下關(guān)系決定了相應(yīng)的決策面 gi(X)=gj(X)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.5(a)表示了一個三類別問題用一維特征空間時的所有決策邊界,而圖2.5(b)則表示了相應(yīng)的二維特征空間中的決策邊界

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

兩類別問題分類器的框圖:

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

多類別分類器的結(jié)構(gòu)框圖:

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

§2.3 正態(tài)分布時的統(tǒng)計決策

具體的決策域劃分與樣本的概率分布有關(guān). 下面結(jié)合正態(tài)分布概率密度函數(shù)進(jìn)行討論, 在討論結(jié)束時我們會發(fā)現(xiàn)從中可以得到不少啟示.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

2.3.1正態(tài)分布概率密度函數(shù)的定義與性質(zhì)

單變量正態(tài)分布

正態(tài)分布是指一個隨機(jī)實數(shù)度量值在整個實數(shù)域上的分布規(guī)律,屬于概率密度函數(shù)類

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

多元正態(tài)分布

多元正態(tài)分布的概率密度函數(shù):

μ是X的均值向量,d維 μ=E{X}=[μ1,μ2,…,μd]T ∑是d×d維協(xié)方差矩陣,而∑-1是∑的逆矩陣,|∑|是∑的行列式 ∑=E{(X-μ)(X-μ)T}

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

多元正態(tài)分布的重要的特性

多元正態(tài)分布的概率密度函數(shù)中的元就是我們前面說得特征向量的分量數(shù),也就是維數(shù) . 多維向量:每一個分量都是隨機(jī)變量,服從正態(tài)分布.http://http://m.msguai.com/news/5587D97E021E5268.html但是一個二維隨機(jī)向量不僅要求考慮每個分量單獨的分布,還要考慮兩個隨機(jī)變量之間的關(guān)系 ——相關(guān)性

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

例:兩個二元正態(tài)分布

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

協(xié)方差矩陣:

用 E[x1-μ1)(x2-μ2)]來衡量這種相關(guān)性,稱為協(xié)方差矩陣非對角元素正表示了兩個分量之間的相關(guān) 性主對角元素則是各分量本身的方差協(xié)方差矩陣的重要屬性:正定的對稱矩陣

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

多元正態(tài)分布的性質(zhì)

參數(shù)μ與∑對分布具有決定性,記作p(X)～ N(μ,∑). 等密度點分布在超橢球面上. 等密度點對應(yīng): (x-μ)T∑-1(x-μ)=常數(shù)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

向量X到向量μ的Mahalanobis距離的平方 r2=(x-μ)T∑-1(x-μ) 多元正態(tài)分布的離散程度由參數(shù)|∑|1/2決定, 這與單變量時由標(biāo)準(zhǔn)差σ決定是對應(yīng)一致的. 不相關(guān)性等價于獨立性. —不相關(guān) :E[xixj]=E[xi]〃E[xj] —相關(guān) :(xi,xj)=p(xi)p(xj),

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

邊緣分布和條件分布的正態(tài)性多元正態(tài)分布的邊緣分布和條件分布仍然是正態(tài)分布. 線性變換的正態(tài)性 Y=αTx,則Y的分布仍然是正態(tài)的.

武漢大學(xué)電子信息學(xué)院

模式識別貝葉斯決策理論 2.3.2正態(tài)分布概率模型下的最小錯誤率貝葉斯決策

如果則X∈ωi 判別函數(shù)為 p(x| ωi) p(ωi) ,采用對數(shù)形式

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

決策規(guī)則:

相應(yīng)的決策面方程為

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

最小

距離分類器情況

定義:每個樣本以它到每類樣本均值的歐氏距離的最小值確定其分類 . 如果則 X∈ωi 樣本分布滿足以下正態(tài)分布條件時,最小錯誤分類器與(2-39)表示的決策規(guī)則相當(dāng):

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

在這種條件下,由于|∑|=σ2d及 ∑i-1=σ2I ,代入(2-37)得

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

由于決策是根據(jù)各判別函數(shù)之間的大小,因而在 (2-48)中一些與類別無關(guān)的項可以忽略,再加上先驗概率相等這個條件,判別函數(shù)可簡化成

最小距離分類器就可看作模板匹配.每個類有一個典型樣本(即均值向量),稱為模板,而待分類樣本X只要按歐氏距離計算與哪個模板最相似(歐氏距離最短)即可作決定.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

線性分類器

∑i=σ2I i=1,…,c

其中

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

決策面方程

利用以及代入(2-46)并整理,可得 WT(X-X0)=0 (2-47) W=μi-μj

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

另一種簡單情況

∑i=∑

表示在二維特征空間的情況

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

判別函數(shù)

如果c類先驗概率都相等,

其中

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

決策面方程

gi(X)-gj(X)=0 即其中

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

線性分類器總結(jié)

在正態(tài)分布條件下,基于最小錯誤率貝葉斯決策只要能做到兩類協(xié)方差矩陣是一樣的,那么無論先驗概率相等不相等,都可以用線性分界面實現(xiàn). 小歐氏距離分類器則要求正態(tài)分布協(xié)方差矩陣為單位陣,先驗概率相等.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

各類協(xié)方差矩陣不相等的情況

∑i≠∑j i,j=1,2,…,c

(d×d矩陣) (d維列向量)

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

決策面方程(當(dāng)兩個決策域毗鄰)

根據(jù)gi(X)-gj(X)=0有

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

圖2.10

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

討論與分析

分析了在何種正態(tài)分布條件下,最小錯誤率貝葉斯決策具有線性決策面. 最小距離分類器與統(tǒng)計上最小錯誤率決策上一致的條件.

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

本章小結(jié)

主要的知識: 使用什么樣的決策原則我們可以做到錯誤率最小Bayes決策錯分類最小并不一定是一個識別系統(tǒng)最重要的指標(biāo)風(fēng)險,損失學(xué)習(xí)獲得對樣本概率分布的估計

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

貝葉斯決策理論是統(tǒng)計模式識別

的重要理論基礎(chǔ) 理論上講,貝葉斯決策方法是最優(yōu)的(在最小錯誤率或最小風(fēng)險意義上) 應(yīng)用中:需要首先得到先驗概率和類條件概率密度方法一: 先估計概率密度,后求解決策規(guī)則方法二: 若已知或可假設(shè)概率密度為某種形式(比如正態(tài)分布),可先求出判決函數(shù)形式,再從樣本估計其中的參數(shù). 方法三: 直接選擇或假設(shè)某種判決函數(shù)形式,用樣本確定其參數(shù).

武漢大學(xué)電子信息學(xué)院

貝葉斯決策理論

模式識別

習(xí)題

1. 試簡述先驗概率,類條件概率密度函數(shù)和后驗概率等概念間的關(guān)系: 2. 試寫出利用先驗概率和分布密度函數(shù)計算后驗概率的公式 3. EX2.5 4. EX2.15 5. 寫出最小錯誤率和最小風(fēng)險決策規(guī)則相應(yīng) 的判別函數(shù)(兩類問題). 6. 用Matlab計算兩類識別問題:根據(jù)血液中白細(xì)胞的濃度來判斷病人是否患血液病.

武漢大學(xué)電子信息學(xué)院

【貝葉斯決策】相關(guān)文章：

基于貝葉斯理論的指揮引導(dǎo)決策研究05-02

基于前景理論與貝葉斯決策模型的彩民動機(jī)研究04-30

基于參數(shù)的貝葉斯先驗選擇方法04-27

ARFIMA模型參數(shù)貝葉斯估計的漸近性質(zhì)04-27

機(jī)匣包容性的貝葉斯評價方法04-27

基于貝葉斯動態(tài)模型的某器件性能預(yù)測05-01

基于貝葉斯網(wǎng)絡(luò)的飛機(jī)易損性評估方法04-27

基于貝葉斯粗糙集模型的屬性約簡算法04-29

Behrens-Fisher問題的信賴與貝葉斯精確區(qū)間估計04-29

基于貝葉斯網(wǎng)絡(luò)的人因可靠性評價04-26

亚洲免费人人妻人人,cao78在线视频,福建一级毛片,91精品视频免费观看,高清另类图片操逼,日本特黄特色大片免费看,超碰欧美人人澡曰曰澡夜夜泛

貝葉斯決策