1-6 贝叶斯推理过程的总结
用图表对于之前提到的后验概率的计算方法进行总结,如图表1-9所示。
图表1-9 关于顾客类别的贝叶斯推理过程
那么,通过求后验概率,我们能够了解到什么呢?其实,只要抽出图表的开头、中间和结尾部分,并填入数值,结果就很明确了。(图表1-10)
图表1-10 有关顾客类别的贝叶斯更新
看这个图表便可了解到,在没有观察到任何行为时,面前的顾客是“来买东西的人”的概率为0.2(先验概率),但观察到“上前询问”这一行为之后,数值便更新为约0.43(后验概率)。也就是说,虽然并不能断定这位顾客就是“来买东西的人”,但这一结果的可能性提高到了以前的两倍,这便是“贝叶斯更新”。
在本书中,上述过程称为“贝叶斯推理”。贝叶斯推理可以总结为:通过观察行动(信息),将先验概率通过贝叶斯更新,转换为后验概率。在本书中,每个案例中进行的推算称为“贝叶斯推理”,而将这些案例中的推算方法整合起来,便是“贝叶斯统计学”。
第1讲·小结
1.设定两个类别(“来买东西的人”和“随便逛逛的人”)的概率(先验概率)。
2.设定类别“来买东西的人”“上前询问”以及“不上前询问”两种行为的概率,和“随便逛逛的人”“上前询问”以及“不上前询问”的概率(条件概率)。这需要一定的经验和数据作为支撑。
3.因为观察到了“上前询问”的行为,因此,可以排除掉“不上前询问”的可能性。
4.使“来买东西的人上前询问”的概率和“随便逛逛的人上前询问”的概率组合,满足标准化条件。也就是说,在保持比例关系的前提下,使其相加之和等于1。
5.还原标准化条件后的“来买东西的人”的概率,也就是观察到“上前询问”行为后,判断“来买东西的人”类别的后验概率。
6.根据观察到的行为,先验概率更新为后验概率。这就是贝叶斯更新。
练习题
第一次练习,我们先做一个设定全部相同,只改变数值的练习吧。
先验概率的设定
顾客中,“来买东西的人”的比例占全体的40%(0.4),“随便逛逛的人”的比例占全体的60%(0.6)。
有关信息的条件概率的设定
下表提供了各类别的“上前询问”和“不上前询问”的条件概率。
按以下顺序,求观察到“上前询问”这一行为后,“来买东西的人”的后验概率。
各个类别的先验概率分别为,
(a)=( )、(b)=( )
添加信息后的条件概率分别为,
(c)=( )、(d)=( )
(e)=( )、(f)=( )
四种互不相同的情况的概率分别为,
(g)=( )×( )=( )
(h)=( )×( )=( )
(i)=( )×( )=( )
(j)=( )×( )=( )
在观察到“上前询问”的2种情况中,恢复标准化条件,则
观察到“上前询问”的情况下,该顾客为“来买东西的人”的后验概率=( )