机器学习(一)——朴素贝叶斯
demi 在 周三, 10/17/2018 - 13:45 提交
0、思想:
对于给定的待分类项x,通过学习到的模型计算后验概率分布,即:在此项出现的条件下各个目标类别出现的概率,将后验概率最大的类作为x所属的类别。后验概率根据贝叶斯定理计算。
关键:为避免贝叶斯定理求解时面临的组合爆炸、样本稀疏问题,引入了条件独立性假设。用于分类的特征在类确定的条件下都是条件独立的。
1、朴素贝叶斯朴素在哪里?
简单来说:利用贝叶斯定理求解联合概率P(XY)时,需要计算条件概率 P( X | Y ) 。在计算 P ( X | Y ) 时,朴素贝叶斯做了一个很强的条件独立假设(当Y确定时,X的各个分量取值之间相互独立),即 P ( X1 = x1 , X2 = x2 , ... Xj=xj|Y=yk ) = P ( X1 = x1 | Y = yk ) * P( X2 = x2 | Y = yk ) * ... * P ( Xj = xj | Y = yk ) 。
主要的应用:电子邮件垃圾过滤、新闻分类