Page 65 - 高中 信息技术 选择性必修4 人工智能初步
P. 65
3.2 贝叶斯分类器
用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成
任务的同时,把获得的信息反馈给学习部分。
项目实施
各小组根据项目选题及拟订的项目方案,结合本节所学知识,对机器学习进行剖析。
1. 结合案例,分析机器学习的原理。
2. 结合案例,讨论机器学习对社会的正面和负面影响。
广东教育出版社
3.2 贝叶斯分类器
人工智能领域的很多问题都属于如何让计算机学会对样本进行分类的问题。而机器学
习中的许多分类算法都可以用来构造分类器,常用的有朴素贝叶斯、决策树、随机森林、
逻辑回归、支持向量机和神经网络等。不过分类器有时候也会给出错误的结果,这时候就
可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。概率论
是许多机器学习算法的基础,因此深刻理解概率论十分重要。
本节将从最简单的概率分类器开始,通过一些案例来学习构造朴素贝叶斯分类器
(Naive Bayes Classifier)。之所以称之为“朴素”,是因为整个形式化过程中只有最原
始、最简单的假设。我们还将充分利用Python的文本处理能力,构建一个垃圾邮件分类
器,观察该分类器在真实的垃圾邮件数据集中的过滤效果。
3 . 2 . 1 朴素贝叶斯分类器
在概率统计理论中,条件概率是指事件A在另外一个事件B已经发生的条件下的发生概
率。表示为 ,读作“在B的条件下A发生的概率”。
贝叶斯(T. Bayes,约1702—1761),提出了下面的条件概率公式——贝叶斯公式:
其中,P( AB )代表A和B同时发生的概率,P(B)代表B发生的概率, 代表在B发生的
情况下A发生的概率。
57 57
21Y3228.indd 57 2019/10/10 14:23:53