Page 69 - 高中 信息技术 选择性必修4 人工智能初步
P. 69
3.2 贝叶斯分类器
3 . 2 . 3 朴素贝叶斯分类器的应用
朴素贝叶斯分类器有许多有意思的应用。例如在线社区的留言板中,为了不影响社区
的发展,屏蔽侮辱性的言论是很有必要的。如果某条留言使用了负面或侮辱性的语言,该
留言将被标识为内容不当。因此,利用朴素贝叶斯分类器构建一个快速过滤器来过滤这类
内容,是一个很常见的需求。
信息时代,我们每天会面对大量信息,如果不根据重要性设定优先级分别处理,我们
将会耗费大量精力,因此对垃圾邮件或垃圾短信进行智能过滤非常重要。下面我们将利用
垃圾邮件示例: 广东教育出版社
朴素贝叶斯分类器,用Python构建一个垃圾邮件过滤器。
构建机器学习模型首先得有足够的样本数据进行训练,我们利用网络上开源的中文邮
件数据集,提取其中的5000封正常邮件和5000封垃圾邮件进行训练。通过解析所有邮件,
提取并计算每个词语在正常邮件和垃圾邮件中的出现频率,基于贝叶斯原理推断这封邮件
是否需要过滤。
正常邮件示例:
发信人: pbdq (dp),信区: LostFound
标 题: [报失]IC卡
请尽可能详细地描述您丢失物品的特征:IC卡。
姓名:丁强,学号:2018210502。
您丢失该物品大致的时间是?8月24日上午9时左右。您丢失该物品大致的地点
是?清华大学校医院体检处。如果有人拾获,如何和您联系?电话:62779634。
[补充]表达一下您焦急的心情或感谢的方式^_^祝您好运: 谢谢!
有情之人,天天是节。一句寒暖,一线相喧;一句叮咛,一笺相传;一份相思,
一心相盼;一份爱意,一生相恋。
×××在此祝大家七夕情人快乐! ×××友情提示:2018年七夕情人节——8月17
日,别忘了给她(他)送祝福哦!
为了更好地体验邮件收发过程,我们可以利用TCP通信简单模拟邮件传输协议,用客
户端向服务器端通信的过程模拟邮件发送的过程,用服务器端接收消息的过程模拟邮件收
信的过程。所以朴素贝叶斯分类器会在服务器端运行。
61 61
21Y3228.indd 61 2019/10/10 14:23:54