Page 69 - 高中 信息技术 选择性必修4 人工智能初步
P. 69

 3.2 贝叶斯分类器










                      3 . 2 . 3   朴素贝叶斯分类器的应用




                         朴素贝叶斯分类器有许多有意思的应用。例如在线社区的留言板中,为了不影响社区
                    的发展,屏蔽侮辱性的言论是很有必要的。如果某条留言使用了负面或侮辱性的语言,该
                    留言将被标识为内容不当。因此,利用朴素贝叶斯分类器构建一个快速过滤器来过滤这类

                    内容,是一个很常见的需求。
                         信息时代,我们每天会面对大量信息,如果不根据重要性设定优先级分别处理,我们
                    将会耗费大量精力,因此对垃圾邮件或垃圾短信进行智能过滤非常重要。下面我们将利用
                         垃圾邮件示例: 广东教育出版社
                    朴素贝叶斯分类器,用Python构建一个垃圾邮件过滤器。
                         构建机器学习模型首先得有足够的样本数据进行训练,我们利用网络上开源的中文邮
                    件数据集,提取其中的5000封正常邮件和5000封垃圾邮件进行训练。通过解析所有邮件,
                    提取并计算每个词语在正常邮件和垃圾邮件中的出现频率,基于贝叶斯原理推断这封邮件

                    是否需要过滤。


                         正常邮件示例:


                        发信人: pbdq (dp),信区: LostFound
                        标  题: [报失]IC卡
                        请尽可能详细地描述您丢失物品的特征:IC卡。

                        姓名:丁强,学号:2018210502。
                        您丢失该物品大致的时间是?8月24日上午9时左右。您丢失该物品大致的地点
                        是?清华大学校医院体检处。如果有人拾获,如何和您联系?电话:62779634。

                        [补充]表达一下您焦急的心情或感谢的方式^_^祝您好运: 谢谢!






                        有情之人,天天是节。一句寒暖,一线相喧;一句叮咛,一笺相传;一份相思,
                        一心相盼;一份爱意,一生相恋。
                        ×××在此祝大家七夕情人快乐! ×××友情提示:2018年七夕情人节——8月17

                        日,别忘了给她(他)送祝福哦!


                         为了更好地体验邮件收发过程,我们可以利用TCP通信简单模拟邮件传输协议,用客
                    户端向服务器端通信的过程模拟邮件发送的过程,用服务器端接收消息的过程模拟邮件收

                    信的过程。所以朴素贝叶斯分类器会在服务器端运行。







                                                                                                                    61 61







          21Y3228.indd   61                                                                                        2019/10/10   14:23:54
   64   65   66   67   68   69   70   71   72   73   74