Page 72 - 高中 信息技术 选择性必修4 人工智能初步
P. 72
第三章 机器学习与人工智能的核心算法
组。在互联网应用上,聚类分析常被用来进行文档归类以修复信息。在电子商务领域,聚
类分析在网站建设的数据挖掘中产生了重要作用,通过聚类具有相似浏览行为的客户和分析
客户的共同特征,可以更好地帮助电子商务的商家了解自己的客户,从而向客户提供更合适
的服务。
3 . 3 . 1 系统聚类算法
探究活动
广东教育出版社
调 查
围绕以下问题,展开调查,分小组进行汇报。
(1)调查在日常生活中的哪些情境下,可以使用聚类分析的思维解决问题。
(2)通过网络搜索和文献查找的方式,了解聚类算法的基本原理,搜集聚类算法在
人工智能领域的典型应用案例。
聚类是最常用的数据分析技术之一。与其相关的各种算法的提出、发展和演化,使得
聚类算法家族“人丁兴旺”。聚类算法很难简单地进行分类,因为这些类别可能相互重
叠,有的算法甚至具有几种类别的特点。一般而言,主要的基本聚类算法可以划分为如下
几类:
1. 划分方法
大部分划分方法(Partitioning Methods)通过度量数据之间的距离进行聚类。该方法根
据需要划分的簇数k,先创建一个初始划分,然后采用迭代计算,把对象从一个簇移动到
另一个簇来改进划分。好的划分准则是:同一个簇中的对象尽可能相互“接近”或相似,
不同簇中的对象尽可能“远离”或不同。为了达到全局最优,基于划分的聚类可能需要穷
举所有的划分,计算量极大。实际上,大多数划分方法的实现都采用了启发式方法,如
K-Means和K-Medoids算法,渐进地提高聚类质量,逼近局部最优解。这些启发式聚类方
法很适合发现中小型数据库中的球状簇。若要发现复杂形状的簇和对超大型数据集进行聚
类,就需要进一步扩展划分方法。
2. 层次方法
根据层次分解的形式不同,层次方法(Hierarchical Methods)又可以分为凝聚层次聚
类和分裂层次聚类。
(1)凝聚层次聚类:又叫自底向上方法。一开始将每个对象作为同一类,然后与其相
近的对象或类合并,直到所有小的类别合并成一个类,或者收敛,即满足终止条件为止。
(2)分裂层次聚类:又叫自顶向下方法,一开始将所有对象置于一个簇中,在迭代
的每一步中,类会被分裂成更小的类,直到最终每个对象在一个单独的类中,或者收敛,
即满足终止条件为止。
64 64
21Y3228.indd 64 2019/10/10 14:23:55