Page 64 - 高中 信息技术 选择性必修4 人工智能初步
P. 64
第三章 机器学习与人工智能的核心算法
机器学习随着研究的不断深入,产生了很多适用于不同情况的算法。主要的机器学习
算法类型有:
1. 监督学习
监督学习是常见的机器学习方法。在监督学习中,训练数据由一组训练实例组成。每
一实例都是由一个输入对象(通常是一个向量)和一个期望的输出值(也被称为监督信
号)组成。
机器进行学习时,用已知某种或某些特性的样本作为训练集,以建立一个数学模型
(如模式识别中的判别模型),再用已建立的模型来预测未知样本。
监督学习算法主要用来解决两类任务:分类(对实例数据预测合适的类别,如应用分
广东教育出版社
类器对邮件是否包含垃圾信息进行分类)和回归(对实例数据预测具体的数值,如应用决
策树对房屋的价格进行预测)。
2. 无监督学习
无监督学习,顾名思义,就是不受监督的学习,一种自由的学习方式。例如,应用
聚类算法的学习方式就不需要先验知识进行指导,而是不断地自我认知,自我巩固,最
后进行自我归纳。在机器学习中,无监督学习可以被简单理解为不为训练集提供对应的
类别标签。
3. 半监督学习
与监督学习和无监督学习不同,半监督学习综合了监督学习和无监督学习的特征。它
主要考虑如何利用少量有标签的样本和大量没有标签的样本进行学习和预测。单独使用有
标签的样本,能够生成监督分类算法;单独使用无标签样本,能够生成无监督聚类算法。
一般而言,半监督学习通过在监督分类算法中加入无标签样本来实现半监督分类,或者是
在无标签样本中加入有标签样本,增强无监督聚类的效果。
4. 强化学习
强化学习是机器学习的一个重要分支,是多学科多领域交叉的产物。它的目的是解决
自动决策的问题,并且可以做连续决策。它主要包含四个元素:agent,环境状态,行动和
奖励。所谓强化学习,就是智能系统从环境到行为映射的学习,从而使奖励信号(强化信
号)函数值最大。强化学习不同于监督学习,强化学习中由环境提供的强化信号对产生动
作的好坏做评价(通常为标量信号),而不是告诉强化学习系统如何去产生正确的动作。
由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。通过这种方
式,强化学习系统在行动—评价的环境中获得知识,改进行动方案以适应环境。强化学习
通常应用在机器人技术上(如机械狗)。机器人系统中的强化学习算法通过感知机器人当
前的环境状态,训练机器做出各种特定行为。机器在训练过程中不断尝试,错了就扣分,
对了就奖励,由此训练得到在各个状态环境下最好的决策。即机器从以往的行动经验中得
到提升并最终找到最好的知识内容来帮助它做出最有效的行为决策。
在实际应用中,环境、知识库和执行部分决定了机器学习具体的工作内容。系统的学
习部分所需要解决的问题完全由上述三部分确定。环境向学习部分提供信息,学习部分利
56 56
: JOEE