Page 86 - 高中 信息技术 选择性必修4 人工智能初步
P. 86
第三章 机器学习与人工智能的核心算法
网络层分为输入层、隐含层和输出层。多层感知机通常是全连接(Fully-Connected)
的,一层之中的每一个感知机都与下一层的每一个感知机相连接,尽管这不是强制性的,
但通常是标准配置。感知机只能表征线性可分的问题,而多层感知机结合非线性的激活函
数就突破了这一限制,可以表征更加复杂的决策边界。
如图3-16所示,在人工神经网络中,最左边一层被称为输入层,其中的神经元被称为
输入神经元。最右边为输出层,其中的神经元是输出神经元,输出神经元的个数通常与分
类的个数有关。图3-16只有一个单一的输出神经元,常用于二分类问题;在手写数字识别
的例子中,要将图像分为0~9这10个数字类别,也就是说会用到10个输出神经元。中间层
被称为隐含层,因为里面的神经元既会有输入也会有输出。图3-16中的人工神经网络包含
了两层隐含层,但是一些网络可能只有一层或者多层。
广东教育出版社
图3-16 人工神经网络
人工神经网络中输入层和输出层的设计通常很简单。假设我们试图判断一幅手写数字
图像是否代表“9”,设计网络的一种方式是将图像像素强度编码进输入层的神经元。如
果图像是一幅28像素×28像素的灰度图,那么我们可以在输入层设计28×28=784个神经
元,每一个神经元的输入值为0~1的像素强度。若输出层只包含一个神经元时,输出值小
于0.5表示“输入图像不是9”,大于0.5表示“输入图像是9”。
虽然人工神经网络的输入层和输出层很简单,设计好隐含层却是一门艺术。将隐含层
的设计过程总结出简单的经验规则是一项有挑战性的任务。人工神经网络研究者们已经为
隐含层开发出许多启发式设计,它们能帮助大家获取所期望行为的网络。例如,一些启发
式算法能协助平衡隐含层数量与样本训练所耗时间的关系。
3 . 5 . 2 人工神经网络的应用
开始学习编程的时候,第一件事往往是学习在计算机屏幕上显示“Hello World”。对
应地,机器学习的入门有MNIST。MNIST是一个入门级的计算机视觉数据集,它包含成千
上万的手写数字图像,还包括它们对应的数字分类。
MNIST数据集被分成两部分:60 000行的训练数据集和10 000行的测试数据集。这样
的切分很重要,在机器学习模型设计时必须有一个单独的测试数据集不用于训练,而是用
78 78
21Y3228.indd 78 2019/10/10 14:24:05