第二部分 经典神经网络
第3章 感知机
在人工智能这个大的范畴内,其学术思想基本可以分为两大派别——一类是主张模仿人类(或最起码是一些高等动物)的行为模式进行研究,例如专家系统、蚁群算法等;而另一类则是从数学的逻辑和符号系统进行严格推证,以保证方法的数学严密性,例如统计学习方法等。毫无疑问,神经网络方法的基本思想是属于仿生智能的。神经网络方法的先行者们意识到仿生智能的优越性,受到人类神经元工作模式的启发首先提出了M-P模型。之所以称为M-P模型是用来纪念两位神经网络方法的开拓者Warren Sturgis McCulloch和Walter Harry Pitts,Jr.,取他们姓氏的首个英文字母组成的。在第1章中介绍了M-P模型的基本结构,在M-P模型中,其激活(活化)函数取为符号函数,也称为开关特性函数,即
式中,xi——神经元的输入激励;
wi——与输入激励相对应的权值;
θ——神经元的阈值;
sgn(·)——符号函数。
从这个模型中可以看出,这种模型具有以下特点:
(1)每个神经元都是一个多输入单输出的系统。这表明了单个神经元可以接收多种信息的输入(激励),在一定程度上保留了生物神经元的特点。
(2)神经元对于多个输入激励并不是等量齐观的,而是有所侧重的,这主要表现在对于各输入的权值wi的不同上。对于神经元来讲,比较“重要的”的输入信息作为兴奋性输入,其权值设置得较大;而不太重要的输入信息作为抑制性输入,将其权值设置得较小,甚至为0。在M-P模型中,这些权值一般都预先由人指定,而且在运行过程中不会对这些权值进行更改。
(3)神经元的输出状态有两种(根据符号函数的特点可以得出):一类是符号函数的正向性输出,此时表明神经元被激活(兴奋),另一类是符号函数的负向性输出,表明神经元被抑制。这也可以看作是激活函数的名称由来。
(4)神经元的激活运算中具有整合和阈值特性。在各种输入信息经过一定的加权运算后,首先要经过求和整合,然后将这些经过整合的数据信息与阈值进行比较,再交由激活函数(符号函数)进行运算,得到输出的状态。
在基本M-P模型的基础上,还可以衍生出一些改进型的M-P模型,例如带有延时特性的M-P模型等。M-P模型是神经网络方法的一个萌芽性的模型,虽然它能够解决的问题非常有限(连简单非线性分类的“异或”问题都无能为力),但毕竟开启了仿生智能算法的时代。究其原因,是由于M-P模型中的各输入激励权值wi为人为指定,而且一旦指定就不能进行调整,这大大限制了其应用的范围。为了解决这个问题,就必须让输入激励的权值能够进行调整,这样就诞生了具有一定学习功能的神经网络——感知机。