深度序列模型与自然语言处理:基于TensorFlow 2实践
上QQ阅读APP看书,第一时间看更新

第1章
深度学习与自然语言处理概述

人类从未停止过对智能机器的渴望。早在古希腊时代,人们便开始幻想拥有机器人仆从,并动手制作简单的自动装置。20世纪中叶电子计算机发明后,人工智能(Artificial Intelligence)的研制再次成为重要议题。人工智能一词源于1956年夏天的达特茅斯会议——这被视为人工智能正式诞生的标志。会议历时两个月,与会的科学家一直没能就如何制造智能机器达成共识。概括来看,目前人工智能的研究主要分为三大门派:

· 符号主义(Symbolicism,也叫逻辑主义)认为智能源于数理逻辑,其核心是符号推理。符号主义主导了从20世纪50年代开始的第一次人工智能浪潮,以数学定理的自动证明为主要成就。

· 连接主义(Connectionism,也叫仿生学派)认为实现智能需要模拟人脑的结构和功能。连接主义最早可以追溯到1943年由生理学家Warren McCulloch和数理逻辑学家Walter Pitts创立的MP神经元模型[1]。经历了几十年的起起落落,这一流派演变成了现如今大热的深度学习(Deep Learning)。

· 行为主义(Actionism,也叫控制论学派)的观点是智能源于控制论。诺伯特·维纳(Norbert Wiener)在1948年发表的《控制论——关于在动物和机器中控制和通讯的科学》是控制论学派的代表作,大量机器人及相关智能算法的研究都由这一流派的学者完成。强化学习(Reinforcement Learning)这一学习范式的灵感同样来源于此,并且近年来与深度学习相结合形成了深度强化学习(Deep Reinforcement Learning)。

半个多世纪过去了,人工智能已经经历了三次浪潮和两次低谷,而当前我们正处在以深度学习技术为代表的第三次人工智能浪潮中。从人脸识别到语音合成,从机器翻译到大规模推荐系统,深度学习在各个领域开花结果,带给我们前所未有的机遇和挑战。本书将以自然语言处理(Natural Language Processing)为代表性应用,详细讲解深度学习技术的使用案例。而本章作为概述性质的章节,将简要回顾自然语言处理和深度学习的历史,带领读者熟悉相关议题。