完整解析AI人工智能:3大浪潮+3大技术+3大应用


所说人工智能(Artificial Intelligence;简称:AI) , 是指以人力方法来完成人们所具备之智慧的技术 。只不过 , 目前能实现与人类智能同等的技术还不存在 , 全世界绝大部分的人工智能或是只有处理某一特殊难题 。本篇文章是在我阅读了几本AI的有关书本后 , 所概略统整出的架构 , 期待让初次接触AI的读者 , 能透过333口决 , 迅速了解AI究竟是什么 。
一、AI的三次浪潮
第一次AI浪潮
第一次AI浪潮源于1950~1960年 , 止于1980年代 。因为出现在网络以前 , 因而也被称为“古典人工智能” 。这阶段发生的“符号主义”与“联接主义” , 各是日后“专家系统”与“深度学习”的原型 。只不过 , 虽然当时的成效已能解除拼图或简单的游戏 , 却几乎难以解决好用的难题 。
第二次AI浪潮
第二次AI风潮伴随计算机普及 , 出现在1980年代 。这阶段所进行的研究 , 要以传递「专家知识」做为标准 , 来协助处理特殊问题“专家系统”(Expert system)为主 。但是 , 纵然当时有商业运用的案例 , 运用范围却很有限 , 风潮也由此慢慢消散 。
第三次AI浪潮
第三次AI浪潮则出现在2010年代 , 伴随高性能计算机、互联网、大数据、传感器的普及 , 及其核算成本的降低 , “机器学习”随着盛行 。所说机器学习(Machine leaning) , 是指让计算机很多学习数据 , 让它能够像人们一样辨识响声及影象 , 或者针对问题作出适宜的分辨 。
二、AI的三大技术
迅速了解了AI的发展史后 , 我们来看看当今人工智能的三大象征性模型:遗传算法、专家系统、类神经网络 。
1遗传算法
遗传算法(Genetic algorithm;GA) , 也称为演变式算法(Evolutionary algorithm) , 是受达尔文演化论所启迪的人工智能 。它透过「优胜劣汰」规则 , 将“出色的个体”想象成“好的回答” , 透过演变的方式去找到最佳解 。
2专家系统
专家系统(Expert system) , 乃是对于预置问题 , 事前备好大量对应方法 。它运用在很多地方 , 特别是疾患诊断 。只不过 , 专家系统只有对于专家事先考虑过的情况来准备对策 , 它并没自主学习的能力 , 因而或是有之局限 。
3类神经网络
从第三次AI浪潮所盛行的机器学习(Machine learning)有许多种技巧 , 其中最受瞩目的 , 莫过深度学习(Deep learning)了 。所说深度学习 , 是透过效仿人脑的“类神经网络”(Neural network)去学习很多数据手法 。
类神经网络的来历
若你来观查脑的内部 , 会发现有较多称为“神经元”的神经细胞彼此相接 。一个神经元从其他神经元那边接收的电气信号量达某一定值之上 , 便会激动(神经冲动);在某一定值下列 , 就不会激动 。
激动出来的神经元 , 会把电器信号传赠给下一个连接的神经元 。下一个神经元同样会因而激动或不激动 。实质上 , 彼此连接的神经元 , 会形成协同传送行为 。大家透过将这种连接的构造来数学模型化 , 便构成了类神经网络 。
类神经网络:深度学习
我们能发觉 , 经模型化的类神经网络 , 是由“输入层”(Input layer)、“隐藏层”(Hidden layer)及“输出层”(Output layer)等三层所组成 。此外 , 学习数据则是由键入数据及其相对应恰当解释来构成 。
以影象辨识为例 , 为了让AI学习类神经网络的模型 , 首先必须先把影象学习数据分割成像素数据 , 再将各像素值输进输入层 。
接受数据的输入层 , 将像素值乘上“权重”后 , 便传输给后才隐藏层的神经元 。隐藏层的每个神经元会累加前一层所接收到的值 , 并把它结论再乘上“权重”后 , 传输给后方的神经元 。最终 , 经过输出层的神经元的导出 , 便能获得影象辨识的预测结论 。
为了让输出层的值跟每个键入数据对应的正解数据相同 , 会对各个神经元的键入算出适度的“权重”值 。
这一权重的测算 , 一般是应用“偏差倒传送算法”(Error Back Propagation) , 应用与正解数据间的偏差 , 从输出层逆推回家 。透过各「权重」的变化 , 来变小输出层的值与正解数据的值间的偏差 , 以创建出进行学习模型 。
【完整解析AI人工智能:3大浪潮+3大技术+3大应用】因为以往类神经网络之间进行传达的权重无法提升 , 因而曾有多数学者对类神经网络的探索持否认心态 。直至2006年 , 辛顿(Geoffrey Hinton)研发出自动编码器(Autoencoder)手法 , 才达到了此项短板 。
自动编码器是指 , 在类神经网络的输入层和输出层应用同样数据 , 并把隐藏层设定于二者之间 , 借此用于调节类神经网络间的权重参数的一种技巧 。运用以自动编码器所取得的类神经网络权重变量值开展复位后 , 便可运用「偏差倒传送算法」 , 提升双层类神经网络的学习精确度 。
透过类神经网络 , 深度学习便成为了“只需把数据键入类神经网络 , 它就能自主抽出特点”的人工智能 , 而这也称为“特征学习”(feature learning) 。
深度学习最擅长的 , 是它能辨识图象数据或波型数据这种没法符号化的数据 。自2010年代至今 , 如Google、Microsoft及Facebook等国外著名IT公司 , 都开始着手深度学习的探索 。比如 , 苹果「Siri」的语音识别 , Microsoft搜索模块「Bing」所具有的影象寻找这些 , 而Google的深度学习项目也已超过1 , 500项 。
对于深度学习这般飞越的发展 , 要得益于硬设备的提高 。图形处理器(GPU)大厂辉达(NVIDIA)运用公司的图形适配器来提高深度学习性能 , 给予链接库(Library)和架构(framework)商品 , 并积极设立讨论课程 。此外 , Google也公开了架构「TensorFlow」 , 能将深度学习用于数据剖析 。
三、AI的三大运用
AI主要用途关键可分为语音识别、影象辨识及其自然语言处理等三部分 。
1语音识别
语音识别部分 , 透过多年来语音识别比赛CHiME的探索 , 有了等同人类辨识度(CHiME , 是针对实际生活条件下的语音识别 , 所进行评测的国际语音识别比赛) 。此外 , Apple、Google、Amazon也相继提出可用于日常生活服务 , 所以其成熟度已达到好用级别 。
2影象辨识
影象辨识部分 , 尽管一般图片的辨识已有同等于人类辨识率 , 但动态影像的辨识精确度却仍不如人们 , 目前还在进行各种算法的检测 。其中 , 影象辨识目前最火爆的运用场所非无人驾驶莫属了 。
全部车辆、信息通讯产业都正向着自驾游方向勤奋 , 比如Google持续进行无人驾驶的探索 , TOYOTA也在国外开设丰田研究室 , 可以知道目前的开发已十分贴近产品化 。因而 , 我们可分辨目前影象辨识的成熟度是介在研究与好用级别中间 。
3自然语言处理
自然语言处理(Natural language processing;NLP) , 是尝试让人工智能能理解人们所写的文字和常说的言语 。NLP首先会溶解词性 , 称之“语素剖析”(morphemic analysis) , 在溶解出最小字意企业后 , 然后将进行“语法分析”(syntactic analysis) , 接着再透过“词意剖析”(semantic analysis)去了解寓意 。
导出部分 , 自然语言处理也与生成文法(generative grammar)息息相关 。生成文法理论觉得 , 只需遵循规则即可形成文句 。这也代表着 , 只要把标准组合在一起 , 便可能形成文章 。
在自然语言处理中 , 具有代表性的运用便是“聊天机器人”(Chatbot)了 , 它是一种如真人般 , 可透过文本信息和人对话的程序 。2022年 , 脸书上线了“Facebook Messenger Platform” , 而Line也上线了“Messaging API” , 因此促进这类配备NLP科技的聊天机器人变成瞩目的焦点 。
此外 , 由IBM所研发的华生(IBM Watson) , 也是应用NLP的人工智能成的 。华生能从维基百科等语料库中提取知识 , 学习词汇与词汇中间的相关性 。如今 , 就连软件银行(SoftBank)机器人Pepper都是配备华生系统 。
只不过 , 因为在日常对话中 , 我们很常省去句子 , 也不一定会谈及时光环境 , 因而当前的Chatbot尚没法和人类开展非常好的对话 。所以 , 现行多数的Chatbot厂商 , 依然会限制对话的环境与主要用途 。