人工智能的智商多高,怎么测?

人工智能的智商多高,怎么测?
文章图片
随着人形机器人、四足机器狗的入局者越来越多 , 行业也更加繁荣与热闹 。 抖音上 , 吐槽某大厂人形机器人走路蹒跚不稳、拍摄某公司四足机器狗翻倒如智障的视频也颇为火热 。
其实 , 某大厂发布的人形机器人已经具备初步的“智商” , 具有人工智能驱动的“语义识别引擎”和“声音情感识别引擎” , 据称可以识别85种环境声音和45种人类情感分类 。 但仅仅是走路不够稳 , 就被人嘲笑是“绊倒体”、“得脑梗” , 导致其智商也跟着受到怀疑 。
而问题也随着而来 , 人工智能机器人的智能水平 , 究竟如何衡量?看语音语义的识别 , 还是走路的姿态?近日 , 据文汇报报道 , 由国内外行业组织专家共同研制、八家行业组织共同发布的机器人智能等级标准对外发布 , 并宣称是“我国首个机器人智能标准” 。
该机器人智能等级标准基于感知、认知、决策、执行四大智能要素进行划分 , 包含机器人综合智能等级、机器人要素智能等级 , 将机器人智能程度从低到高按照L1(基础型)、L2(半交互型)、L3(交互型)、L4(自主型)、L5(自适应型)分为5级 。
这与国际自动机工程师学会(SAEInternational)关于自动驾驶领域的“L0(无自动化)-L5(完全自动化)”的等级划分方法恰好不谋而合 。 这是一种英雄所见略同吗?机器人智力测试标准 , 重要在哪里?机器人智商水平测试标准 , 又如何引领产业发展?
给机器人“测智商” , 很重要
机器有智能吗?机器会理解吗?机器能思考吗?从十七世纪至今 , 每一次机器功能的重大突破 , 这问题都被翻出来问一遍 , 只是否定它变得愈来愈困难了 。
1950年 , 图灵发表了一篇影响时代的论文《机器能思考吗?》 , 预言人类有可能在2000年左右创造出具有类似人类智慧的机器 , 他也由此开始思考怎样按照人类的标准测试机器人智商的课题 。
图灵认为:假如通过电传终端与另一边进行对话 , 人们无法区分那边是机器还是人类?那么就该承认这个机器是智能的 。 这个测试称为“图灵测试”(TurningTest) , 图灵的主张在认知科学上称为功能主义 。
但是 , 美国伯克利大学教授约翰·塞尔(JohnSearle)在1980发表的一篇探讨心智哲学的论文 , 却提出了“中文屋(Chineseroom)”思想实验 。 塞尔构造的“中文屋” , 模仿图灵测试 , 但继承了莱布尼茨的思辨 , 考察形成这种智能的每一个构件 , 在这里除了唯一具有理解力的本人外 , 其他一切都是没有生命的工具和机械性的操作 , 却能表现出理解中文的行为 , 而他其实不懂得中文 。 所以说这行为只是一种扮演 。
图灵认为只要宏观功能与人类的智力行为是相同的 , 我们可以用智能这个词来描述这个功能 。 如在围棋赛中 , 谈的是博弈技艺高低的宏观测试 , 说机器具有智能并无不可 , 语言对话也是如此 。 塞尔则强调它们内在的机制不同和有否表达真正的意向 , 说这中文屋仅仅是对话功能的模拟 , 并不具备理解这活动的能力 。
人工智能的智商多高,怎么测?
文章图片
正是在这个意义上 , 塞尔将人工智能分为两类:能够理解自然语言 , 并在模仿人类行为时具有类似心理活动的机器 , 被称为“强人工智能(StrongAI)”;那种只有模仿功能却没有思想的机器智能 , 被称为“弱人工智能(WeakAI)” 。 他认为 , “研究大脑”与“研究心智”无关 , 图灵测试不足以确立心理状态;没有理解力或者意向性(intentionality) , 就不能说机器会思考 , 因此也就没有通常意义下的思维能力 。