人工智能的智商多高，怎么测？随着人形机器人、四足机器狗

文章图片
随着人形机器人、四足机器狗的入局者越来越多，行业也更加繁荣与热闹。抖音上，吐槽某大厂人形机器人走路蹒跚不稳、拍摄某公司四足机器狗翻倒如智障的视频也颇为火热。
其实，某大厂发布的人形机器人已经具备初步的“智商” ，具有人工智能驱动的“语义识别引擎”和“声音情感识别引擎” ，据称可以识别85种环境声音和45种人类情感分类。但仅仅是走路不够稳，就被人嘲笑是“绊倒体”、“得脑梗” ，导致其智商也跟着受到怀疑。
而问题也随着而来，人工智能机器人的智能水平，究竟如何衡量？看语音语义的识别，还是走路的姿态？近日，据文汇报报道，由国内外行业组织专家共同研制、八家行业组织共同发布的机器人智能等级标准对外发布，并宣称是“我国首个机器人智能标准” 。
该机器人智能等级标准基于感知、认知、决策、执行四大智能要素进行划分，包含机器人综合智能等级、机器人要素智能等级，将机器人智能程度从低到高按照L1（基础型）、L2（半交互型）、L3（交互型）、L4（自主型）、L5（自适应型）分为5级。
这与国际自动机工程师学会（SAEInternational）关于自动驾驶领域的“L0（无自动化）-L5（完全自动化）”的等级划分方法恰好不谋而合。这是一种英雄所见略同吗？机器人智力测试标准，重要在哪里？机器人智商水平测试标准，又如何引领产业发展？
给机器人“测智商” ，很重要
机器有智能吗？机器会理解吗？机器能思考吗？从十七世纪至今，每一次机器功能的重大突破，这问题都被翻出来问一遍，只是否定它变得愈来愈困难了。
1950年，图灵发表了一篇影响时代的论文《机器能思考吗？》，预言人类有可能在2000年左右创造出具有类似人类智慧的机器，他也由此开始思考怎样按照人类的标准测试机器人智商的课题。
图灵认为：假如通过电传终端与另一边进行对话，人们无法区分那边是机器还是人类？那么就该承认这个机器是智能的。这个测试称为“图灵测试”（TurningTest），图灵的主张在认知科学上称为功能主义。
但是，美国伯克利大学教授约翰·塞尔（JohnSearle）在1980发表的一篇探讨心智哲学的论文，却提出了“中文屋（Chineseroom）”思想实验。塞尔构造的“中文屋” ，模仿图灵测试，但继承了莱布尼茨的思辨，考察形成这种智能的每一个构件，在这里除了唯一具有理解力的本人外，其他一切都是没有生命的工具和机械性的操作，却能表现出理解中文的行为，而他其实不懂得中文。所以说这行为只是一种扮演。
图灵认为只要宏观功能与人类的智力行为是相同的，我们可以用智能这个词来描述这个功能。如在围棋赛中，谈的是博弈技艺高低的宏观测试，说机器具有智能并无不可，语言对话也是如此。塞尔则强调它们内在的机制不同和有否表达真正的意向，说这中文屋仅仅是对话功能的模拟，并不具备理解这活动的能力。

文章图片
正是在这个意义上，塞尔将人工智能分为两类：能够理解自然语言，并在模仿人类行为时具有类似心理活动的机器，被称为“强人工智能（StrongAI）”；那种只有模仿功能却没有思想的机器智能，被称为“弱人工智能（WeakAI）” 。他认为， “研究大脑”与“研究心智”无关，图灵测试不足以确立心理状态；没有理解力或者意向性（intentionality），就不能说机器会思考，因此也就没有通常意义下的思维能力。