数据集|AI技术与人类专业知识相叠加才能得到“真实智能” 麦克风|声学|耳机|tws|主动降噪

如今，机器越来越擅长完成以往只能由人类解决的任务。这在很大程度上要归功于机器学习技术的快速进步，为我们带来能够利用数据做出良好决策的强大机器。随着模型在模拟或现实场景下接受的数据训练逐渐增多，其执行任务的熟练程度也不断提升。这就是我们常说的人工智能(AI)，也代表着人类有史以来制造出的最接近具备学习能力、思考能力与决策能力的机器方案。

文章插图
那么，这种史无前例的新趋势会不会引发普遍裁员，甚至给整个社会造成巨大的损害与颠覆?不少人认为很有可能。另一方面，也有人认为AI技术的发展会再次更新人类的工作与生产力范式;未来将由机器处理一切肮脏、无聊及危险的工作内容，而人类则更自由地把时间投入到更具创意、乐趣或社交意义的活动当中。
但以往的经历告诉我们，每一场科技革命既不太会走向最糟糕的方向、也往往达不到最乐观的估计。确实，已经有部分机器人在低技能工作岗位上给从业者带来威胁——包括亚马逊推出的无人收银商店、麦当劳提出的AI得来速餐厅等计划。但作为更靠谱的整体预测，世界经济论坛估计到2025年，AI与自动化将消灭总计8500万个工作岗位，但同时新增约9700万个工作机会。
律师、会计师、医生、计算机程序员、网页设计师、作家以及地质技术员等无数以往只能由人类完成的职位，如今也在一定程度上可以由计算机接手。但我仍然觉得单凭技术的升级不太可能完全抹除“人”这个核心元素，AI算法也不行。根据目前的主流趋势来看，业界仍普遍认为高水平主题专家加上复杂技术培训工具的组合才是获得成功的王道。
这些观点，来自道琼斯数据战略主管Ingrid Verschuren最近在采访中的表述。人类才是AI背后真正的驱动“机器源”。无论在哪种应用场景下，都是由人类选择用于训练算法的数据，并指定希望AI模型实现的结果。也许是撰写出最具吸引力的销售广告方案，也许是分析人口热图以预测流行病可能在哪些点位爆发。机器只负责简单的最佳结果预测过程，一切对结果至关重要的参数范围都由人类所明确指定。
Verschuren自己的职业经历就是个很好的例子。在九十年代刚刚加入道琼斯时，她的第一份工作就是阅读并手动标记新闻内容，协助在数字内容管理系统中创建索引。在工作三年之后，这部分任务已经实现了全面自动化，而她本人则转为监督这套每天能够处理近100万篇文章的AI系统——即使把人力规模扩大十倍，这样的工作能力也远超人类团队的极限水平。
她告诉我们，“我们既有人工智能，也有人类专业知识;只有把二者结合起来，才能获得所谓「真实智能」。而且这两个部分有着相同的份量。”
AI的核心在于从众多不同数据集内吸取相关性洞见。在Verschuren监督过的一项负责检测潜在金融交易欺诈的工作当中，AI系统需要处理超过500套不同数据集。现在的AI还不能、恐怕在未来很多年内也无法自主决定从哪些数据集中学习，并判断哪些数据集的内容与当前任务没有相关性。另外，AI也没有能力评估数据集中的偏见/偏差等问题。如果在数据集汇总过程中不慎引入了负面研究方法——例如忽略了那些代表性不足的人群的相应数据，那么结果显然无法准确反映出现实情况。换句话说，“进的是垃圾，出的也只能是垃圾”。总之，这类任务必须由充分了解该主题的人类专家进行监督。
Verschuren自己还有另一段颇具说服力的经历。她的团队曾经负责一套风险警报系统，能够在银行及其他金融机构接触到可能被列入国际制裁名单的个人或实体时发出提醒——这也是合规体系中的关键组成部分。有一次，一套AI系统意外清除了多笔交易，原因是分析师觉得其中的参与者有可能被列入制裁清单。但在复查制裁清单内容之后，他们发现相关方的名称已经被删除，并不存在交易风险。很明显，这代表着分析师自己的直觉判断出了问题，所以她的团队及时跟进、手动验证这场矛盾到底孰是孰非。最终证明，相关方确实受到了制裁、只是名称在清单中被错误删除，看起来分析师的直觉判断准确无误。面对这样复杂的局面，机器本身当然无法做到自我监督，只有人类专家的引导才能避免出现昂贵甚至是危险的潜在错误。

数据集|AI技术与人类专业知识相叠加 才能得到“真实智能”

数据集|AI技术与人类专业知识相叠加才能得到“真实智能”