孙剑|旷视首席科学家：AI 技术十年跃迁的三个核心问题算法|rain|人工智能

文章插图

只有标准化，才能自动化，才能规模化。
只有标准化，才能自动化，才能规模化。
2011 年，小米推出第一代手机，让中国几千万年轻人先「发烧」了起来；远在广州的张小龙用「邮件思维」打造了一款用在手机上的聊天软件，不知道日后这款叫微信的产品会有超过 10 亿用户。
在汹涌而至的移动互联网浪潮这条明线之外，一条技术的暗线也在默默生长。
2009 年，伊利诺伊大学香槟分校计算机教授李飞飞的一个想法变成了现实——ImageNet 数据集成功将同行的目光拉回到数据本身，同时在接下来几年间推动了计算机视觉领域的长足发展。
2014 年，大众创新万众创业的「双创」背景下，一大批象牙塔和研究所中的计算机视觉领域「大牛」开始下海创业，拉开了近十年来狂野的「AI 跃迁」。
经过近十年的发展和探索，AI 已经不是当年「围棋之神」那样的炫酷技术，而开始寻求落地场景，进入产业，寻找创造价值的机会。
在 MegTech2021 旷视技术开放日上，旷视首席科学家、旷视研究院院长孙剑，将过去十年 AI 行业的跃迁和变化，总结成了三条「真经」。

文章插图

旷视首席科学家、旷视研究院院长孙剑
从深度学习诞生以来，新一代的 AI 有没有用就成了所有科研人员的首要命题。基础科研是任何一项技术持续突破的大前提，要证明一项技术有没有用，首先要看能否完成基础科研的价值论证。在人工智能领域基础科研指的是面向非特定场景的泛用性 AI 技术，包括基础模型、基础算法和基础应用。
旷视认为，AI 有没有用问题的答案就在基础科研带来的算法突破上。这包括三种方式：学术型科研专注创新突破，比如发一篇顶会论文，证明理论上有用；竞赛型科研挑战性能极限，比如获得一场竞赛冠军，证明实验环境有用；实用型科研看中综合优势，聚焦落地实用，比如申请一个发明专利，证明真实场景有用。
作为一家商业化公司，旷视的基础科研更看重科学价值与产业价值统一。在基础模型上，坚持软硬协同与时俱进。在基础算法上，追求通用、高效。在基础应用上，关注高性能、高灵活性和高可用度。可以说，旷视的基础科研，是一边发论文、一边打比赛，同时更是要能够服务实际业务的。基础科研需要长期主义的坚持和投入，所有的本质性创新都是时间的朋友。
2017 年的人机围棋大战让全民都开始认知到了 AI，2017 年也被认为是 AI 爆发年。但事实上，大多数 to B 的 AI 公司早就已经开始了各自的商业化落地探索。哪里有需求，哪里就有供给。AI 在各行各业各种场景中都或多或少的被应用起来，这其中有企业主攻的大赛道，也有客户尝鲜的小领域。只不过经过数年的大浪淘沙，在当时阶段更适合 AI 创造价值的领域被集中挖掘出来，比如智慧城市，智慧物流，消费电子等。
旷视认为，AI 落地的本质是让算法直接转变为产品体验与价值提升。比如，无论刮风下雨、白天黑夜、屏上还是屏下，搭载 AI 算法的设备都能很好的工作。过去，做一个产品往往是先有硬件设计，再开发配套软件，算法只是软件的附属品。现在，产品设计的环节需要算法、软件、硬件开发人员的紧密协同，就好像是一个木桶的三块板子，缺少了哪一个木桶装的水都不满，产品发挥的价值也会不够。
在技术开放日现场，旷视展示了多款前沿的技术 demo。只用一颗镜头就能在「伸手不见五指」的夜晚拍到眼前的景色。只用一个模型，就能实现任意动作的实时感知识别。这背后就是旷视基于算法-软件-硬件协同设计思路开发的新产品原型。