孙剑|旷视首席科学家:AI 技术十年跃迁的三个核心问题


孙剑|旷视首席科学家:AI 技术十年跃迁的三个核心问题
文章插图

只有标准化,才能自动化,才能规模化。
只有标准化,才能自动化,才能规模化。
2011 年,小米推出第一代手机,让中国几千万年轻人先「发烧」了起来;远在广州的张小龙用「邮件思维」打造了一款用在手机上的聊天软件,不知道日后这款叫微信的产品会有超过 10 亿用户。
在汹涌而至的移动互联网浪潮这条明线之外,一条技术的暗线也在默默生长。
2009 年,伊利诺伊大学香槟分校计算机教授李飞飞的一个想法变成了现实——ImageNet 数据集成功将同行的目光拉回到数据本身,同时在接下来几年间推动了计算机视觉领域的长足发展。
2014 年,大众创新万众创业的「双创」背景下,一大批象牙塔和研究所中的计算机视觉领域「大牛」开始下海创业,拉开了近十年来狂野的「AI 跃迁」。
经过近十年的发展和探索,AI 已经不是当年「围棋之神」那样的炫酷技术,而开始寻求落地场景,进入产业,寻找创造价值的机会。
在 MegTech2021 旷视技术开放日上,旷视首席科学家、旷视研究院院长孙剑,将过去十年 AI 行业的跃迁和变化,总结成了三条「真经」。

孙剑|旷视首席科学家:AI 技术十年跃迁的三个核心问题
文章插图

旷视首席科学家、旷视研究院院长孙剑
从深度学习诞生以来,新一代的 AI 有没有用就成了所有科研人员的首要命题。基础科研是任何一项技术持续突破的大前提,要证明一项技术有没有用,首先要看能否完成基础科研的价值论证。在人工智能领域基础科研指的是面向非特定场景的泛用性 AI 技术,包括基础模型、基础算法和基础应用。
旷视认为,AI 有没有用问题的答案就在基础科研带来的算法突破上。这包括三种方式:学术型科研专注创新突破,比如发一篇顶会论文,证明理论上有用;竞赛型科研挑战性能极限,比如获得一场竞赛冠军,证明实验环境有用;实用型科研看中综合优势,聚焦落地实用,比如申请一个发明专利,证明真实场景有用。
作为一家商业化公司,旷视的基础科研更看重科学价值与产业价值统一。在基础模型上,坚持软硬协同与时俱进。在基础算法上,追求通用、高效。在基础应用上,关注高性能、高灵活性和高可用度。可以说,旷视的基础科研,是一边发论文、一边打比赛,同时更是要能够服务实际业务的。基础科研需要长期主义的坚持和投入,所有的本质性创新都是时间的朋友。
2017 年的人机围棋大战让全民都开始认知到了 AI,2017 年也被认为是 AI 爆发年。但事实上,大多数 to B 的 AI 公司早就已经开始了各自的商业化落地探索。哪里有需求,哪里就有供给。AI 在各行各业各种场景中都或多或少的被应用起来,这其中有企业主攻的大赛道,也有客户尝鲜的小领域。只不过经过数年的大浪淘沙,在当时阶段更适合 AI 创造价值的领域被集中挖掘出来,比如智慧城市,智慧物流,消费电子等。
旷视认为,AI 落地的本质是让算法直接转变为产品体验与价值提升。比如,无论刮风下雨、白天黑夜、屏上还是屏下,搭载 AI 算法的设备都能很好的工作。过去,做一个产品往往是先有硬件设计,再开发配套软件,算法只是软件的附属品。现在,产品设计的环节需要算法、软件、硬件开发人员的紧密协同,就好像是一个木桶的三块板子,缺少了哪一个木桶装的水都不满,产品发挥的价值也会不够。
在技术开放日现场,旷视展示了多款前沿的技术 demo。只用一颗镜头就能在「伸手不见五指」的夜晚拍到眼前的景色。只用一个模型,就能实现任意动作的实时感知识别。这背后就是旷视基于算法-软件-硬件协同设计思路开发的新产品原型。