lun不一样的科大讯飞,他们把计算机视觉踢进“世界杯”( 五 )


这与李开复在《AI未来》一书中的观察不谋而合:
西方国家点燃了深度学习的火炬,但最大的受益者将会是中国,这种全球性的变化是由两方面的转变引起的:从发明的年代转变为实干的年代;从专家的年代转变为数据的年代。
此外,一位ACM高级科学家曾经告诉我们,现在AI学界研究的风气大变,灌水现象也特别严重,"将从学界拿到的论文用于技术落地时,对其结论首先都要打一个问号。"
业界做AI学术被质疑理论不够扎实,学界在缺少资源的情况下,亦难以研究大规模的问题。或许两者汇集之后我们才能提出更好的基础研究问题。
"我们也发现了一个现象:在企业研究院发论文对于学生而言很有吸引力,能为他们的简历增光。但这个现象持续下去,是否对整个行业有促进作用,值得探讨。"殷保才补充道。
企业研究不仅需要在技术水平上"顶天",又要在技术价值上"立地"。这其实也正是科大讯飞AI研究院一直秉承的价值观——顶天立地。
在资源投入上,科大讯飞以市场导向分配"弹药",遵循"721研发投入模式"。
"我们每年拿出20%以上的营收投入到研发中,其中70%的资源投入当前的主导产品,20%投入战略新产品,10%投入探索型的、不追求一定要有回报的方向,它可以很自由地探索未来。”而殷保才主要就在负责2和1的部分。
指尖交互、手势交互、多模态识别、遥感方向、智慧畜牧等都是他将投入的方向。
"视觉前瞻的每一个尝试,基于我们的业务需求、未来趋势判断以及扩展研究院的能力建设,但最终都是为了能够拓宽整个视觉领域的应用边界。"殷保才补充道。
吴嘉嘉则将继续深耕OCR,打通OCR技术链路。在整个职业生涯中,吴嘉嘉前三、四年聚焦于钻研技术,带团队之后,开始思考整个技术链路的问题。
从孤立字识别到文本行识别,是从1到10的阶段跨越;而从文本行识别到公式识别,则是从10到100的飞跃。
如今,团队正在攻关一个“300”难度的任务——篇章级公式识别,"当然,说不定是1000。"
从孤立字识别、文本行识别、公式识别到篇章级识别,是一场从点到线到面再到网络的升维进化,科大讯飞亦在OCR领域建立起了较高的技术壁垒。在实际应用中,以教育为例,学生作业试卷文档存在版面结构复杂、书写风格差异显著等难点问题也变得可解。
如今作为OCR条线的负责人,面对团队日渐增长的团队规模,他也有了新的梦想,“保持核心技术的领先水平,屹立于世界的前沿。同时让人工智能技术应用到更多的领域内,让科技所带来的改变惠及大众。”

lun不一样的科大讯飞,他们把计算机视觉踢进“世界杯”
文章插图

5

科大讯飞——自成神经网络
这对“才”子“嘉”人在科大讯飞的成长故事,也是科大讯飞不断扩展的缩影。
专注AI多年的科大讯飞,自身已成一个神经网络——很宽、很深的生成式神经网络。
一个典型的生成式神经网络包括了输入层、编码层、输出层。对于一个AI企业而言,输入是AI三要素:算力、数据、算法,输出是技术和产品,编码层则是企业的组织方式和技术方法论,以及企业的人才。
各个节点并非孤立,紧密链接,由此在“技术顶天”与“应用落地”这一天地两端,用人工智能建设美好世界。
【 lun不一样的科大讯飞,他们把计算机视觉踢进“世界杯”】雷锋网雷锋网雷锋网