语音识别|女科学家创业:曾花300天整数据、被通知立刻搬家,如今她为超100家AI企业输送"原油"

语音识别|女科学家创业:曾花300天整数据、被通知立刻搬家,如今她为超100家AI企业输送"原油"
文章插图

爱数智慧创始人兼CEO 张晴晴
作者丨巴里
编辑丨子钺
图源丨受访者
“能够让机器理解人的所思所想,并能够将这些内容转化成文字是一件很酷的事情。”
17年前,还在北邮读通信的本科生张晴晴偶然间接触到了语音识别。她当时也许没有料到,在接下来的17年,语音识别会与她的理想与事业结下不解之缘。
在人工智能三驾马车中,数据是算法的基础,就好比原油,只有经过清洗、分类、标注、质检和筛选等结构化过程,才能用于AI模型训练。
2015年,已经在中科院声学所从事对话式AI研究的张晴晴意识到,如果不从根本上解决数据的问题,人工智能在未来几年仍然会面临巨大的挑战。
就这样,肩负着这份理想与情怀,一位女科学家开启了创业之旅,创立了爱数智慧。
据介绍,目前,爱数智慧已处于AI语音数据服务行业的第一梯队,为超100家国内外头部互联网公司、移动通信、知名算法公司等提供专业的AI数据解决方案。2020年,爱数智慧的营业收入接近亿元。
同时,近两年来,毕马威、华为、百度、亚马逊、英特尔等大厂人才纷纷加入爱数智慧。尤其是今年6月,前华为资深销售总监张涛也正式加盟爱数智慧任合伙人兼销售副总裁。
正值爱数智慧成立5周年,创业邦独家采访了爱数智慧创始人兼CEO张晴晴、合伙人兼销售副总裁张涛,深入解读对话式AI如何赋能企业数字化转型,以及女科学家又是如何蜕变成为一家AI数据服务公司的创始人。
女科学家曾为科研采集数据立志为AI输送“原油”从事语音识别研究已经17年的张晴晴,在最初接触到这个专业时可以说是兴趣使然。“语音信号数字处理”这门选修课,让她第一次萌生了对语音的兴趣。
后来在保研过程中,张晴晴看到中科院声学所在招语音专业的研究生,毫不犹豫立马报了名。最终,她在北邮通讯学院600多个报名的学生中脱颖而出,以第7名的成绩保送到了中科院声学研究所中科信利语音实验室,师从中科院声学所首席科学家颜永红。
后来,张晴晴成为实验室中最年轻的副高,并且获得了2014年度中科院杰出科技成就奖,又在法国国家实验室攻读博士后,可谓一个妥妥的女学霸。
自此,如何构建更好的模型,让机器更好地理解人说的语音成为了她的研究目标。
张晴晴的博士论文研究的是中国人说英语的问题。她需要用200个中国人说英语的语音进行训练模型,分析出中国人的发音特征,从而让机器用最适合的方式理解中国人说英语的特点。
为此,她收集了200个人的声音,不仅包括亲朋好友,甚至她碰见走在大街上的路人,也会习惯的问一句:“您能帮我来录个音吗?”经过300天的时间,张晴晴终于收集齐了这200个人的声音,将所有语音进行清洗和分类,并把数据送到系统模型里,仅花费了1天的时间系统就给出了第一个实验结果。
301天的时间,300天都在收集和处理数据,张晴晴发现,像这样的现象并不是只有她一个人遇到,这是很多AI科学家共同的难题。在人们普遍印象里,AI科学家每天所做的工作应该都是在构建高大上的模型,但实际上绝大多数的时间都用在了与数据做挣扎上。
那么,有没有可能创造一个大型的训练数据集,来让所有科学家和企业都能够使用呢?这一想法在张晴晴的脑海中油然而生。
直到2016年,整个市场的时机逐渐成熟。张晴晴观察到BAT等互联网巨头对于数据的需求越来越多。实际上,在这几年,人工智能曾经出现过三起三落,张晴晴的大部分师兄师姐在毕业后也都转型到了其他行业。