语音识别|女科学家创业:曾花300天整数据、被通知立刻搬家,如今她为超100家AI企业输送"原油"( 二 )


在人工智能三驾马车中,数据是算法的基础,就好比原油,只有经过清洗、分类、标注、质检和筛选等结构化过程,才能用于AI模型训练。如果不从根本上解决数据的问题,人工智能在未来几年仍然会面临巨大的挑战。
作为一个人工智能从业者,她希望这一次的人工智能可以一直向前,不再衰落。也正是肩负着这样的情怀和理想,终于在同年11月,爱数智慧在北京正式成立。
经过五年的发展,公司已经从最开始10个人的小团队发展到100多人规模。在这其中,有一件事始终让张晴晴印象深刻,直至今日,她也认为是创业过程中最大的挑战之一。
2017年,公司刚刚成立一年,为了节省成本,张晴晴只能租下在北京海淀区的一个商住两用楼的房间里办公。那段时间,北京大兴区的几场大火让存在消防隐患的办公楼都受到了波及。
一个周日的下午,消防队员走进大楼,公司被告知这个楼的消防不合规,需要当天晚上立刻撤走。当时,办公室里一共50个员工的办公物品,张晴晴需要在3-4个小时的时间里,把所有人的电脑、座椅、办公用品全部搬走。面对突如其来的打击,张晴晴仿佛无所适从。
“如果我是一个员工,听着我的老板打电话告诉我说我们要立刻搬家,员工会觉得这个公司很不靠谱吧,还要不要在这里继续工作?”这些话不由自主地浮现在了张晴晴的脑海里,开始忐忑起来。但她很快晃过神来:不可能以一己之力完成,需要求助团队的力量,马上告诉大家。
听到这个消息之后,所有员工没有一个人抱怨。50个员工仅用一晚上的时间就把所有东西搬到了新的办公楼里,第二天团队还面临着给客户交付数据。
第二天10点,所有人准时打开了电脑开始办公。而在那个时刻,公司还正在忙着A轮融资。投资人看到了整个过程以及所有人的凝聚力,毅然决然地投下了A轮。
“公司一路发展过来,几乎碰到了所有创业者都会遇到的问题,早期甚至有可能明天就发不出工资了。但好在我们一直坚信公司的目标和战略,如今终于迎来了人工智能行业的爆发。”张晴晴说。
据艾瑞分析《2020年中国AI基础数据服务行业发展报告》显示,2019年中国AI基础数据服务行业市场规模达到30.9亿元,其中语音类数据需求规模占比为39.1%,预计到2025年数据市场规模将突破100亿元,年化增长率21.8%。
伴随着数据市场的爆发,今年年初,爱数智慧也已完成B轮融资。目前,公司已经处于AI语音数据服务行业的第一梯队,为全球超过100家顶级人工智能企业提供相应的数据服务,而且规模也已经达到了上亿的小目标。
语音识别|女科学家创业:曾花300天整数据、被通知立刻搬家,如今她为超100家AI企业输送"原油"
文章插图

爱数智慧-融资历程
打造对话式AI三大基石赋能企业数字化转型公司成立之初,张晴晴就把她一直在研究的对话式AI(Conversational AI)作为公司发展重点。在她看来,对话式一定是AI人机交互的终极形态,突破对话式形态代表着强人工智能时代的到来。
张晴晴之所以创立爱数智慧很重要的一点就是要把公司定位于AI人机交互这一场景,让人和机器可以以一种非常自然的方式进行交流。
从技术角度看,对话式AI涉及语音识别、自然语言理解和语音合成等技术,想要通过这些技术实现人和机器更自然的对话,面临着更大的难题。对话式口语常常会有语序颠倒,犹豫、迟疑产生的停顿,多人同时交流甚至出现语句打断、抢话、交叠音等复杂语音场景,这都为 AI建模带来了很大困难。
目前,从数据行业看,行业提供的大部分人工智能数据都以朗读式训练数据为主,而人与人自然的对话式数据对训练对话式 AI 有更加关键的作用。“要想把机器训练成人,使得机器可以像人一样能够理解语言,这就需要我们为机器注入知识图谱、中文、方言、外语等等,这确实有很大的难度,但这正是我们意义所在。”张晴晴说道。