女科学家创业:花300天整数据,如今为超100家AI企业输送“原油”( 四 )



众所周知,企业的系统中都存在大量的音视频等非结构化数据,并没有被智能化的挖掘出来释放出其价值。而这套系统就可以帮助企业把这些杂乱无章的数据进行相应的标签化,并存储到企业的数据库中,从而便于企业基于这些数据再进行挖掘,为决策分析提供参考。

张涛谈到,在这个标注系统中,已经有大量专业术语的知识沉淀。在标注的过程中,机器可以像帮助人工解决一部分标签化的工作,而人只需要在此基础上做一些校正即可。整体操作效率预计能够提高100%以上,综合成本反而可以降低50%。

同时,为了满足更多行业和AI从业者对于训练数据的需求、降低数据使用门槛,解决找数据难的问题,今年4月上线的MagicHub.com开源社区也体现出了爱数智慧在整个行业中的前瞻式布局。

迄今为止,开源社区已拥有超过60个包含语音识别、语音合成、发音词典、自然语言理解等不同类型的开源数据集,覆盖全球超过3000名开发者,数据集累计下载量超过7万小时。MagicHub.com开源社区除了开源大量数据集外,还与各大高校和相关机构合作,通过组建开发者社群、开展培训和赛事,致力于打造全球AI开发者生态。



科学家创业重在思维转换
要以客户为中心

回顾爱数智慧5年来的发展,也是一部科学家的创业史。有投资人就曾说过,科学家创业者掌握着核心技术以及商业转化的能力,这是投资者最为关注的。但对于这些科学家创业者,最大的挑战可能在于缺乏倾听市场和客户需求的意识。

刚刚创业时,张晴晴感觉到的是既有未知的兴奋,也同时有创业0到1所带来的不确定感。“最开始,甚至财务的小姑娘都在帮我们标数据,大家没有什么区别,只要能够一起解决,大家都会伸把手”。从研究学术的科学家到成立公司面临商业化的难题,给张晴晴带来的最大挑战来自于思维上的转换。

“最开始和市场销售的同事、客户交流的时候,可能大家都不是在一个频段上。”但对于张晴晴来说,其实并没有什么退路,只能迎难而上去解决这些问题。

科研人员普遍追求的是类似于1+1=2这样一个客观真理,然后不断地思考、迭代,并且很多时候都是独立完成,但作为一家商业化定位的企业服务公司,更多时候要去看客户遇到了什么问题,并且在考虑投入产出比的情况下,如何帮助客户解决现有的问题。

张晴晴谈到,我们很多时候追求的理论上极致,不见得是一件好事,加之AI本身的发展速度非常快,如果按照现有规则解决,有可能半年后会发生一些调整,这么看来,当期的投入其实可能是不合适的。所以,科研出身的创始人在思维上很重要的转变就是要从理想化、追求极致的状态转变为以客户为中心。

实际上,这对于一个已经做了十几年科研的人来说是一个极大的挑战,但作为一个公司的创始人来说,学习能力是最为重要的能力之一,包括对于新事物的接受能力、思考问题的体系方法。这考验的是创始人是否能够基于自身的学习能力,举一反三的不断克服新的问题。

梅花创投、明势资本、策源创投、凡创资本等投资人从早期一路陪伴爱数智慧走过来的投资机构也见证了张晴晴从一个科学家到企业家的转变。

张晴晴还清楚地记得,“天使轮的投资人看到我的状态时有一种焦虑感,怕我hold不住创业这件事情。但随着公司的发展,他们也看到了我学习和成长的过程,现在已经很信任我来做这件事情了。”

没有一个所谓天生的企业家,企业也不是一成之规,投资人最为看重的是创始人在面临挑战的过程中能不能快速成长、解决问题。“在公司早期阶段的时候,更重要的是要寻找到那些相信你并认为你是潜力股的投资人。面对投资人的疑虑,公司规模的发展就是对所有投资人最好的解释。”她说道。