limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户( 三 )


海天瑞声的研发投入主要由训练数据产品开发相关支出、基础研发支出两部分构成,其中训练数据产品开发相关支出主要为开发训练数据产品对应的数据服务费及部分职工薪酬等(该部分支出未计入营业成本)。
仅从基础研发支出(主要为海天瑞声研究开发训练数据开发生产所需的算法、技术以及工具、平台等的支出)来看,2018年-2020年,海天瑞声基础研发投入也是上升趋势,分别为1469.94万元、1951.79万元和2127.07万元,累计5548.80万元,平均占报告期营业收入的8.36%。
根据招股书,海天瑞声已取得26项专利授权(其中发明专利24项、实用新型专利1项、外观设计专利1项),134项计算机软件著作权,另有2项专利正在申请之中。但有部分专利存在被无效的情况。
截至2020年12月31日,海天瑞声现有研发人员44名,占公司员工总数的比例为29.14%;技术人员59名,占比39.07%。
其中核心技术人员6名,占比3.97%,分别为唐涤飞(董事、总经理)、李科(董事、副总经理)、黄宇凯(董事、副总经理、技术总监)、郝玉峰(副总经理、技术总监、首席科学家)、曹琼(计算机视觉业务部总监)及邵志明(高级研发工程师)。
limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户
文章插图
海天瑞声核心技术人员基本情况及对公司研发的具体贡献
海天瑞声已掌握12项核心技术,通过算法与数据处理技术并用,可以满足AI算法在不同应用场景下的训练数据需求,可对大规模数据进行高效的加工或质检。
limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户
文章插图
海天瑞声各层次核心技术示意图
海天瑞声自主开发了一体化数据处理平台,融入项目流程管理、质量把控、数据安全管理,嵌入生产所需的各类工具、软件模块。
limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户
文章插图
海天瑞声一体化数据处理平台
截至2020年12月31日,海天瑞声拥有760余个自有知识产权的训练数据产品;截至招股书签署日,已积累下超过100个语种/方言的发音词典,累计词条数超过1000万条。
四、中国移动持股超10%,创始人贺琳为实际控制人截至招股书签署日,海天瑞声创始人兼现任董事长贺琳直接持有海天瑞声866.97万股(占发行前总股本的27.01%),并通过控制北京中瑞安投资中心间接控制海天瑞声495.41万股(占发行前总股本的15.43%),合计占海天瑞声42.44%股份,为海天瑞声控股股东、实际控制人。
limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户
文章插图
海天瑞声股权结构图
根据招股书,海天瑞声一共有14名股东,其中2名为自然人股东,2名为员工持股平台,10名为其他机构股东。
其中持股比例超过5%的有7名,分别是贺琳、中瑞安(员工持股平台)、中国移动控股的中移投资、唐涤飞、清德投资、上海丰琬和中瑞立(员工持股平台)。
limited|AI训练数据服务商海天瑞声上市!开盘涨超360%,微软阿里腾讯为大客户
文章插图
海天瑞声股东名单
结语:训练数据是刚需,海天瑞声已实现进口替代人工智能产品落地过程中需要用到大量的训练数据,不同阶段和不同场景下对数据的需求也存在差异,有些时候需要定制化的训练数据集。
随着越来越多人工智能应用场景的出现,对于数据的需求也不断增长,训练数据服务市场前景较为广阔。根据艾瑞咨询《2020年中国AI基础数据服务行业研究报告》,2019年中国基础数据服务行业的市场规模达到30.9亿元,预计2025年将突破100亿元。
从2019年主动撤回上市申请,到2020年其IPO再重新获受理,再到今年成功上市。海天瑞声科创板上市可以说存在一些波折,其中多次被问询的就是其核心技术和竞争力方面。