昆仑万维|全球航海十余载,昆仑万维深潜AIGC( 三 )


应用AI技术后 , Opera成功实现了快速发展 。 Opera 2022年第三季度业绩大幅超出之前的指引高线 , 营收同比增长28% , 达到8530万美元;调整后EBITDA达到 2140万美元 , 而2021年同期调整后EBITDA为820万美元 , 同比大增161% 。 Opera News成为昆仑万维在非洲、东南亚等新兴市场的增长曲线和业务抓手 。
除此之外 , 昆仑万维也在多年的出海历程中 , 搭建起一套对技术和创新的组织机制 , 从而建立起自己的“文化数据库”——包含覆盖全球多个地区的内容、资讯 , 可以认为是一种文化行业的know-how 。
昆仑万维的业务遍布全球一百多个国家和地区 。 从2009年就开始出海 , 昆仑万维多年来已经拥有一套成熟的运营体系——“我们进入任何一个国家 , 都是先推广一段时间 , 试试看 , 再根据结果去调整 。 ”方汉在接受创业邦采访时表示 。
日积月累下 , 从对AI技术的探索 , 到“文化数据库”的建立 , 都成为此次发布的“昆仑天工”的铺垫和前奏 。

02 AIGC , 内容生态的“神经网络” 如今 , “昆仑天工”作为昆仑万维集团的AI新板块 , 将成为业务的新增长动力 。
昆仑天工在2020年下半年正式启动 , 至今已经投入了数千万元的技术投入 , 技术进展迅速:在项目启动不到一年 , 2021年8月 , 昆仑天工就开始研发基于自有大文本模型的对话机器人 , 并且迅速刷新国内技术指标 。
当前 , 昆仑天工已经形成两大类技术方向 , 一是类GPT大模型的应用 , 基于多国语言大模型实现文字、图像等生成工作 , 旗下已有包括天工巧绘、天工智码(编程代码)、天工妙笔 。 二是AI+音乐 , 这是昆仑万维集团具有独创优势的业务 。
AI大模型从数据底层到真正落地应用 , 都并非一日之功 。 由于中美市场开源生态不同 , 且当今美国公司所研发的大模型并没有完全对国内市场开放 , 中英文之间也存在巨大差异 。 总体而言 , 中文领域的AI大模型处于发展更早期 , 谁做得更早、数据质量更高、算法更好——成为这一轮竞争胜出的关键 。
而从数据底层来看 , 不同于如今看到AIGC前景才刚刚入局的公司 , 昆仑万维在多国大模型上的布局可以追溯到两年前 , 现在已经初露锋芒 。
方汉表示 , 从技术底层看 , 昆仑万维针对中文领域构建了千亿级别的高质量数据集 。 通过高性能a100-gpu集群 , 昆仑天工进行精益求精的训练后 , 得到百亿参数量的GPT-3生成模型 。
“我们针对中文特点 , 重新设计了独特的中文编码方式 , 更加符合中文语言习惯 , 让我们各项指标都优于市面上的很多模型 。 ”他解释道 。
当前 , 昆仑天工的AI大模型能够拥有多样的任务能力 , 包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等 。 当前 , 在各项专业性领域的任务中 , 如分类、匹配、填空、识别等 , 昆仑天工的表现突出 , 与现有中文大模型的对比 , 也能够排列前茅 。
以天工巧绘Skypaint为例 , 这是全球第一款多语言stable diffusion分支模型支持中英双语的提示词输入 , 实现文字生成图像 , 在数量和丰富度上都有较好优势 。
昆仑天工AI绘画作品
而更值得一提的 , 昆仑万维旗下的音乐平台StarMaker , 是依靠自研的垂直AIGC算法 , 成功实现AIGC商业化的成功案例 。
StarMaker为昆仑万维董事长周亚辉孵化的音频社交平台 。 2017年 , StarMaker刚刚诞生时 , 就选择了以K歌作为切入音频社交的入口 。
这一业务在中国已经不是新鲜事 , 但在中东、非洲、东南亚等市场 , 还是蓝海领域 。 在拓展到这些市场时 , 团队面临的最大问题并不是版权 , 而是伴奏带 。