字节跳动推荐平台技术公开,项亮:底层架构有时比上层算法更重要

字节跳动已正式吹响进军云计算市场号角 。
12月2日 , 火山引擎全系列云产品亮相 , 共推出了78项云产品服务 , 涵盖云基础、视频及内容分发、数据中台、开发中台、人工智能等五大类 。
火山引擎云产品以性价比、提升业务价值作为重要卖点 。 发布会上 , 字节跳动AML(应用机器学习)负责人项亮出现在“新云?智享盛宴”分会场 , 详细介绍了智能推荐如何结合云服务为企业创造价值 , 并首次向外界分享了火山引擎智能推荐系统的技术演进和应用实践 。
项亮是《推荐系统实践》的作者 , 其所在的字节跳动AML团队 , 为火山引擎的智能推荐技术服务提供了全力支持 。
以下为项亮演讲全文 。
项亮演讲原文
很多人理解推荐就是推荐算法 , 机器学习模型怎么做的、这些模型怎么调参 , 觉得这些很重要 。 其实我想说 , 推荐系统里底层的工程架构、系统架构非常重要 , 某种程度上会超过上层的算法 。
我们在内部很多实践里也看到 , 底层工程架构、系统架构如果出现问题 , 对业务造成的影响是大于算法的 。 这就是火山引擎为什么要推出推荐系统平台这样一个偏底层架构的产品 。
我给大家分三个方面介绍一下智能推荐平台:首先介绍推荐在不同产品、不同业务中究竟发挥什么作用 , 以及智能推荐平台会给企业带来什么价值;然后我会稍微详细介绍一下平台各个模块大概是做什么的 , 具有什么能力;最后介绍一些我们客户使用推荐系统的案例 。
可以做选择的地方 , 就可以做推荐
我做推荐系统已经十几年了 。 很早之前 , 很多人认为推荐就是锦上添花的工作 。 但是在今日头条、抖音这些产品的成长中 , 个性化推荐发挥了重要的作用 。 推荐也逐渐成为了互联网信息分发的主流模式 。
信息分发到现在一共经过了四个阶段 , 这些阶段一方面有先后顺序 , 另一方面也不完全是替代关系 。 比如最早的门户时代 , 信息分发的方式是分类索引;到了谷歌做搜索引擎 , 这是基于用户的主动性 , 通过搜索的方式发现信息;再往后出现了脸书、YouTube , 还有国内的微博、微信这些产品 , 用户基于订阅关注获得信息;然后就是推荐引擎 , 从“人找信息”变成了“信息找人” 。 这是在移动互联网时代快速发展起来的 , 现在已经成为了比较主流的信息分发方式 。
所有可以选择的地方 , 为了解决用户选择困难 , 基本都可以上推荐系统 。 比如今日头条 , 用户看新闻 , 肯定是适合用推荐的 , 还有大家熟悉的短视频 。 分类信息也可以做推荐 , 信息的分类一般会有很多 , 手机屏幕再大也是有限的 , 一屏展示不了多少内容 。 电商的热门推荐也一样 。
说起电商的推荐 , 商品详情页这个地方 , 以前最早亚马逊做了打包交叉销售 , 当用户买了一本书的时候 , 可以推荐别的书 。 最开始大家只考虑推荐的商品和当前买的东西是否相关 , 但现在都会考虑个性化推荐 , 不仅要和当前商品相关 , 还要和消费者的兴趣产生关系 。
新用户冷启动也已经涉及到推荐 。 一般有产品会专门做精选页面、热门页面给新用户 。 虽然是新用户 , 也可以通过推荐的技术提升效果 。 像大屏 , 现在智能电视很普及 , 我们家已经没有传统电视了 , 智能电视的节目也是需要推荐的 。
另外还有社交、应用市场、音视频、小说的推荐 , 基本上可以看到 , 凡是可以做选择的地方都可以做推荐 , 对效果的影响也很大 。
定好目标 , 剩下的交给机器学习
智能推荐可以帮助客户提升流量活跃度、销售贡献度和效率 。 但是 , 搭建整个推荐系统是非常耗费资源的事情 。 你做推荐系统 , 肯定要做得更实时 , 特征回流要快 , 这些东西都消耗大量的人力成本 , 试错成本也很大 。