2600亿!全球最大中文单体模型在深圳发布( 二 )


鹏城-百度·文心的可控和可信学习算法
在算法设计上 , 为进一步提升模型语言理解能力以及写小说、歌词、诗歌、对联等文学创作能力 , 研究团队提出了可控学习和可信学习算法 。
在可控学习方面 , 通过将模型预测出的文本属性和原始文本进行拼接 , 构造从指定属性生成对应文本的预训练数据 , 模型通过对该数据的学习 , 实现不同类型的零样本生成能力 。 用户可以将指定的体裁、情感、长度、主题、关键词等属性自由组合 , 无需标注任何样本 , 便可生成不同类型的文本 。
在可信学习方面 , 针对模型生成结果与真实世界的事实一致性问题 , 鹏城-百度·文心通过自监督的对抗训练 , 让模型学习区分数据是真实的还是模型伪造的 , 使得模型对生成结果真实性具备判断能力 , 从而让模型可以从多个候选中选择最可靠的生成结果 , 显著提升了生成结果的可信度 。
2600亿!全球最大中文单体模型在深圳发布
文章图片
本次发布的鹏城-百度·文心 , 将进一步解决传统AI技术在推广中缺乏领域和场景化数据等关键难题 , 推动人工智能进入大规模、可复制的大工业落地阶段 。
未来 , 鹏城-百度·文心大模型可以在通信、医疗、金融等多行业领域按照人类的思维模式进行语言处理 。
采访人员/靳阳懿
【来源:深圳卫视深视新闻】
2600亿!全球最大中文单体模型在深圳发布】版权归原作者所有 , 向原创致敬