2600亿！全球最大中文单体模型在深圳发布( 二 ) 作为当前人工智能发展的重要

鹏城-百度·文心的可控和可信学习算法
在算法设计上，为进一步提升模型语言理解能力以及写小说、歌词、诗歌、对联等文学创作能力，研究团队提出了可控学习和可信学习算法。
在可控学习方面，通过将模型预测出的文本属性和原始文本进行拼接，构造从指定属性生成对应文本的预训练数据，模型通过对该数据的学习，实现不同类型的零样本生成能力。用户可以将指定的体裁、情感、长度、主题、关键词等属性自由组合，无需标注任何样本，便可生成不同类型的文本。
在可信学习方面，针对模型生成结果与真实世界的事实一致性问题，鹏城-百度·文心通过自监督的对抗训练，让模型学习区分数据是真实的还是模型伪造的，使得模型对生成结果真实性具备判断能力，从而让模型可以从多个候选中选择最可靠的生成结果，显著提升了生成结果的可信度。

文章图片
本次发布的鹏城-百度·文心，将进一步解决传统AI技术在推广中缺乏领域和场景化数据等关键难题，推动人工智能进入大规模、可复制的大工业落地阶段。
未来，鹏城-百度·文心大模型可以在通信、医疗、金融等多行业领域按照人类的思维模式进行语言处理。
采访人员/靳阳懿
【来源：深圳卫视深视新闻】
【2600亿！全球最大中文单体模型在深圳发布】版权归原作者所有，向原创致敬