自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能

江苏卫视播出的沉浸式烧脑真人秀《超脑少年团》第8期和观众见面,纵观这档节目,前几期完成了抽象能力、逆行力等各项能力的考验,而到了这一期,要利用AI,让程序写诗,在我看来几乎是不可能完成的任务。为什么这么说呢?

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

不管是电脑编程还是人工智能的运用,其核心都是计算和模仿,所以通过电脑编程,得到一个最终明确的结果相对容易,比如《超脑少年团》第一期在飞机上100名乘客中,通过已知的条件找出最先被感染的无名乘客,只要程序足够扎实、精准,通过对导入数据的计算就能得出结果,这是编程一定可以完成的工作。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

而人工智能,从目前各个领域的应用来看,依然停留在对人类词汇的解读,给出既定的模仿和特定反馈的阶段,比如科大讯飞应用最普遍的文字转写、人机对话,人工智能可以通过人类语言的梳理和筛选,找出关键词,给出相应反馈。
但让程序写诗就太难了,因为这属于自然语言处理的领域,诗人们基于自身际遇、眼前情景等为元素,有感而发,在诗歌中注入情绪、感情和思想表达,这是电脑无法实现的,毕竟人工智能目前也仍旧停留在计算和模仿层面。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

因此,连刘聪院士也坦言,这种探索是“人工智能皇冠上的明珠”,足见这种尝试的难度之高,而从另一个层面来看,也说明《超脑少年团》的这期选题弥足珍贵,是对人工智能,以及节目中两组小伙伴的一次超高难度考验。
而且,少年们面对的难题,除了让人工智能模仿诗人创作,还面临着多种困难考验。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

首先是数据量有限。人工智能想要写出高质量的诗歌,需要有足够庞大的数据支撑,以及足够长时间的模型训练过程。在业界,自然语言处理领域最大的模型参数大概已经达到千亿级别,用到的数据量已经可以多达50TB以上,这相当于什么呢?让机器读了超过1亿本《红楼梦》!但两组少年得到的只是划定范围的诗词,比如杜甫的部分只给到了1000多首,这意味着人工智能只能通过有限的数据来模仿人类写诗。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

第二个困难是节目给诗歌创作限定范围,李白、杜甫两位诗人的作品极难模仿到神形兼备。李白的诗大多传递个人胸臆,诗风飘逸潇洒、洒脱豪迈、行云流水;而杜甫则恰恰相反,大多书写民生疾苦,诗风沉郁顿挫,用同一套AI系统、编程逻辑,创作出两种截然不同的风格根本就是不可能完成的任务,即便能够模仿出诗句,做到形似,也很难创作出诗词中的思想性。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能
文章插图

第三个困难是时间太短,两队少年们只有24小时的时间用来做大量数据的整理,找出内在逻辑和关键词,并且本期节目还设置了两个“小关卡”,连获取数据都要先计算得出答案才能拿到,并且在创作过程中,还要体现“轻舟”和“万里”两个关键词,想创作出让嘉宾们满意的诗词真的太难了。所以少年们到底能不能创作出理想的诗句、能到什么程度,是这期节目一开始就给出的悬念。

自然语言处理|《超脑少年团》新一期太精彩,让程序写诗,挑战不可能