又一篇超百名作者的 AI 论文问世！442位作者耗时两年发布大模型新基准 BIG-bench……( 三 ) 作者|李梅、刘冰一编辑|陈彩娴

文章图片
当手动检查模型输出时，团队发现，模型在一定规模后开始生成电影标题，在更大的规模下会开始识别表情符号的语义，并且在某些情况下以最大的规模输出正确的答案。一个有代表性的例子如下图所示：

文章图片
图注：根据精确的任务指标，在emoji_movie识别上的表现会显得很突然或渐进。
此外，他们发现，模型的编程能力十分主观。即使是通过具体的任务进行量化，语言模型的能力和跨规模的轨迹也比我们所想的要主观得多。
再联想这两天吵得如火如荼的「AI是否具备人格」……
大家怎么看？
参考链接：
https://arxiv.org/pdf/2206.04615.pdf
https://github.com/google/BIG-bench
https://twitter.com/jaschasd/status/1535055886913220608/retweets/with_comments
文章图片
雷峰网雷峰网

苹果|华为超越苹果，编织这个谎言的人，用意是什么？
上周|科技媒体xda发文，ipados16又把差距拉大了
苹果|价值翻了2700多倍：乔布斯签名的支票拍卖估值超16万元
华为|重磅！华为又有两款终端新机已经获得入网审核！
酷比魔方|跑分超87万，不输万元机，酷比魔方iWORK GT二合一平板性能篇
微信|微信终于被超越, 中国新的社交巨头崛起, 成功冲到手机下载榜第一！
小米科技|清新又清凉-小米桌面移动风扇测评
京东PLUS会员超级补贴来了。|京东plus会员超级补贴来了，第二轮已经开启
oppo reno|产品力超强，2022年OPPO 国内市场出货量排名第一
三星堆又现新发现！携程导游：三星堆文博游已经连火两年