AI考高数,“卷死”了一大帮计算机博士( 二 )
在PaLM的基础上继续训练 , 新增的数据集有三部分:
主要有arXiv上收集的200万篇学术论文 , 60GB带LaTeX公式的网页 , 以及一小部分在PaLM训练阶段就用到过的文本 。
文章图片
通常的NLP数据清洗过程会把符号都删掉只保留纯文字 , 导致公式不完整 , 比如爱因斯坦著名的质能方程只剩下了Emc2 。
文章图片
但谷歌这次把公式都保留 , 和纯文本一样走一遍Transformer的训练程序 , 让AI像理解语言一样去理解符号 。
与之前的语言模型相比 , 这是Minerva在数理问题上表现更好的原因之一 。
但与专门做数学题的AI相比 , Minerva的训练中没有显式的底层数学结构 , 这带来一个缺点和一个优点 。
缺点 , 是可能出现AI用错误的步骤得到正确答案的情况 。
优点 , 是可以适应不同学科 , 即使有些问题无法用正规的数学语言表达出来 , 也可以结合自然语言理解能力解出来 。
到了AI的推理阶段 , Minerva还结合了多个最近谷歌开发的新技术 。
先是ChainofThought思维链路提示 , 今年一月由谷歌大脑团队提出 。
具体来说就是在提问的同时给一个分步骤回答的示例来引导 。 AI在做题时就可以采用类似的思考过程 , 正确回答本来会答错的题目 。
文章图片
再有是谷歌和MIT合作开发的Scrathpad草稿纸方法 , 让AI把分步计算的中间结果临时存储起来 。
文章图片
最后还有MajorityVoting多数表决方法 , 也是今年3月才发表的 。
让AI多次回答同一个题目 , 选择答案中出现频率最高的 。
文章图片
所有这些技巧全用上以后 , 5400亿参数的Minerva在各种测试集中达到SOTA 。
甚至80亿参数版的Minerva , 在竞赛级数学题和MIT公开课问题中 , 也能达到GPT-3最新更新的davinci-002版本水平 。
文章图片
说了这么多 , Minerva具体都能做出哪些题目?
对此谷歌也开放出了样例集 , 一起来看一下 。
数理化生全能 , 连机器学习都会
数学上 , Minerva可以像人类一样按步骤计算数值 , 而不是直接暴力求解 。
文章图片
对于应用题 , 可以自己列出方程式并做简化 。
文章图片
甚至还可以推导证明 。
文章图片
物理上 , Minerva可以求中性氮基态(Z=7)电子的总自旋量子数这样的大学水平题目 。
文章图片
生物和化学上 , Minerva凭借语言理解能力也可以做各种选择题 。
以下哪种点突变形式对DNA序列形成的蛋白质没有负面影响?
文章图片
以下哪种是放射性元素?
文章图片
以及天文学:为什么地球拥有很强的磁场?
- 海澜之家市值蒸发近700亿,男人的衣柜究竟“难”在哪?
- “杀进”NFT市场,Meta向元宇宙跨出了重要一步
- 小米科技|小米、格力全面“竞争”,差距逐渐拉开,生态链越来越稳了!
- 网友热议|“发现雪糕不标价可立即投诉”话题上热搜!专家揭秘高价雪糕乱象
- 苹果|苹果接连收到“通牒”,如果不符合的要求,就不准进入中国市场
- 合法权益|“东方至远”完成数千万元A+轮融资
- 小米科技|老用户惨遭背刺?小米手环7 Pro意外来袭,这一次不“装”了
- 百夫长|听我一句劝:家里这四种电器,适合“买大不买小”,很实在的建议
- 冰淇淋|雪莲5毛一包的定价13年没涨 网友力挺良心“解暑神器”背后:苦高价雪糕久矣
- 新冠病毒|行程卡“摘星”到底意味着什么?