AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行

AI搜索引擎再度进化?!
给这个AI一个主题 , 分分钟给你甩出一篇论文综述 , 而且还会自己提供论文引文 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
又或者输入一个科学类的名词 , AI也能迅速生成这个名词专属的维基百科 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
这个AI名叫Galactica(简称:GAL) , 是最新开源的一个科学语言大模型 , 把AI转化为科学生产力 。
并且还实现了学科“大一统” , 数学、物理、计算机…这个AI都能用 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行】模型刚一放出 , 就迅速引发网友热议 , 目前相关推文已有近15万浏览 , 累计点赞、转发、引用也已破五千 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
Facebook前技术官也出来为它来站台 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
还有网友亲自体验了一把 , 写出来的文献综述“看起来相当不错” , 甚至直呼:
下一步它是不是就能产生新想法了 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
其实写文献综述和生产维基百科还只是GAL功能的一部分 , 除去这些 , 它还能回答一些专业问题、编写科学代码、注释分子和蛋白质……
具体效果如何 , 一起来看看吧~可以作为科学生产的工具
提到科学生产力 , 就肯定离不开论文的查找 , 这不 , GAL帮你解决了 。
它涵盖了五种科学学科:机器学习、数学、计算机科学、生物以及物理 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
选择好学科 , 然后在左边框输入想要找的论文主题 , 右边GAL便会推荐最合适的论文以供阅读 。
除了推荐论文之外 , GAL还有一个更加实用的功能:生成讲稿 。
比如说要做个关于密度泛函理论(DFT)的pre , 又懒得写讲稿 , 直接GAL一下 , 分分钟搞定(手动狗头) 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
GAL还能够用来注释分子和蛋白质 , 如下就是GAL生成的RDKit(可生成用于机器学习的分子描述符)操作手册 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
在一些细节问题上 , GAL也狠狠拿捏了!
就比如说你看不懂一些复杂的数学公式和代码 , 没关系交给GAL来解决 , 它能直接给你翻译成大白话 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
不仅如此 , 它还能实现数学公式和代码之间的相互转换 , 或者不同类型代码之间的转换 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
更重要的是 , 他还有简化公式和查错功能 。
AI搜索引擎再度进化?!给这个AI一个主题|ai科学语言大模型火了,数学生物计算机样样行
文章图片
怎么做到的?
GAL能实现这么复杂的功能 , 就不得不提到它的训练数据集 。
据官方消息 , GAL是在一个名为NatureBook的新型高质量科学数据集上进行训练的 , 这使模型能够使用科学术语、数学和化学公式以及源代码 。
其中包括超过4800万篇论文、教科书和课堂讲稿 , 还有数百万计的化合物和蛋白质、科学网站以及百科全书等等 。
除此之外 , 为了查找论文并规范化引用 , GAL的数据集中包含超过3.6亿条上下文引用和超过5000万条跨不同来源规范化的独特参考 。