AI科学语言大模型火了,数学生物样样行,编代码写综述也不在话下
Pine发自凹非寺
量子位|公众号QbitAI
AI搜索引擎再度进化?!
给这个AI一个主题 , 分分钟给你甩出一篇论文综述 , 而且还会自己提供论文引文 。
文章图片
又或者输入一个科学类的名词 , AI也能迅速生成这个名词专属的维基百科 。
这个AI名叫Galactica(简称:GAL) , 是最新开源的一个科学语言大模型 , 把AI转化为科学生产力 。
并且还实现了学科“大一统” , 数学、物理、计算机…这个AI都能用 。
模型刚一放出 , 就迅速引发网友热议 , 目前相关推文已有近15万浏览 , 累计点赞、转发、引用也已破五千 。
Facebook前技术官也出来为它来站台 。
文章图片
还有网友亲自体验了一把 , 写出来的文献综述“看起来相当不错” , 甚至直呼:
下一步它是不是就能产生新想法了 。
文章图片
其实写文献综述和生产维基百科还只是GAL功能的一部分 , 除去这些 , 它还能回答一些专业问题、编写科学代码、注释分子和蛋白质……
具体效果如何 , 一起来看看吧~
可以作为科学生产的工具提到科学生产力 , 就肯定离不开论文的查找 , 这不 , GAL帮你解决了 。
它涵盖了五种科学学科:机器学习、数学、计算机科学、生物以及物理 。
文章图片
选择好学科 , 然后在左边框输入想要找的论文主题 , 右边GAL便会推荐最合适的论文以供阅读 。
除了推荐论文之外 , GAL还有一个更加实用的功能:生成讲稿 。
比如说要做个关于密度泛函理论(DFT)的pre , 又懒得写讲稿 , 直接GAL一下 , 分分钟搞定(手动狗头) 。
文章图片
GAL还能够用来注释分子和蛋白质 , 如下就是GAL生成的RDKit(可生成用于机器学习的分子描述符)操作手册 。
文章图片
在一些细节问题上 , GAL也狠狠拿捏了!
就比如说你看不懂一些复杂的数学公式和代码 , 没关系交给GAL来解决 , 它能直接给你翻译成大白话 。
文章图片
不仅如此 , 它还能实现数学公式和代码之间的相互转换 , 或者不同类型代码之间的转换 。
文章图片
更重要的是 , 他还有简化公式和查错功能 。
文章图片
怎么做到的?GAL能实现这么复杂的功能 , 就不得不提到它的训练数据集 。
据官方消息 , GAL是在一个名为NatureBook的新型高质量科学数据集上进行训练的 , 这使模型能够使用科学术语、数学和化学公式以及源代码 。
其中包括超过4800万篇论文、教科书和课堂讲稿 , 还有数百万计的化合物和蛋白质、科学网站以及百科全书等等 。
除此之外 , 为了查找论文并规范化引用 , GAL的数据集中包含超过3.6亿条上下文引用和超过5000万条跨不同来源规范化的独特参考 。
有了这么庞大的数据集之后 , 那接下来便面临两个问题 。
第一个问题是如何管理这些高质量的数据集 , 实现这点 , GAL用了两步:
- c语言|iPhone14降价很猛!但溢价依然过高,年末换机更建议选这几款
- 本文转自:中国科学报吸收重金属 还可做板材这波操作把麻类“吸干榨净”▲基于红麻麻骨的无...|这波操作把麻类“吸干榨净”
- 世界青年|科创一线涌动青春力量 来自2022世界青年科学家峰会的观察
- “机器化学家”赋能科学研究
- 国产芯传来消息,南大光电正式宣布,外媒:中国科学家都不睡觉吗?
- 本文转自:新华网未来科学大奖周将于2022年11月24-27日举行|礼赞科学成就 致敬科学精神 2022未来科学大奖周即将开启
- Twitter|何去何从?科学领域的推特(Twitter)用户未来会怎么选择
- 爱施德|何去何从?科学领域的推特(Twitter)用户未来会怎么选择
- 本文转自:中国科学报团队规模、“新鲜”程度、利益驱动、层级结构……什么在影响科研团队创新...|什么在影响科研团队创新能力
- 毒液|点燃好奇——菠萝科学奖褒奖“有趣而严肃”的研究