材料|以“大数据+AI”为标志的数据驱动,已成为材料科学发展的第四范式
材料创新一直是各种颠覆性技术革命的核心,以至于材料经常成为时代的标志。
传统的材料研发模式往往依赖实验与“试错”的方法,研发过程通常长达10-20年,所需的工程量十分巨大,很大程度上已无法满足21世纪工业发展对新材料的需求。随着信息技术的发展在材料模拟领域的进步,高通量计算系统可以在短时间内获得大量数据,并利用人工智能筛选和设计新材料,从而大幅提升材料研发速度,降低材料研发成本。
文章插图
图一:材料科学阶段示意图
材料研发进展分为四个阶段。第一阶段是实验驱动:基于实验和“试错”。第二阶段是理论驱动:随着各领域研究的深入,材料科学的理论研究趋向成熟。尤其是分子动力学和热力学模型的应用,为材料研究提供了众多帮助,提高了新材料研究的效率。第三阶段是计算驱动:计算机的应用使得材料科学的研究进入了计算模拟阶段。基于理论计算模拟,预测有希望的候选材料,缩小实验范围,最后用实验验证,从而大幅提升材料科学的研究效率。
数据驱动被认为是材料科学的“第四范式”
基于信息化技术和数据科学的材料信息学,通过大数据和机器学习提取数据间的隐含变量,建立模型,以此来指导材料科学的发现。中国科学院院士、清华大学原校长顾秉林认为,人工智能的发展,缩短了材料研发的周期、减少了投资,进而加快了整个领域的进程。因此材料科学和人工智能的协同发展无疑将对材料科学起到至关重要的作用,将有望推动新型材料的发现。
人工智能技术已被广泛应用于生物、医疗、工业等各领域
人工智能飞速发展的动能在于算力进步,算力进步使生产、处理海量数据成为可能,进而使人工智能渗透进了各行各业。
2020年12月Nature报道,波兰科学院Bartosz Grzybowski等研究者宣布对化学软件“Chematica”进行了改进,使其可以设计出复杂天然产物的全合成路线,该程序设计的路线与人工设计的路线几乎没有差别,并已通过化学版“图灵测试”。
2021年7月,DeepMind宣布AplhaFold2成功预测98.5%的人类蛋白质结构,数据集中预测的所有氨基酸残基中,有58%达到可信水平,其中更有35.7%达到高置信度。而在此之前科学家花费数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基。
机器学习已被证明可以有效加速材料的研发进程
机器学习方法在材料设计和材料筛选方面已表现出巨大潜力,将有望极大推动新型材料的发现。2020年,《NPJ—计算材料》杂志上刊发了美国桑迪亚国家实验室的研究成果,记录了他们开发的一种机器学习算法,该算法能够比正常速度快近4万倍的速度进行材料模拟计算。
2016年5月,Nature发表了一篇文章,通过机器学习从过去认为是“失败”的数据中“学习”规律,并对新材料进行预测,对比有经验的化学家的人工判断,机器预测结果以成功率89%:78%胜出,这个案例充分展现了机器学习方法的强大,就像Alpha Go对围棋的冲击。
【 材料|以“大数据+AI”为标志的数据驱动,已成为材料科学发展的第四范式】机器学习不仅能够对材性能进行预测,同时挖掘边界条件等信息,也有助于推进对相关机理的认识。美国加州大学伯克利分校Gerbrand Ceder教授小组开发了将第一性原理计算与信息学(数据挖掘)相结合来预测晶体结构的方法。Ceder最早想到利用这种高通量、数据驱动的方法发现材料是在本世纪初,他受到人类基因组计划的启发,因此猜测材料学家能否从遗传学家那里借鉴一些经验,鉴别出一个与生物学信息被编码在DNA碱基对中的方式相同的,编码各种化合物属性的“材料基因组”。
- 波导|连续7年蝉联第一,如今份额不足1%,一代“国产机皇”就此没落
- 贾跃亭|贾跃亭在美国被“打假”!宣称1.4万辆订单:实际仅几百人付款
- 大年初三睡到饱!网友纷纷晒“懒觉”:我妈用凉水给我擦了擦眼…
- 北京冬奥会 | 火炬传过“民族之脊” 多位夏奥冠军参与传递
- 元宇宙不是“解药”,救不了陷入“颓势”的Meta
- 淘宝网|淘宝网官方微信号迁移至“淘宝太好逛了吧”
- AlphaCode惊世登场!编程版“阿法狗”参赛,击败一半程序员
- Apple Watch|你拿到Apple Watch“2022春节挑战”的虎头奖章了吗?
- 饭圈|卖红包封面可以"月入过万"?相信你就输了
- 数据库|1000R曲率显示器值得入手吗?32英寸蚂蚁电竞,一“屏”包揽全场