学生妹包微信,全国可约可空降平台下载安装,24小时空降可约平台客服电话,快餐一条龙qq联系方式

科研进展丨材料网络科学之维基百科科学知识驱动的非晶合金材料推荐系统

2025-11-26
96
正文字体:

非晶合金的研制强烈依赖组成元素和合金成分。多组元是设计和开发高性能非晶合金的必要条件,但这极大增加了材料样本空间,给材料优化设计带来了巨大挑战,并显著提高了研发成本。如何高效开发新型非晶合金,始终是该领域的关键科学与技术难题。

当前,人工智能技术为材料开发提供了新动力。数据驱动的材料研制是热门研究方向,其核心是从已积累的数据中挖掘隐藏的材料设计线索。目前,监督式机器学习方法被广泛应用,其基本原理是构建实验数据数字化特征与目标性能在高维空间中的映射关系。然而,材料的特征构建主要依赖于预先选定的元素物理化学性质,且难以充分捕捉复杂的非传统玻璃形成机制,限制了模型的泛化能力。如何利用更先进的深度神经网络技术处理材料“小数据”问题,并减少对人工特征工程的依赖,是当前的研究重点。

近日,松山湖材料实验室数据驱动材料科学研究团队及其合作者提出了一种全新的研究范式。团队在其先前构建的非晶合金材料网络基础上,首次引入自然语言处理技术,从维基百科文本中学习化学元素的数字化表示(称为“元素编码”),并利用图神经网络构建了高效的“非晶合金推荐系统”。

图 1 (a)传统物理参数的表格化元素表征。(b)基于维基百科文本信息的元素编码。

与传统依赖物理参数进行材料表征的模式不同,该研究让AI模型“阅读”维基百科中关于元素的科学描述,自动生成包含丰富语义信息的元素嵌入向量(见图1)。这种方法避免了特征工程中的人工偏差,使AI能够从人类知识中自主发现元素间的隐藏关联,如图2所示。

研究团队将这种新颖的元素嵌入与二元、三元非晶合金材料网络相结合,并部署了多种先进的图神经网络架构。这些网络能够同时学习网络的拓扑结构(元素间的已知关联)和节点的语义特征(来自维基百科的知识),从而像电商推荐商品一样(见图3),精准预测网络中尚未被实验验证的、新的潜在玻璃形成体系。

图 2  基于Wikipedia2Vec提取的元素嵌入的聚类分析。(a)维基百科提取的元素嵌入热力图。横轴代表嵌入的100维度,纵轴代表47个元素。颜色代表相似度。(b-d)不同元素基于维基百科嵌入的降维可视化。

该研究还验证了基于11种不同语言维基百科训练的元素嵌入在预测任务中均表现出相近且稳健的性能,表明不同语言文本中所蕴含的核心科学知识具有高度一致性和普适性,如图4所示。这一“材料推荐系统”不仅显著提升了对新材料的预测效率,还为在数据稀缺条件下实现材料智能设计提供了可推广至其他复杂体系的新范式。

图 3  商品推荐系统示意图。

图 4从二元非晶合金材料网络中推荐二元非晶合金。(a)二元非晶合金网络示意图。(b)在不同算法下推荐系统的预测能力。(c-d)基于不同语言提取的维基百科嵌入在三种算法下的预测能力展示。

这项工作通过融合自然语言处理、网络科学与人工智能,为材料发现注入了新的活力。未来,研究团队计划将成分比例信息集成到模型中,以实现更精确的成分解析预测,并将此框架拓展至高熵合金、电解质材料等其他复杂材料体系的探索中,有望重塑新材料研发的进程。

相关研究成果以“Graph learning metallic glass discovery from Wikipedia “为题近日发表在学术期刊AI for Science上。

文章链接:

https://iopscience.iop.org/article/10.1088/3050-287X/ae1b20

 

 

撰稿:数据驱动材料科学研究团队

主站蜘蛛池模板: 兰考县| 常德市| 天柱县| 进贤县| 东明县| 塔城市| 上蔡县| 铅山县| 江西省| 五寨县| 繁昌县| 孟津县| 石台县| 德安县| 临汾市| 台南市| 安新县| 丰台区| 伊宁县| 祁阳县| 南阳市| 盐池县| 图们市| 基隆市| 沂水县| 开平市| 宝坻区| 恩施市| 吉隆县| 榆社县| 河北省| 精河县| 盖州市| 建阳市| 垦利县| 米脂县| 永年县| 平阴县| 漳平市| 上栗县| 饶阳县|