一、研究背景
传统上,镁合金的设计采用“爬山法”,即基于搜索的优化算法,其基本思想是从当前解开始,沿着当前解的局部最优方向寻找下一个解,达到局部最优解或无法继续改进为止,该方法无法充分利用报道的所有数据。基于该方法的镁合金设计在过去一个世纪以来,进展缓慢、成本高昂。
近日,澳洲国立大学N. Birbilis教授和莫拉什大学M. Ghorbani博士等人对过往镁合金设计领域的数据进行了详细分析和重构,提出了一种基于数据进行合金设计的新方法。在这项工作的第一部分研究中,作者首先从文献和实验工作中提取数据,开发了一个包含916个数据点的合金数据库。通过成分-工艺-性能矩阵,分析了数据库的特征,探讨了合金化和热加工对力学性能的影响。将合金数据库与热力学稳定的析出相相关联,以进一步分析微观结构与力学性能之间的关系。机器学习模型为加速新材料开发提供了新途径,为繁琐且资源密集型的经验方法提供了虚拟替代方案。
在这项工作的第二部分研究中,提出了一种机器学习方法,可加速镁合金的成分设计。对四种机器学习回归算法进行了系统评估,将镁合金数据中的复杂关系理清,并构建成分-处理-性能之间的关系。开发了一个图形用户界面(GUI)Web工具,以便于使用提出的模型预测新镁合金的力学性能。结果表明,随机森林回归模型和神经网络是预测镁合金的抗拉强度和延伸率的有效模型,准确率分别为约80%和70%。开发的模型具有以性能为导向,具有高通量筛选的特点,提供了机器学习引导合金设计的有效范式。
二、图文导读
本文中已经编制并格式化的数据库可以通过以下链接进行公开访问:https://github.com/katrina-coder/Magnesium-alloys-database。该数据库包含了镁合金的化学成分、热机械加工条件和力学性能数值。在本研究中涉及的镁合金至少包括了30种合金元素中的一种或多种,包括锌、铝、锰、锆、钕、铈、镧、钇、铜、硅、钆、钙、镨、镍、铁、锂、铍、锡、钍、银、锑、铒、镝、钇、铋、锶、镓、钪、铽和钬。合金的生产路径和加工处理包括了一系列铸造或热机械加工过程(包括热处理),根据不同的生产加工路径编码为六个类别,分别为“砂型铸造”、“高压压铸”、“铸造+热处理”、“挤压”、“加工”和“ECAP”。现有数据库显示,在使用的三十种镁合金的合金元素中,锌(Zn),铝(Al)和锰(Mn)是最常用的。早在1909年,Griesheim-Elektron就将Al和Zn报告为镁的关键合金元素之一。而近些年来,稀土(RE)元素因其在镁中的溶解度规律引起了广泛的关注,最常添加的RE元素分别为钕(Nd)、铈(Ce)、镧(La)和钇(Y)等。钆(Gd)元素在镁合金中的最高添加量可达25 wt.%,尽管大多数镁合金不包含Gd,但该元素存在于12%的镁合金中,其含量的平均值和中位数值分别为9.38 wt.%和10 wt.%。从六组生产和热机械加工条件分类的数据集显示,挤压加工方法是提高镁合金性能最常见的加工方式,其占比高达41%。“高压压铸”和“铸造+热处理”分别占总数据库的24%和20%,是另外两种最常见的加工方式。
为了研究镁合金的力学性能,图1展示了延伸率、抗拉强度和屈服强度的散点图。图的边缘显示了力学性能变量的单变量分布。图2通过散点图矩阵(SPLOM)总结了六种不同加工条件下合金的单个组分对抗拉强度和延性的影响。数据涵盖了从21 MPa到610 MPa的屈服强度值,以及52 MPa到710 MPa的抗拉强度。研究发现,镁合金的高强度和延伸率的协同问题一直难以解决。尽管近年来已经进行了一些工作以提高镁合金的强度,但仅有5%的合金的抗拉强度大于500 MPa,与此同时,数据库中包含的合金延伸率从0.23%到65.2%不等,但只有11种镁合金的延伸率得到有效改善,其值高于40%。此外,数据显示,添加高含量的Gd元素(8 wt.%~12.6 wt.%)能有效提高镁合金的抗拉强度,但可能导致延伸率降低。大量的Mg-Al系合金样本显示,通过添加Zn、Mn、Li和Nd等元素后,约有50种合金具有高于400 MPa的抗拉强度。尽管仅有很少的Mg-Al合金的延展性高于30%,但Mg-Al-Li合金的最大延伸率可达到46%。除了Mg-Al系合金外,Mg-Y系合金的力学性能也受到其他元素的相似影响。在稀土元素中,Nd、Ce和La对抗拉强度的改善有类似的影响,但La元素的最大延伸率仅为23%。图2统计的数据显示,含有较多锂的镁合金通常具有最高的延展性。其中,含有锂的合金在锻造条件下处理,具有三个最高延展性值(紫色点)。对应于含有8.5 wt.% Li的二元Mg-Li合金,最高的延伸率可达65.2%,其次为含有5.5 wt.% Li的二元Mg-Li合金,延伸率为52.3%。另外,含有锂的Mg合金平均延伸率可达25%,几乎是数据库中所有Mg合金延展性的三倍,这是因为锂的添加会诱导出独有的双相(HCP + BCC)或单一BCC相结构。尽管锂元素的添加有助于提高镁合金的延伸率,但这些合金的整体强度相对较低。在其它合金元素中,Ag存在于19种合金中,其中5种合金的抗拉强度超过400 MPa。含Ag镁合金具有最大和适中的延伸率分别为25.5%和4%。此外,少量含钇(Yb)Mg合金表现出20%左右的延伸率和300 MPa的强度。在加工工艺方面,通过挤压工艺制备的合金普遍具有更高的强度,而高延伸率合金通常是通过锻造和挤压工艺获得的。综合数据库分析,不同合金元素及其加工方式之间的复杂关系可以使用先进的建模技术指导和开发高强度、高延展性的镁合金。
图1 本文收集的数据库中的916种镁合金的抗拉强度与延伸率的关系(左),
以及抗拉强度与屈服强度的关系(右)。图的边缘柱状图表示力学性能变量的单变量分布
图2 所有916种镁合金数据库中,最主要合金元素与抗拉强度(MPa)以及延伸率(%)之间的关系
本文的第一部分不仅利用Pearson相关系数(PCC)热图进行了成分的双变量相关性分析,更在发现强相关性(当|PCC|超过0.9时)的变量对后,通过筛选其中一个变量来精简表示空间的维度。尽管如此,剩余的变量依然能够充分描述它们之间的关联。图3中,展示了数据集中包含镁在内的31种元素的相关热图,其中除了对角线代表各变量与自身的相关性外,仅有四个深绿色方块,代表着镍(Ni)与镝(Dy)之间高达0.8的相关系数,以及铍(Be)与铁(Fe)之间更为紧密的0.89相关系数。然而,尽管进行了这样的双变量相关性分析,镁合金数据集依然维持着较高的维度,因此,需要引入更为先进的分析手段来探索镁合金性能背后的非线性关系。鉴于镁合金数据库的复杂性,涵盖了镁、六种热加工条件以及30种合金元素,共计37个输入变量,本文进一步采用了无监督机器学习的降维算法。特别是利用非线性的t-SNE算法,成功将37维数据映射到二维空间,形成了“t-SNE 组件 1”和“t-SNE 组件 2”两个变量。经过交互式调整超参数,图4中清晰展示了七个显著分离的簇,这些簇直观地反映了数据间的相似性与差异性,进一步证明了机器学习在理解镁合金整体行为方面的有效性。为了更深入地揭示镁合金结构与性能之间的关系,本文的第一部分还研究了合金的力学性能与稳定第二相(沉淀物)热力学计算结果之间的联系。研究结果表明,高强度合金通常与特定的沉淀物相紧密相关,而低延性合金则与其他相有所联系。机器学习为深入探究这些热力学相与力学性能之间的复杂关系提供了强大的工具。此外,本研究还创建了一个开源的镁合金数据库,并运用数据科学工具对其进行详尽的描述与分析。这个数据库不仅可用于监督机器学习,还可为虚拟合金设计以及新镁合金候选材料的发现提供有力支持。
图3 镁合金数据库中31种元素的成对皮尔逊相关性图。
深绿色和棕色方块表示数据库中一对元素之间的强正相关性和负相关性
图4 使用t-SNE降维算法结合BIRCH聚类分析的七个独特聚类
图4展示了通过t-SNE降维算法结合BIRCH聚类分析得到的七个独特聚类,这些聚类为我们深入理解镁合金数据集提供了有力支持。在本文的第二部分,我们基于第一部分的研究,系统性地评估了四种回归模型,包括LassoIC(使用 Akaike 信息准则正则化的 Lasso 模型)、KRR(核岭回归)、RF(随机森林)和NN(神经网络),用于预测镁合金的UTS、YS和延伸率。图5直观地比较了这些模型在预测镁合金UTS值时的性能。结果表明,尽管所有模型在预测UTS和YS时表现良好,但在预测延展性方面存在挑战。线性模型如LassoIC和神经网络模型表现出稳定的性能,而复杂模型如KRR和RF集成模型虽然存在过拟合风险,但经过调优后仍可取得可接受的表现。综合考虑各方面因素,RF模型目前被视为最适合捕捉镁合金性能趋势的模型之一。此外,我们还探讨了特征增强对模型性能的影响,发现热力学增强特征对强度预测有所改善,但原子性质特征的引入并未带来明显优势。总的来说,特征增强是提升模型预测性能的有效方法,但在某些方面仍面临挑战。
图5 预测镁合金UTS值的不同模型比较
三、结论与展望
本文提出了一种创新的数据科学方法,旨在指导镁合金设计,减少了传统经验性工作的成本和时间投入。成功构建了一个开源的镁合金数据库,集成了合金成分、热力学处理路径以及力学性能等关键特征,共包含916个独特数据点,覆盖了30种合金元素和6种加工方式。通过对数据库进行系统性分析,首次系统性的揭示了镁合金数据的特征,为镁合金设计提供了有力的数据支撑和理论指导。
为简化和优化镁合金设计方法,本文提出了一种基于无监督机器学习聚类方法的镁合金数字化设计方案,利用四种回归模型全面评估了镁合金的力学行为。研究结果显示,随机森林集成模型在预测镁合金的抗拉强度、屈服强度和延伸率方面表现最为稳定,而神经网络模型则以最低过拟合概率和优秀的训练-测试一致性展现出巨大潜力。此外,本文还开发了一款基于GUI的网络工具,为镁合金设计提供了虚拟替代方案,有效替代了传统的经验试错法,显著降低了合金制造与测试成本,对高性能镁合金的设计与开发具有深远意义。
四、文章信息
该文章发表在《Journal of Magnesium and Alloys》2023年第11卷第10期和第11期:
[1] M. Ghorbani*, M. Boley, P.N.H. Nakashima, N. Birbilis, A machine learning approach for accelerated design of magnesium alloys. Part A: Alloy data and property space [J]. Journal of Magnesium and Alloys, 2023, 11(10): 3620-3633.
[2] M. Ghorbani*, M. Boley, P.N.H. Nakashima, N. Birbilis, A machine learning approach for accelerated design of magnesium alloys. Part B: Regression and property prediction [J]. Journal of Magnesium and Alloys, 2023, 11(11): 4197-4205
五、中文摘要
传统镁合金设计采用的“爬山法”虽然历经百年取得显著进展,但迭代和渐进式设计方式既缓慢又成本高昂,且未能充分利用领域内的全部数据资源。为此,本文提出了一种创新的数据科学方法,旨在深入分析和重构镁合金设计领域的数据。通过整合文献和实验数据,构建了一个包含916个数据点的综合合金数据库。借助成分-工艺-性能矩阵,探索了合金化和热机械加工对镁合金力学性能的影响。同时,采用无监督的机器学习聚类方法,从未标记数据中挖掘出对低维合金表示空间有用的信息。此外,还将合金数据库与热力学稳定的次生相相关联,以增进对微观结构与力学性能关系的理解。这项工作不仅构建了一个开源数据库,还首次提供了有助于加速镁合金设计的数据,为镁合金设计的创新和发展开辟了新的道路。
六、英文摘要
Typically, magnesium alloys have been designed using a so-called hill-climbing approach, with rather incremental advances over the past century. Iterative and incremental alloy design is slow and expensive, but more importantly it does not harness all the data that exists in the field. In this work, a new approach is proposed that utilises data science and provides a detailed understanding of the data that exists in the field of Mg-alloy design to date. In this approach, first a consolidated alloy database that incorporates 916 datapoints was developed from the literature and experimental work. To analyse the characteristics of the database, alloying and thermomechanical processing effects on mechanical properties were explored via composition-process-property matrices. An unsupervised machine learning (ML) method of clustering was also implemented, using unlabelled data, with the aim of revealing potentially useful information for an alloy representation space of low dimensionality. In addition, the alloy database was correlated to thermodynamically stable secondary phases to further understand the relationships between microstructure and mechanical properties. This work not only introduces an invaluable open-source database, but it also provides, for the first-time data, insights that enable future accelerated digital Mg-alloy design.