国精品人妻无码一区免费视频电影,国产成a人片在线观看视频首页,少妇高潮惨叫久久久久久电影,91成人午夜性a一级毛片亚洲欧洲综合在线

您當前的位置: 首頁 > 鋼鐵百科 > 鋼管管材

如何在智能信息化時代加速材料科學的研發與創新 MatAi

作者:小編 時間:2021-07-09閱讀數:人閱讀

如何在智能信息化時代加速材料科學的研發與創新 MatAi


1 簡介



先進的材料的研發和使用越來越多地影響著人們生活的方方面面,包括能源生產,電力電子,交通,航空航天等關鍵部件都取決于高端材料的研發與制備。
眾所周知,傳統的實驗和計算建模需要消耗大量的時間和資源,并受到實驗條件和理論基礎的限制。重復的實驗和理論表征通常是耗時且低效的,重大進展往往需要依靠直覺甚至意外。同時,新材料的研發周期非常長,從初始研究到首次使用通常需要大約10到20年。如圖1所示,新材料研究包括七個不連續的階段,即發現、發展、資源優化、系統設計和集成、認證、制造和部署。不同階段的研發往往由不同的機構甚至不同工程或科學團隊進行。盡管一支經驗豐富的團隊可能參與研發過程的每個階段,但這些團隊很少能直接獲得研發早期與市場化后期這一過程之間的反饋,而這種反饋通常恰恰可能加速整個研發的進程。

如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖1)

圖1 傳統研發新材料的模式


計算模擬和實驗是在材料科學領域廣泛采用的兩種常規方法。然而,由于實驗條件和理論基礎的固有局限性,這兩種方法很難加速材料發現和設計。一般而言,實驗測量通常包括微觀結構和性質分析、性質測量以及合成實驗等。盡管實驗測量通常需要在很長一段時間內以低效的方式進行,但也是一種簡單直觀的材料研究方法。此外,實驗測量法對設備、實驗環境和研究人員的專業知識提出了很高的要求。另一方面,計算模擬從基于密度泛函理論的電子結構計算、分子動力學、蒙特卡羅技術和相場法到連續譜宏觀方法出發,是一種利用計算機程序并使用現有理論進行分析的方法。由計算指導的材料設計有望減少發現新材料和材料開發所需要的時間和成本。與實驗測量相比,計算模擬需要的時間更少,并且有利于人為精準地控制實驗中的相關變量。然而,計算模擬也存在諸多挑戰。例如:

1、計算模擬的準確性很大程度上取決于所涉及材料的微觀結構;

2、計算模擬需要高性能計算設備;

3、計算模擬程序的運行需要依靠大型計算集群;

4、當研究新系統時,不能明確地使用先前的計算結果。因此,現代材料研究通常需要在計算模擬和實驗測量緊密結合的基礎之上進行,這樣才能對所關注材料的結構和性質以及它們的合成和加工程序的相關性有準確的把握。

2011年,隨著“大數據”時代的到來,材料基因組計劃(MGI)隨之推出,該計劃展示了材料科學界目前已經收集的大量的材料相關數據,為材料工程師們提供了對已知材料特性的便利訪問。例如,無機晶體結構數據庫(ICSD)、超導臨界溫度數據庫(SuperCon)、開放量子材料數據庫(OQMD)、劍橋結構數據庫、哈佛清潔能源項目(HCEP)、材料項目數據庫(MP)、材料共享和材料數據設施。這些公開的通用數據管理和共享平臺,可以為加速材料發現和設計提供強大的動力。
隨著先進的材料表征技術、數據采集和存儲能力的不斷發展提高,人們所擁有的數據量越來越龐大。機器學習作為一種查找高維數據模式的有力工具,采用特定算法,的算機可以通過模擬材料屬性和相關因素之間的線性或非線性關系來學習經驗數據。近年來,機器學習技術和大數據成功地解決了材料特性與復雜物理因素之間關系建模的難題。值得注意的是,機器學習在材料領域當前已經被成功應用。例如,機器學習基于失敗實驗的相關數據,協助材料工程師篩選出了高效有機發光二極管的新材料,這種研發方案開創了一種材料研發的新模式。

如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖2)

圖2 材料基因組計劃
在過去的20年中,與材料科學相關的計算機技術一直在穩步地從“技術開發與純計算研究”轉向“以計算結果、機器學習和數據挖掘與計算之間的緊密協作為指導的新材料的發現和設計”。機器學習的優勢在于能夠找到一條滿足合理的實驗要求和低錯誤率的路徑,充分利用現有的大量數據來加速材料研究過程,包括努力開發更合適的方法,將傳統的實驗方法與智能數據分析技術相結合,以提高實驗效率并降低錯誤率。

2 材料科學中常用的機器學習算法


作為一項科學技術,機器學習源于人類對于人工智能的追求。在20世紀50年代,人們嘗試使用各種符號方法來解決機器獲取知識的問題,主要是基于大數據和神經網絡。隨后,提出了幾種基于統計學習理論(SLT)的方法,如支持向量機(SVM)和決策樹(DTs)。目前,一些新的機器方法,如大數據分析的深度學習,已引起學術界和工業界的關注。機器學習是一種自動化分析模型構建的方法,使用迭代算法學習數據。


如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖3)


圖3 材料學中常用到的機器學習算法




機器學習在高維度數據的分類,擬合以及其他的相關任務中表現出良好的適用性。為了能從大量數據中提取知識并獲得洞察力,機器學習能夠從以前的計算中學習并持續進步,從而能夠產生可靠,可重復的決策和結果,因此在許多領域發揮了重要作用,尤其是語音識別,圖像識別,生物信息學,信息安全和自然語言處理(NLP)。,目前,我們的許多日?;顒佣际怯蓹C器學習算法來提供支持,諸如欺詐監測,網絡搜索,情緒分析,信用評價等。
機器學習在材料科學中的開創性應用可以追溯到20世紀90年代,當時主要是采用符號方法和人工神經網絡(ANNs)等機器學習方法來預測陶瓷基復合材料中纖維/基體界面的腐蝕行為,以及拉伸強度等參數。隨后,機器學習已被用于解決材料科學中的各種主題,例如新材料發現和材料特性預測。
通常,在使用機器學習來解決材料科學中的給定問題時,應該構建機器學習系統。這種機器學習系統的一般范例如下:


目標 + 樣本 + 算法 = 模型


在這里,最終目標代表給定問題,通常以目標函數的形式表達。
選擇合適的機器學習算法是構建機器學習系統的關鍵步驟,因為它極大地影響了預測精度和泛化能力。每種算法都有自己的應用范圍,因此,沒有適用于所有問題的算法。如圖4所示,材料科學中常用的機器學習算法可以分為四類:概率估計、回歸、聚類和分類。具體而言,概率估計算法主要用于新材料發現,而回歸、聚類和分類算法用于宏觀和微觀層面的材料特性預測。此外,機器學習方法通常與各種智能優化算法相結合,例如GA,SAA或PSO算法,主要用于優化模型參數。此外,這些優化算法也可用于執行其他困難的優化任務,例如空間配置和材料屬性的優化。

如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖4)

圖4 材料科學中常用的機器學習算法的四大分類


3 機器學習在材料科學上主要應用


尋找性能良好的新材料是材料科學的永恒主題。當前通過實驗和計算篩選來發現新材料主要涉及元素替換和結構轉換。兩種方法也可能需要大量的計算或實驗,并且通常在“窮舉搜索”進行了錯誤的方向發展,這耗費了相當多的時間和資源??紤]到這一事實和機器學習的優勢,如果提出了一種將機器學習與計算模擬相結合的完全自適應方法,用于新材料“計算機模擬”的評估和篩選,就能夠為新的材料和更好的材料提供建議。

如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖5)

圖5 機器學習在材料科學上的主要應用


如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖6)

圖6 機器學習在材料研發領域的通常過程


圖7顯示了發現新材料時機器學習的一般過程。用于發現新材料的機器學習系統包括兩個部分,即學習系統和預測系統。學習系統執行數據清理,特征選擇以及模型訓練和測試的操作。預測系統應用從學習系統獲得的模型用于組件和結構預測。通常通過建議和測試方法“預測”新材料:預測系統通過構圖推薦和結構推薦來選擇候選結構,并且使用DFT計算來比較它們的相對穩定性。

如何在智能信息化時代加速材料科學的研發與創新 MatAi(圖7)

圖7 機器學習用來發現新材料的一般過程


材料晶體結構的預測和表征構成了形成任何合理材料設計基礎的關鍵問題。通過晶體結構預測,可以避免一些不必要的結構實驗,這將大大減少DFT計算和計算資源的消耗,同時也有助于發現新的材料。在化學反應之后預測晶體結構甚至更具挑戰性,因為它需要整個反應的精確勢能面。即使對于簡單的結晶,第一原理晶體結構預測也是困難的,因為需要使用高水平量子化學方法來考慮組合巨大的組件排列。相比之下,晶體結構預測的研究在20世紀80年代之前基本沒有受到關注。在過去的10年中,機器學習已被用于晶體結構預測。2003年,Curtarolo等人將啟發式規則轉移到一個大型數據庫中用來計算信息,并通過創造性地結合機器學習與量子力學計算成功預測二元合金的晶體結構。然而,這種機器學習方法的缺點是它只預測數據庫中存在的晶體結構而不是新穎的結構。通過使用電負性,原子大小和原子位置點來描述晶體結構,Ceder等人通過主成分回歸和貝葉斯概率將電負性和原子尺寸與晶體結構聯系起來,研究結構預測問題,從而深入了解支配結構預測的物理機制。從計算或實驗數據的知識提取的角度來看,Fischer等人構建了一個基于信息學的結構預測以及結構建議模型即數據挖掘結構預測器(DMSP),它嚴格地挖掘實驗數據中包含的相關性,并使用它們有效地將量子力學技術引向穩定的晶體結構。Rafael等人針對有機發光二極管(OLED)的新型發光層進行了研究。采用機器學習方法篩選有效的OLED分子,其中多任務神經網絡被用作訓練算法,并且使用擴展連接指紋(ECFP)將每個分子轉換成固定維向量。從400,000個候選分子中,他們通過機器學習預篩選和協作決策確定了2500個有前途的新型OLED分子。實現了出色的預測能力,導致設備報告效率超過22%。Sendek等人使用LR模型篩選固體鋰離子導體材料。通過在MP數據庫中篩選滿足特定要求的材料,他們將候選材料的數量從12831減少到317,減少了92.2%。然后,他們應用LR開發離子電導率分類模型進行進一步篩選,最終獲得了21種最有希望的材料,相當于總體減少了99.8%。
根據之前的研究,絕大多數未能發表的“黑暗”(失?。┗瘜W反應都存在于實驗室筆記本中。然而,這些反應同樣包含有用的信息,它們也可能對新材料的發現有用。Raccuglia等充分利用了失敗的反應數據,并展示了一種替代方法,使用SVM衍生的DT算法訓練反應數據來預測模板化釩亞硒酸鹽結晶的反應結果。該方法優于傳統的人類策略,成功地預測了新的有機模板化無機產物形成的條件,成功率為89%。

組件預測

組件預測是發現新材料的另一種方式。簡而言之,必須決定哪種化學成分可能形成化合物。機器學習在組件預測中比在晶體結構預測中更廣泛地應用。經驗或半經驗方法的瓶頸在于組件的搜索空間非常有限,并且此類搜索需要許多驗證計算和實驗,這可能嚴重影響新材料發現進度。目前,基于機器學習的組件預測的研究可以分為兩大類:1)來自給定結構的元素池的元素組合的推薦和2)用于發現新化合物的離子取代。


4 機器學習的其他應用場景


機器學習已應用于材料特性預測和新材料發現,取得了許多顯著成果。此外,它還用于解決涉及大量計算和實驗的與材料科學相關的其他問題。請注意,其中一些問題根本無法通過傳統方法解決。

流程優化

工藝優化主要是指材料合成中工藝參數的設計。在以往的生產實踐中,主要通過理論分析和經驗積累制定材料加工程序。模糊神經網絡(FNNs)是一種機器學習方法,它將神經網絡的優秀學習能力與模糊推理相結合,推導出模糊系統的初始規則。使用這些模型,可以快速選擇用于實現所需生產過程中的最佳工藝參數。

尋找密度函數

目前,每年有超過10000篇論文報告使用Kohn-Sham(KS)DFT獲得的電子結構問題的解決方案。所有這些都將交換相關(XC)能量近似為電子自旋密度的函數。結果的質量關鍵取決于這些密度函數近似。例如,對于強相關系統,目前的函數近似通常會失敗,使得該方法對于一些最有趣的問題無用。最近,通過定義將機器學習應用于DFT問題所需的關鍵技術概念,Snyder等人采用機器學習來解決原型密度泛函問題:非相互作用的無旋轉費米子被限制在一維盒子中,受到平滑的潛力。在近似該系統的動能(KE)時達到的精度,測試密度低于1千卡/摩爾時的平均絕對誤差,與訓練時密度低于100密度的訓練組相似,遠遠超出任何現有近似值的能力。而且,甚至足以產生高度準確的自洽密度。這種機器學習近似(MLA)方法使用更多輸入來實現化學精確度,但對基礎物理學的了解要少得多。

電池監測

電池監控是指在運行期間連續確定電池的狀態。在電池管理系統(BMS)中這是一項具有挑戰性的任務,因為電池的狀態受到各種內部和外部條件的影響,并且這些條件與電池狀態之間的關系是非線性的并且在電池的壽命期間發生變化。阻抗譜、電壓脈沖響應和庫侖計數是用于電池監測的三種主要傳統方法,所有這些方法都有相同的缺點:每種方法僅適用于某種類型的電池,僅用于估算電荷狀態(SoC)。機器學習提供了一種預測電池參數的優越方法,因為它具有通過構建訓練模型來捕獲電池狀態和相關因素之間的關系的優勢。目前,科研人員已經付出了巨大的努力來使用機器學習方法來實時監測各種電池狀態參數,例如SoC,容量,阻抗參數,可用功率,健康狀態(SoH)和剩余使用壽命(RUL)等參數。


5 機器學習所面對的問題與解決對策


樣本構建

樣本是原始數據的子集,以某種規定的方式被選擇用于研究。在機器學習的上下文中,術語樣本通常包括訓練數據和測試數據。目前,與樣本構建相關的問題可以主要分為三種類型:樣本數據的來源、特征向量的構建和樣本大小的確定。
材料科學中的樣本數據通常來自計算模擬和實驗測量,由不同的研究機構或學校收集,缺乏集中管理系統。材料數據基礎設施的開發已經緩解了這個問題,盡管每個數據庫是分開的而不是以數據格式統一,這仍然限制了機器學習的適用性。
特征向量在很大程度上決定了模型預測的準確性,因此至關重要。理想情況下,特征向量應為提取主要結構和化學趨勢提供簡單的物理基礎,從而能夠快速預測新的材料化學。材料研究中最常用的特征向量主要包括組成,結構,電子密度和庫侖矩陣。由于每個特征向量都用于特定應用,因此不存在對材料研究中的所有應用都有效的統一特征向量。
樣本量的確定也是樣本構建過程中的一個關鍵因素,與機器學習中的維數減少有關。樣本量確定樣本數據是否包含有關樣本的內在規律的隱含信息,這很大程度上取決于研究項目和所選擇的機器學習方法。鑒于一些參數很少且復雜度較低的方法,例如SVM方法,當樣本量較小時可以很好地執行,人工神經網絡等復雜模型也可以實現高預測精度。質量樣本數據,無論樣本大小。

可理解性

目前,大多數機器學習模型被視為“黑匣子”,這意味著這種模型提取的知識難以理解。例如,當使用SVM模型來解決分類或回歸問題時,通過訓練獲得的最佳分類平面和/或擬合曲線的參數是不可見的并且隱藏在模型中。知識表示的可懂度是評估學習算法的重要指標之一。在大多數領域,機器學習模型應該是可理解的,因為它往往被視為具有可理解模式和規則的模型。機器學習在材料研究中的應用同樣需要具有良好可理解性的模型。在應用機器學習來預測材料行為的早期階段,使用具有良好可懂度的符號機器學習方法。然而,隨著統計學習方法的發展,出現了可懂度差的問題。因此,如何將“黑匣子”變成“白盒子”并提高模型的可懂度的問題目前是一個需要立即解決的問題。解決此類問題的最常用方法如下:1)嘗試開發更易理解的算法并避免使用可懂度差的算法。楊等人提出了一種研究人工神經網絡解釋能力的方法,從而成功克服了“黑匣子”問題。2)從難以理解的算法的結果中提取知識。

可用性

可用性是使用機器學習方法解決實際問題的復雜程度。在材料科學中應用機器學習的復雜性體現在兩個方面。1)機器學習過程很復雜,沒有專業知識和指導就無法完成。例如,當使用機器學習進行材料屬性預測時,應該應用降維和相關分析來提高模型的預測精度。報道了一項關于晶體結構預測的研究,其中使用PCA來降低由于樣品的高維度導致的問題的高維度,這有助于提高預測準確性。使用條件屬性相關分析來解釋有機聚合物材料的性質的預測結果。2)參數的確定也是一項復雜的任務。由于機器學習方法對這些參數和內核函數非常敏感,因此參數確定是機器學習過程中的關鍵步驟。材料科學中使用的機器學習方法的參數主要通過手動調整或基于經驗來確定。此外,采用一些優化算法來優化這些參數。

學習效率

機器學習的速度與其實際應用直接相關。雖然在模型訓練和測試中總是追求高速,但是不可能同時實現兩者。例如,KNN方法訓練速度高但測試速度低,而神經網絡模型訓練速度低但測試速度高。目前,學習效率問題在材料科學的機器學習應用中并不是很重要,因為這些機器學習應用的樣本量很小,從幾十到幾千不等。然而,隨著世界各國材料基因組計劃的推進,材料科學將進入“大數據”時代,數據量將變得巨大,這將對學習效率帶來巨大挑戰。因此,如何提高機器學習學習效率的問題也將成為迫切需要解決的問題。為此,我們需要研究在該領域采用高性能計算方法(如并行計算和云計算)的可能性。


技術相關文章:

材料研究迎來9大方面機遇

未來全球15大熱門研究方

石墨烯是什么?有哪些應用和特點?

文章來源:http://gang.www.qpamc.cn/index.html 


本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:steeltube@foxmail.com

會員頭像

小編

文章詳情頁底部廣告
国精品人妻无码一区免费视频电影


成全视频观看高清在线观看| 欧美a级大黄片一区二区三区| 久久午夜无码鲁丝片午夜精品| 色视频WWW在线播放国产人成| 99热门精品一区二区三区无码| 狠狠躁天天躁无码不卡| 亚洲精品国产成人99久久| 亚洲人午夜射精精品日韩| 2021久久精品免费观看| 国产精品高潮呻吟久久AV|