近年來,計算和表征材料性質(zhì)的方法發(fā)展迅速。在材料性質(zhì)計算方面,分子動力學(MD)模擬等方法在自由能計算和藥物發(fā)現(xiàn)方面取得了良好的結(jié)果。除了材料性能計算外,材料性能表征也是材料研究的重要組成部分。在各種表征方法中,電子顯微鏡,包括掃描電子顯微鏡(SEM)、透射電子顯微鏡(TEM)等,是表征材料宏觀和內(nèi)在性能的重要手段。在現(xiàn)階段,這種檢測技術(shù)在很大程度上依賴于人工觀察和判斷,耗時、耗力且難以量化。基于材料微觀圖像分析進行材料性質(zhì)判斷的自動化、定量化和智能化,無疑是值得探索的研究方向。
本工作中,作者以高分子相容性作為具體研究對象開展了研究。高分子相容性是高分子共混中影響共混材料性能的一個關(guān)鍵物理量。高分子相容性一般指高分子在分子尺度上的可混溶性,相容性差將嚴重限制高分子共混物的使用。對于高分子相容性的識別,研究者們通常使用SEM、DSC(差示掃描量熱儀)等手段進行分析,并通過經(jīng)驗對結(jié)果進行人工判別,而計算機視覺的相關(guān)技術(shù)有望將這一過程自動化。
作者通過從大量已發(fā)表的相關(guān)文獻與部分高分子數(shù)據(jù)庫中收集相關(guān)數(shù)據(jù),獲取了一批高分子微觀結(jié)構(gòu)的SEM圖片與對應(yīng)的相容性標簽,構(gòu)建為供機器學習模型訓(xùn)練與測試的數(shù)據(jù)集。在機器學習模型上,作者使用了卷積神經(jīng)網(wǎng)絡(luò)(CNN)中目前性能最佳的圖像分類神經(jīng)網(wǎng)絡(luò)包括VGG、ResNet、DenseNet,并與傳統(tǒng)邊緣檢測算法進行了比較(圖2)。為了解決訓(xùn)練數(shù)據(jù)不足的問題,作者使用遷移學習方法,將模型在大規(guī)模數(shù)據(jù)集ImageNet上進行預(yù)訓(xùn)練,接著使用共混物的SEM 圖片對模型參數(shù)進行微調(diào)。除此之外,作者還通過對圖片進行平移、旋轉(zhuǎn)、翻折、裁剪等操作實現(xiàn)了數(shù)據(jù)增廣。最終,模型實現(xiàn)了測試集上94%的準確率,高于傳統(tǒng)算法的識別準確率,并與該領(lǐng)域研究工作者進行的人工識別對照組準確率接近。通過消融實驗,作者驗證了預(yù)訓(xùn)練對于模型效果提升的重要作用,為解決目前化學領(lǐng)域普遍存在的少樣本問題提供了思路。此外,作者還通過處理模型的輸出結(jié)果,嘗試建立了關(guān)于相容性的定量描述。
研究還得出了一些有趣的結(jié)果。不同的深度學習模型在預(yù)訓(xùn)練過程中表現(xiàn)不同,并且在預(yù)訓(xùn)練過程中的表現(xiàn)與模型在測試集上的準確率趨于一致(圖3)。在定量化描述方面,現(xiàn)有的結(jié)果顯示出兩極分化。混溶樣品的定量結(jié)果非常接近“1”,而不混溶樣品則接近“0”,這與訓(xùn)練過程中所給的標簽有關(guān),未來在更精細的標注下將得到改善。盡管取得了較高的識別準確率,這種方法的性能還受到SEM圖像質(zhì)量和清晰度的限制。此外,在許多實際應(yīng)用中還存在更復(fù)雜的情況(例如三元或四元共混物)。未來,隨著數(shù)據(jù)集的增加,我們希望所建立的模型能夠在非理想情況下表現(xiàn)得更好。
這項工作屬于讓化學實驗的表征與分析更加自動化和智能化的探索,這對于未來高通量自動化化學實驗具有重要意義。此外,這項技術(shù)可以遷移到其他的材料性能預(yù)測中,并且不局限于SEM圖像,如紅外光譜等其他的化學測試結(jié)果也可以通過機器學習方法進行分析,這將激發(fā)更多將人工智能用于物質(zhì)科學研究的創(chuàng)造性方法,促進跨學科的發(fā)展。
原文鏈接:https://doi.org/10.1021/acs.jcim.3c00489
下載:Automatically Predict Material Properties with Microscopic Image: Example Polymer Miscibility