科技日報記者 張佳欣
據28日《自然·材料》雜志報道,美國哥倫比亞大學工程學院團隊創建了一種機器學習算法,可以通過觀察納米晶體產生的圖案來推斷材料的原子結構。該成果破解了困擾材料科學界一個世紀的納米晶體結構解析難題,有望加速新藥研發、清潔能源材料開發及文化遺產研究。
晶體學是理解幾乎所有材料特性的最有效方法。然而,傳統方法僅適用于毫米級完美晶體,面對由微小顆粒組成的粉末狀納米晶體時,現有技術僅能獲得模糊的原子排列信息,導致諸多關鍵材料研究陷入停滯。
此次,研究團隊利用4萬個已知原子結構對一個生成式人工智能(AI)模型進行了訓練,從而開發出一個能夠從“失真數據”中還原原子結構的智能系統。
具體而言,團隊創建了一個包含4萬個晶體結構的數據集,并將原子位置打亂,使其看起來像是隨機排列的。隨后,他們訓練了一個深度神經網絡,將這些幾乎隨機排列的原子與其對應的X射線衍射圖案聯系起來。該網絡利用這些觀測結果對晶體進行重建。最后,他們讓AI生成的晶體經歷一個名為“里特維爾德精修”的過程,即根據衍射圖案,將晶體“微調”到接近最優狀態。
盡管該算法的早期版本表現不佳,但最終它學會了比預期有效得多的晶體重建方法。該算法能夠從各種形狀的納米級晶體中確定原子結構,包括之前實驗難以表征的樣本。
團隊表示,這個AI模型也學會了自然界所允許的原子排列模式。這種模式識別能力預示著蛋白質結構預測、藥物分子設計等領域將迎來范式轉變。