近日,我院发表一篇关于基于大数据的红外光谱机器学习的研究论文。
红外光谱含有丰富的物质分子结构信息,因此成为了众多天文观测项目(例如斯皮策和哈勃空间望远镜)中用于探测星际介质的常规工具。目前分析分子红外光谱的最新技术是基于密度泛函理论(DFT)的量子计算,其高精度的理论预测能力超越了传统经验理论。但是由于星际介质中存在大量未知种类分子,DFT的高计算成本使其不能成功应用于分析星际红外光谱。因此天文学家们一直无法确定星际红外光谱的具体来源。为解决此问题,我们利用NASA多环芳烃DFT红外光谱数据库,设计并训练了一个神经网络模型,用以有效地预测星际分子的红外光谱。其计算成本比通用的DFT计算要低多个数量级。该模型展现了出色的样本外输入预测能力,使其适用于大幅改进当前用于理解星际介质的化学组成和演化的一般混合模型。
该研究是机器学习技术应用于星际介质研究领域的先驱工作,由我院王昭教授在维也纳技术大学客座访问时合作指导该校博士生P. Kovacs和广西大学本科生祝晓思共同完成。
论文链接:
https://arxiv.org/pdf/2010.09150.pdf(预印本)
https://iopscience.iop.org/article/10.3847/1538-4357/abb5b6 (全文)
论文作者:P. Kovacs(博)、祝晓思(本科)、J. Carrete、G. Madsen、王昭