近日,我校理学院陈洪教授课题组以“Huber Additive Models for Non-stationary Time Series Analysis”为题,在International Conference on Learning Representations(ICLR 2022)发表研究论文。ICLR是人工智能领域的顶级会议,得到国内外学者的广泛认可。
稀疏可加模型在处理时间序列数据时表现出良好的灵活性和可解释性。然而,现有的方法通常假设时间序列数据是平稳的,并且数据服从高斯分布。对于金融和医疗领域等实践中经常出现的重尾非平稳时间序列数据,这两种假设都过于严格。为了解决这些问题,我们提出了一种自适应的稀疏Huber可加模型,用于非高斯数据和(非)平稳数据的稳健预测。理论上,对于平稳和非平稳时间序列数据,我们建立了估计量的推广界,这与相依观测学习理论中广泛使用的混合条件无关。此外,非平稳时间序列的误差界包含数据分布随时间变化的差异度量。这种差异度量可以通过经验估计,并在我们的方法中用作惩罚。在合成和真实基准数据集上的实验结果验证了该方法的有效性。
传统稀疏可加模型与本文方法的差异如图1所示:
为了验证模型的有效性,我们通过模拟数据(例A-C)验证了模型在不同噪声,不同种类(平稳、非平稳)时间序列数据下的有效性。
该研究是陈洪教授前期CCF A人工智能顶会工作(H. Chen, X. Wang and H. Huang, NIPS, 2017; X. Wang, H. Chen and H. Huang, NIPS,2017;G. Liu, H. Chen and H. Huang, ICML, 2020)和人工智能顶刊工作(H. Chen, Y. Wang, C. Deng and F. Zheng, TNNLS)的进一步延续和深入,得到了国家自然科学基金面上项目等的资助。该论文与京东探索研究院,悉尼大学,UIUC合作发表。信息学院博士研究生王英杰是此篇论文的第一作者,理学院陈洪教授是此篇论文通讯作者。