核心提示: 近日,第37届国际机器学习大会(International Conference on Machine Learning,ICML)在线发表了陈洪教授与美国相关课题组的最新合作研究成果。
第37届国际机器学习大会(International Conference onMachine Learning,ICML)在线发表了我校陈洪教授与美国相关课题组的最新合作研究成果。陈洪为论文并列第一作者和通讯作者。ICML作为人工智能领域的国际学术会议,在机器学习学术界和工业界有一定地位。
该论文针对高维数据分析中的可解释需求,提出了一类新的稀疏可加模型,以实现有效稀疏变量选择和回归估计,结合算子逼近技术建立了模型的泛化误差分析,并在模拟和实际数据中验证了构建方法的竞争性。
针对高维数据的稀疏变量和关键样本选择一直是机器学习领域的热点研究课题,对提高机器学习方法的可解释性和应用效率有着重要的影响。虽然基于线性模型的相关研究已经很充分,但对应非线性模型的相关模型设计和数学基础研究还较欠缺。研究者基于可加模型、核方法与系数正则构建了一类新型稀疏收缩可加模型(Sparse Shrunk Additive Model, SSAM),能同时实现有效的回归预测、变量选择和关键样本发现。该模型与相关方法的理论性质总结如下表:
理论上,研究者通过发展算子逼近技术,建立了学习器的泛化误差分析,获得了学习率的估计。特别地,相较于已有相关研究,该理论分析并不要求核函数满足对称正定性条件。应用上,研究者在高维小样本情形模拟数据和UCI数据上进一步验证了模型的变量选择和预测能力。
近年来,陈洪在机器学习模型的泛化性和可解释性分析领域取得了一系列有影响的研究成果。该研究是陈洪前期与匹兹堡大学数据科学实验室合作研究工作稀疏可加机(NIPS 2017)的进一步延续,获得了国家自然科学基金面上项目的资助。
第37届国际机器学习大会将于7月13日至18日在线上举行。ICML采用双盲评审,本届会议录用论文1080篇,录用率为21.80%,国内有来自清华、北大、上海交大、中科大、浙大和南大等高校的工作被录用。
新闻链接:http://news.hzau.edu.cn/2020/0714/57697.shtml