学校首页 | 加入收藏
科学研究
 
学术动态
当前位置: 首 页 > 科学研究 > 学术动态 > 正文

 

智能制造与电气工程学院在国际机器学习顶会发表最新研究成果

更新日期:2026年05月20日   点击:[]次

通讯员(高博 图/文)近日,南阳师范学院智能制造与电气工程学院教师、智能防爆装备河南省协同创新中心电气信息团队成员高博博士以第一作者和通讯作者身份完成的论文“Softplus Attention with Re-weighting Boosts Length Extrapolation in Large Language Models”,被第 43 届国际机器学习大会(The 43rd International Conference on Machine Learning,ICML 2026)正式接收。

ICML 是国际人工智能与机器学习领域最具影响力的顶级学术会议之一,在基础模型、深度学习、统计学习、强化学习等方向具有广泛学术影响力。根据中国计算机学会(CCF)推荐目录,ICML 被列为人工智能方向A类国际学术会议。该会议长期与NeurIPS、ICLR共同构成机器学习领域最受关注的高水平学术会议体系,具有严格的匿名同行评审机制和较高的国际学术认可度。

本次接收的论文重点针对目前广泛使用的Softmax自注意力机制在处理超长文本时容易出现性能下降、关键信息抓取不准等问题展开研究。围绕这些问题,论文提出了一种新的注意力计算方法LSSAR,旨在提升模型处理长文本和复杂信息的能力。实验结果表明,该方法在长度外推、长文本理解、信息检索等任务中表现显著优于Softmax自注意力机制,并在物理规律学习任务中展现出独特优势:在仅有1.09亿参数的模型上,采用LSSAR方法后即可从行星运动数据中学习出牛顿引力规律的核心结构,而采用传统Softmax自注意力机制的万亿参数模型在同类任务上仍未取得同样效果。这说明,人工智能模型的能力提升不仅取决于参数规模,也取决于底层方法设计是否合理。

图 1 展示了模型在地球轨道引力预测任务中的结果对比。其中,LSSAR学到的力矢量能够正确指向太阳并呈现出清晰的径向引力结构,而传统Softmax自注意力机制的预测结果则明显更为离散和不稳定。

图1 地球轨道引力预测结果对比

该论文由南阳师范学院与英国伦敦国王学院、卢森堡大学等单位合作完成,其中南阳师范学院为论文第一完成单位。论文的接收,表明我校教师在人工智能基础模型与前沿算法研究方面取得了新的进展,也体现了学校在高水平国际学术合作和科研成果培育方面持续提升的能力。

近年来,南阳师范学院坚持面向学术前沿和国家战略需求,持续加强高层次科研平台建设与青年教师科研能力培养,积极推动人工智能、智能制造等方向的交叉融合研究。此次论文被 ICML 2026 接收,是学校科研国际化水平不断提升的又一重要成果,对于进一步提升学校在人工智能领域的学术影响力和社会声誉具有积极意义。

据悉,该研究得到南阳师范学院博士专项项目、河南省自然科学基金项目和智能防爆装备河南省协同创新中心的资助,并通过英国科研与创新署(UK Research and Innovation, UKRI)人工智能研究资源 Gateway 项目(Artificial Intelligence Research Resource Gateway,AIRR Gateway),获得 Isambard-AI 高性能计算资源支持。

 

   

©南阳师范学院智能制造与电气工程学院
地址:河南省南阳市卧龙区卧龙路1638号
南阳师范学院西区实训1号楼 邮编:473061