详情

首个地质大模型“坤枢”上线!曙光超智融合硬核撑场

来源:中科曙光2025/10/13 9:18:3619156
导读
“坤枢”大模型基于国产超智融合技术,创新性地采用了TG-MoLE 架构,通过双层分组路由策略和任务驱动的跨组路由调整机制,有效缓解了领域模型在持续学习过程中的灾难性遗忘问题,实现了专业知识与通用能力平衡优化,为复杂多变地质调查任务提供更加精准、高效的解决方案。
  近日,首个地质领域专用大语言模型“坤枢”在河南郑州正式上线,该大模型的部署将有助于夯实地质产业数字化基础,在保障国家能源资源信息安全前提下,完成多项地质相关任务。而在该模型诞生过程中,中科曙光超智融合技术起到了关键支撑作用。
 
  地质调查领域专业性强、数据海量,传统模型常因知识更新出现“学新忘旧”的难题。“坤枢”大模型基于国产超智融合技术,创新性地采用了TG-MoLE 架构,通过双层分组路由策略和任务驱动的跨组路由调整机制,有效缓解了领域模型在持续学习过程中的灾难性遗忘问题,实现了专业知识与通用能力平衡优化,为复杂多变地质调查任务提供更加精准、高效的解决方案。
 
  而“坤枢”大模型训练所需要的算力资源,则来自河南某超智融合算力中心。该中心基于中科曙光超智融合技术架构,采用AI计算开放架构设计,配备了曙光国产云计算平台、高性能计算集群管理调度平台、人工智能平台以及专业的在线运维平台,可提供类型多样的算力服务。
 
  该超智融合算力中心自投入运行以来,作为河南区域经济发展、科技创新的重点平台,已服务于高端装备、智能制造、生物医疗、地球环境、人工智能等领域数智化创新,成为当地超智融合算力中心的标杆案例。
 

版权与免责声明:凡本网注明“来源:兴旺宝”的所有作品,均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版 权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:兴旺宝”。违反上述声明者,本网将追究其相关法律责任。 本网转载并注明自其它来源(非兴旺宝)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

展开全部
马上评论