详情

多模态地理科学大模型“坤元”发布推动地理学与人工智能深度融合

来源:中国科学院自动化研究所2024/9/24 14:24:0264
导读
大模型是指通过海量数据训练的深度学习模型,具备强大的语言理解、信息生成和处理能力。“坤元”是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力。
  9月19日,中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。
 
  大模型是指通过海量数据训练的深度学习模型,具备强大的语言理解、信息生成和处理能力。“坤元”是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力。研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。
 
  在“懂地理”方面,该团队建立了涵盖4大类、16小类的地理全学科语料库,提供了320亿词元供大模型自监督学习,制作了4万余条高质量地理学指令进行模型微调。与通用语言大模型相比,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,并在地理学基准测试集上的准确性提升了31.3%。
 
  在“精配图”方面,该团队自主研发了面向多层次地图信息的多模态检索技术以及支持地理认知与图形表达的知识推理技术。这些技术使得“坤元”能够在解答地理学提问的同时,可以根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。
 
  在“知人心”方面,该团队创新性地提出了基于“认知启航-应用智导-前沿研析”框架的用户画像精准判别与响应技术,保证“坤元”能够充分考虑地理知识爱好者、地理学专业学生和科研人员的地理科学知识体系认知和表达差异,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。
 
  在“智生图”方面,该团队基于“坤元”开发的科研助手,可以根据用户指令完成概念理解、数据获取、信息分析、制图综合等流程,生成用户需要的专业地理图表。
 
  “坤元”旨在拓宽普通大众的地理视野,解放地理从业者的双手,推动地理智能发展,赋能地理科学研究,加速重要地理科学发现。目前,“坤元”已支撑发表Nature子刊、The innovation、Earth’s Future等高水平学术论文10余篇。未来,研发团队将推进地图大模型与地理推理机研发,以期让地理科学语言大模型读懂地图;将打造地理科研协作大平台,以期让每个科学家和科研团队都可以拥有专属的地理大模型,并能够与数百万科学家通过共享数据、模型、研究思路等方式协同工作。
 
多模态地理科学大模型“坤元”

版权与免责声明:凡本网注明“来源:兴旺宝”的所有作品,均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版 权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:兴旺宝”。违反上述声明者,本网将追究其相关法律责任。 本网转载并注明自其它来源(非兴旺宝)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

展开全部
热门评论