详情

高质量数据集典型案例|透平机组智能运维高质量数据集

来源:国家数据局2025/11/8 8:44:3718116
导读
统筹设计、运行、维护、故障等多源数据,结合外部权威文献与专家经验,建立“采集—清洗—结构化—标注—入库”的标准化流程,累计处理语料8000余份,形成六大典型子集和超300万训练Tokens,为智能诊断提供高质量底座。
  燃气轮机作为国家能源核心装备,广泛应用于舰船、飞机及海上平台,但长期存在运维数据分散、结构化不足等瓶颈,制约智能诊断与运维升级。依托覆盖200余台机组、15年以上多源运维数据,创新“工具链+智能解析+人工优化”模式,构建行业首个覆盖全生命周期的高质量数据集,支撑智能运维大模型落地,推动能源装备运维能力迈向国际领先。
 
  方案和成效
 
  一是夯实基础,构建全生命周期语料体系。统筹设计、运行、维护、故障等多源数据,结合外部权威文献与专家经验,建立“采集—清洗—结构化—标注—入库”的标准化流程,累计处理语料8000余份,形成六大典型子集和超300万训练Tokens,为智能诊断提供高质量底座。
 
  二是协同共建,推动应用场景落地。联合设备厂家、科研院所和运行单位,建立语料标准与共享机制,打通多型号机组数据接口,形成“AI+燃机”协同生态。面向业务梳理8类43个应用场景,率先实现“智能截图解读”“报告结构化生成”“手册对话问答”等功能,已在TES3.0系统和205台机组规模化应用。
 
  三是赋能行业,提升运维效能与国家保障。依托“海能”模型构建全生命周期诊断体系,在极端环境下显著降低停机风险,实现“零宕机、零事故”目标。典型故障响应由3天压缩至4小时,人工分析减少70%,累计提前预警260余起、避免损失上亿元,推动行业由“经验驱动”向“智能赋能”转型,为国家能源安全和产业高质量发展提供有力支撑。
 
  创新点
 
  一是构建专家+AI协同体系。建立“专家+AI工程师+知识工程师”三位一体机制,实行语料责任制和双重校核,由设备专家终审语义,确保数据权威性,增强模型推理与诊断深度。
 
  二是形成语料智能处理闭环。研发OCR与结构标注一体化工具链,突破图文混合、格式复杂难题,实现“识别—清洗—重建—标注”自动化,大幅提升语料处理效率与一致性,满足大模型高质量输入。
 
  三是打造可追溯语料资产体系。引入全生命周期与版本化管理,覆盖来源、版本、责任人等元信息,支持快速检索与精调,建立可审计、可演进的数据底座,保障大模型长期稳定发展。

版权与免责声明:凡本网注明“来源:兴旺宝”的所有作品,均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版 权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:兴旺宝”。违反上述声明者,本网将追究其相关法律责任。 本网转载并注明自其它来源(非兴旺宝)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

展开全部
热门评论1
马上评论