石化行业高质量数据集通过测评

中化新网讯 近日,中国石化建设的“石油化工行业通用高质量数据集”通过工业和信息化部电子工业标准化研究院测评,成为国内首个通过国家标准测评的行业高质量数据集。

此次测评依据国家标准《高质量数据集 质量评测规范》,通过“数据+模型”相结合的测评方法,涵盖数据集说明文档、数据质量、模型应用3大维度17项指标,对数据集进行多维度全链条质量评估。“石油化工行业通用高质量数据集”包含行业特定术语、公式、分子式等,在格式规范性、内容一致性、内容干净性指标上得分均超90分,数据质量达到行业领先水平,充分验证其在支撑人工智能深度应用方面的可靠性。

该数据集支持了中国石化长城大模型训练,以及分子理解、分子生成、审计等专业大模型训练,其自主研发的高质量数据集全链路工具套件为系统内86家单位近900个用户开展数据加工处理工作提供支撑。同时,其标准化构建方法也为石油化工行业提供了可参考的建设范本。


    相关推荐

    深化“AI+制造”,各地如何布局? ——透视地方两会上的智造热点

    ​2025年12月召开的中央经济工作会议提出“深化拓展‘人工智能+’”,为“十五五”开局吹起了政策东风。1月以来,地方两会陆续召开,“人工智能+”一词成为多地政府工作报告中的“常驻嘉宾”。

    2026-02-25     中国化工报

    张家港举办化工智造研讨会

    1月28日,2026张家港市化工行业智能制造运营技术研讨会召开。

    2026-02-25     中国化工报

    书生万亿科学大模型开源

    2月4日,上海人工智能实验室宣布,开源全球首个基于“通专融合”架构的万亿参数科学多模态大模型——Intern(书生)-S1-Pro。

    2026-02-25     中国化工报

    京津冀首个具身智能超级工厂开建

    近日,领益智造北京具身智能超级工厂在亦庄正式启动建设,并与北京人形、北京源络科技有限公司、魔法原子等公司举行首批合作客户签约。

    2026-02-25     中国化工报

    湖北认定4个省级制造业创新中心

    近日,湖北省经信厅下发《关于认定工业母机智能数控系统等省级制造业创新中心的通知》,将4个制造业创新中心认定为省级制造业创新中心。

    2026-02-25     中国化工报