2023年12月20日-12月21日,中国信息通信研究院以“回归数据本质 应用驱动治理”为主题,在北京召开为期两天的“2023数据资产管理大会”。中国信通院云计算与大数据研究所长期研究数据流通理论与技术,持续完善隐私计算、使用控制技术标准体系,在今年下半年开展多项技术标准的制定工作。

12月21日,在2023数据资产管理大会的数据基础设施论坛上,中国信通院云计算与大数据研究所高级业务主管白玉真对标准《面向大模型训练与推理数据保护的可信执行环境技术要求》进行解读。

《编制背景》

当前,人工智能技术快速发展,高质量模型的产生离不开高质量数据作为输入,人工智能正加速从“以模型为中心”向“以数据为中心”转变,刺激数据要素市场需求爆发。但另一方面,由于高质量数据分散、产业生态不健全、技术限制等原因,导致用于人工智能训练的数据未能大规模流通。隐私计算技术作为数据流通技术解之一,可实现数据的“可用不可见”,并通过多方数据的联合训练助力大模型能力提升。其中,可信执行环境是基于软硬件结合方式的安全计算环境,具备安全汇聚多方数据与建模的能力,可在一定程度上满足模型、数据的隐私保护与安全需求。

《内容介绍》

本标准自2023年9月启动,联合业内30多家企业,50多位专家历经多轮讨论形成草案,从数据工程、模型训练、模型推理、硬件加速和安全性等方面对大模型训练与推理场景中的可信执行环境进行要求,以实现训练与推理的可用、性能提升和安全保障。在数据工程方面,围绕训练数据质量提升,对产品提出了关于多模态数据处理、数据分析、质量评估、数据增强等要求;在模型训练支持中,以提升模型训练可用性为目标,包含管理功能与优化能力;在模型推理支持中,对模型仓库、任务调度和模型编排等方面进行要求;在硬件相关部分,涉及适配可信执行环境的可信加速硬件的支持与适配等能力;在安全性要求中,对可信执行环境与外部环境、与可信加速硬件间的数据交互和数据存储等方面提出了要求。

《未来计划》

感谢以上各单位相关专家的积极供稿和讨论!在明年1-2月,我们将基于标准内容,考虑可信执行环境和人工智能技术的发展,推出对应的产品测试,欢迎感兴趣的各位专家参与讨论!

声明:本文来自CAICT数据要素,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。