生成式人工智能、深度合成技术与算法推荐的关联与合规要点

国务院早在2017年就发布了《新一代人工智能发展规划》，强调人工智能是引领未来的战略性技术，要把人工智能发展放在国家战略层面来系统布局，预计到2025年，国家会“初步建立人工智能法律法规、伦理规范和政策体系，形成人工智能安全评估和管控能力”。近几年，以ChatGPT为代表的生成式人工智能技术高速发展，世界各国的企业都在纷纷研发相关产品或服务，但是这种技术在为社会带来便利的同时也带来了相关的法律风险。在此背景下，国家网信办发布了《生成式人工智能服务管理办法（征求意见稿）》（以下简称《办法》），明确了生成式人工智能的定义，以及相关产品和服务提供者的合规义务，对生成式人工智能进行专项监管，逐步完善中国人工智能法律体系。

01 三者之间的关系是什么？

从字面来看，生成式人工智能不仅包括算法，还涉及模型、规则等，但是其涉及的算法生成技术与深度合成技术的定义基本是一致的，也都属于生成合成类的算法推荐技术。

名词	定义	来源
生成式人工智能	基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。	《办法》
深度合成技术	利用深度、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。	《互联网信息服务深度合成管理规定》（以下简称《深度合成规定》）
算法推荐技术	利用生成合成类、个性化推荐类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。	《互联网信息服务算法推荐管理规定》（以下简称《算法推荐规定》）

02 如何实现模型训练合规？

《办法》特别强调了训练数据来源的合法性问题，因为生成式人工智能产品往往需要海量的数据来进行算法的更迭优化，但是这些数据中如果有个人信息，应具备同意等合法的处理基础，如果有受版权保护的图片，则需要先获得版权人的授权，例如盖蒂图片（Getty Images）目前已起诉Stability AI，因为它认为Stability AI未经其许可就爬取了它的1200万张受版权保护的图片，此行为构成了著作权侵权，此外，还有一些艺术家也在控诉Stability AI侵犯版权的问题。因此，提供者应通过内部的管理机制，在事前就进行数据源的合规性核查，尽到合理的注意义务。

提供者还需要保证训练数据真实准确、客观多样，从而促进生成式人工智能产品或服务生成内容的客观性，例如，亚马逊就曾被爆出了AI招聘歧视事件，据报道显示，亚马逊基于对过往10年的简历中的5万个关键词进行识别并进行排序训练，但是这些作为训练数据样本的简历中，大部分求职者为男性，所以基于此训练出的AI算法也存在重男轻女的歧视性风险。因此保证训练数据的多样性非常重要。

03 如何进行算法备案和评估？

《办法》指出，利用生成式人工智能产品向公众提供服务前，应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估，并按照《算法推荐规定》履行算法备案手续。

国家互联网信息办公室目前已经公示了三批通过备案的算法，其中生成合成类算法共有10个，涵盖了文字、图片、语音、视频的生成合成类算法，人工智能客服场景是相对最为普遍的应用场景。公示的生成合成类算法具体汇总如下：

算法名称	主体名称	应用产品	主要用途
快手短视频生成合成算法	北京快手科技有限公司	快手（APP）	应用于短视频制作场景，利用生成模型对用户上传图片、视频进行编辑和重新生成，实属性编辑、风格转换等。
钉钉语音识别算法	钉钉科技有限公司	钉钉（APP）	应用于即时通讯场景的语音转文字功能，实现对语音消息的文字识别。
美团电话智能客服算法	北京三快科技有限公司	美团（APP）	应用于电话智能客服中的语音问题识别功能，实现对用户的简单问题给出解决方案。
美团在线智能客服算法	北京三快科技有限公司	美团（APP）	应用于在线智能客服中的文字问题识别功能，实现对用户的简单问题给出解决方案。
天猫小蜜智能客服算法	浙江天猫网络有限公司	手机天猫（APP）	应用于智能客服场景，实现对文字或语音问题识别并从知识库中给出解决方案。
钉钉翻译算法	钉钉科技有限公司	钉钉（APP）	应用于即时通讯中的翻译功能，实现对特定语种之间的翻译服务。
钉钉图像识别文字算法	钉钉科技有限公司	钉钉（APP）	应用于即时通讯中的图像转文字功能，实现对图片中的文字消息识别和提取。
淘宝人生表情动作复刻算法	浙江淘宝网络有限公司	手机淘宝（APP）	应用于形象图片制作功能，识别照片中人物表情动作，生成淘宝人生形象图片。
菜鸟物流智能客服算法	杭州菜鸟物流信息科技有限公司	菜鸟（APP、小程序）	应用于智能客服场景，分析用户提出的诉求，以文本方式提供智能回答。
逗拍风格迁移算法	深圳市大头兄弟科技有限公司	逗拍（APP）	应用于视频制作场景，将用户上传图片替换为用户选择的模板风格，生成风格化视频。

04 如何进行科技伦理审查？

虽然《办法》并没有特别提及科技伦理审查的问题，但是《深度合成规定》对深度合成服务提供者提出了科技伦理审查的要求，且科学技术部在近期发布了《科技伦理审查办法（试行）（征求意见稿）》，其指出，涉及人的科技活动（包括使用个人信息等），以及不直接涉及人，但可能在公共秩序等方面带来伦理风险挑战的科技活动都需要进行科技伦理审查，伦理高风险的科技活动还需要报请主管部门开展专家复核，而附录部分进一步指出，具有舆论社会动员能力和社会意识引导能力的算法模型、应用程序及系统的研发就需要进行专家复核。因此，提供生成式人工智能产品或服务还需要关注科技伦理审查的问题。若属于需要开展科技伦理审查的主体，则需要建立科技伦理（审查）委员会，明确相关制度规范和工作规程。

05 总结

随着各种人工智能模型的快速发展，各国的监管者也纷纷对其进行了回应，意大利数据保护局Garante宣布暂时禁用ChatGPT，并对其涉嫌违反GDPR的规定开始展开调查，要求OpenAI来对此进行解释说明。中国也通过发布《办法》来对生成式人工智能的监管问题进行了回应，宏观治理基调是“支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作，鼓励优先采用安全可信的软件、工具、计算和数据资源”，与《新一代人工智能发展规划》是一致的，再从微观治理路径来看，《办法》承袭了现有规范关于算法治理的内容，并特别强调了生成内容合规、算法模型合规、运营行为合规的问题。合规要点汇总如下：

（作者：北京腾云天下科技有限公司葛梦莹南钰彤）

声明：本文来自CCIA数据安全工作委员会，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

生成式人工智能、深度合成技术与算法推荐的关联与合规要点

微软CEO眼中AI Agent商业模式和安全

我国生成式人工智能的监管框架及主要法律风险识别

Agent视域下的人工智能赋能作战系统