OpenAI发布人工智能安全路径报告

【编者按】

2023年4月5日，OpenAI在其官网上发布了《我们迈向人工智能安全的路径》(Our approach to AI safety) 一文，对包括ChatGPT在内的AI产品安全问题进行回应。这一公告内容从六个角度对其AI产品的安全愿景进行了声明。此前，韩国三星称ChatGPT导致其数据泄露、科技界对巨型AI暂停研发进行联合主张、意大利对ChatGPT的全面封禁等将AI产品安全问题推至风口浪尖，Open AI此举也恰是对此前安全问题质疑的回应。

在这份报告中，Open AI首先强调，其致力于兼顾AI的安全与开发利益，基于此，其报告内容主要分为六大角度：1. 围绕安全、不断升级；2.立足现实、完善保障；3.保护儿童；4.尊重隐私；5.精准产出、尊重事实；6.持续投入、促进合作。

以下将对该报告每一部分内容进行简要编译和评价。

01 围绕安全、不断升级

Open AI表示，其将通过测试、外部专家反馈、政府安全监管等方式，建立其AI安全系统。其指出，此前在GPT-4发布之前，Open AI内部曾花费6个多月的时间来进行相应的安全工作。

此前，Open AI也在《关于语言模型安全和误用的经验教训》(Lessons learned on language model safety and misuse) 一文中就其安全工作进行了说明，表明其正在通过新的基准(benchmarks)和分类器(classifiers)来改善API语言模型滥用的问题。

02 立足现实、完善保障

Open AI认为，其在实验室中对AI安全工作的开展是有限的，必须通过在实践中获得反馈来不断迭代提升其AI安全系统。而在AI通过实践完善自身安全系统时，社会应当给予充分的尊重和理解，“我们认为社会必须有时间更新和调整，以适应日益强大的人工智能”。

(Open AI 在《关于语言模型安全和误用的经验教训》中对其安全工作流程的示意图)

03 保护儿童

Open AI强调，其要求年满18岁、在获得父母批准后且年满13岁的儿童才能使用其AI产品。此外，其建立了“安全护栏”(safety guardrails)，GPT-4对于仇恨、骚扰、暴力或成人内容的响应可能性相对于GPT-3.5降低了82%。另外，其还通过与非营利组织Khan Academy等合作，以构建人工智能辅助系统的方式来保护未成年人。

这一声明也与呼应了当日（4月5日）美国拜登政府在会见总统科学技术顾问委员会时提及的内容，即呼吁国会通过两党隐私立法，重视人工智能应用过程中对儿童的保护。

04 尊重隐私

在隐私层面，Open AI声明其收集的数据都是公开的内容，且这些内容经过人类评审。此外，这些数据并不会直接被商用，只是用于机器学习和模型改进。另外，Open AI还表示其会尽力从训练数据集中删除个人信息。

当然，Open AI对个人信息删除的力度如何，仍然是一个“黑箱”问题。

05 精准产出、尊重事实

(GPT-4与GPT-3.5回应的精准度对比)

06 持续投入、促进合作

Open AI认为，提升AI系统的安全性并非一个简单的过程，需要长期投入，并与政策制定者等主体开展广泛的合作。随着AI在全球范围内的普及，AI生态系统已经在逐步建立，这对全球范围内的技术和制度创新都将是一个新的挑战。

在此前发布的《部署语言模型的最佳实践》(Best practices for deploying language models) 中,Open AI曾呼吁其他组织参与AI软件的部署，共同致力于语言模型的安全建设。

参考资料

1.https://openai.com/blog/our-approach-to-ai-safety

2.https://cdn.openai.com/papers/gpt-4-system-card.pdf

3.https://openai.com/research/language-model-safety-and-misuse

4.https://openai.com/blog/best-practices-for-deploying-language-models

文稿：张旭阳，网络法理论与实务前沿公众号执行主编

编辑：陆愿晟，网络法理论与实务前沿公众号数据治理组编辑

声明：本文来自网络法理论与实务前沿，版权归作者所有。文章内容仅代表作者独立观点，不代表安全内参立场，转载目的在于传递更多信息。如有侵权，请联系 anquanneican@163.com。

OpenAI发布人工智能安全路径报告

美国成立国家安全人工智能风险测试工作组

欧盟和新加坡签署有关AI安全合作的行政安排

警惕AI网络安全应用的“毒蘑菇陷阱”