人工智能(AI)已成为创新的引擎,正在推动科学发现、经济增长和新的就业机会。AI对未来的影响越来越重要、AI界的规模越来越大,让我们容易忽视一个事实,那就是参与AI研发途径受限于某些必要资源,进而导致资源鸿沟。例如,AI前沿领域的进步往往与先进计算能力和数据联系在一起,而能够获取或使用这些资源的大多是一些大型技术公司或大学。因此,参与AI创新发展的广度有限,并可能导致永久偏见和其他系统性不平等。

2022年5月25日,美国国家人工智能研究资源(NAIRR)工作组发布中期报告,提出了如何构建、设计、运作和管理美国信息基础设施的愿景,以满足美国研究界的需求。在这份报告中,工作组提出了基于现有和未来联邦投资基础建立NAIRR的方法;设计了保护隐私、公民权利和公民自由的方案;考虑了多样性和公平性资源获取的促进措施;详细说明了NAIRR应该如何支持全方位的人工智能研究(从基础研究到应用启发研究再到转化研究)。此外,NAIRR工作组计划在年底发布实现该愿景的执行路线图。

一、NAIRR建设的初步框架

(一)NAIRR愿景

1. NAIRR 的战略目标:应该是以保护隐私、公民权利和公民自由的方式来加强和民主化美国AI创新生态。NAIRR通过资源支持来实现这一愿景,实施过程中需注重长期可持续性,例如,需要为信息基础设施、数据管理和保密、安全和可信赖AI提供研究机会;应当支撑学生进行AI相关早期实验,进而扩大参与人员的广度和多样化。

2. NAIRR的建立和维持目标:应当有助于实现人工智能研发的四个主要目标:1)刺激创新,NAIRR应该支持基础研究和AI使能研究中创新方法的研究、开发和转化;2)增加人才的多样性,NAIRR应积极寻求增加AI研究人员的多样性,降低所有人参与的障碍,无论其背景、组织关系或在美国的地理位置如何;3)提高能力,NAIRR应该通过扩大访问AI资源的机会来促进AI技能和知识,确保美国越来越多的AI研究人员能够在工作中利用最先进的技术;(4)促进可信赖人工智能发展:NAIRR应该提供信息、工具和培训,以支持促进可信赖和负责任AI发展和采用的研究。

3. NAIRR的组成:应该是由单一管理实体运行的联邦网络基础设施生态系统,并设有管理和外部咨询机构。管理实体应由行政领导和业务人员管理,负责NAIRR运行、资源分配和访问、用户支持、资源获取和合作关系、门户和其他网络基础设施的管理与协调等。与管理实体相连接的董事会,帮助制定NAIRR战略和政策,对NAIRR的运行进行长期监督,并向NAIRR的行政领导层报告。外部咨询机构,对NAIRR的运行进行独立的监督和评估,并对NAIRR的组成、运行和管理提供专业意见。

4. NAIRR的访问:以公平、公正和安全原则为基础,NAIRR的管理实体应努力提供一个资源的综合访问门户。

5. NAIRR的用户:对于从事AI研究的不同背景的研究人员和学生,NAIRR的设计应该支持他们广泛的需求。

(二)NAIRR的建立和维护

1. 联邦机构的资助、角色和责任。美国政府应该资助多个联邦机构以联合支持NAIRR的资源建设和管理。这些联邦机构的代表应该与NAIRR的管理和行政部门合作,提供专业知识并进行监督,同时通过NAIRR提供相关的网络基础设施资源。

2. NAIRR的所有权及管理。NAIRR的日常业务应由一个独立的非政府实体管理,并配备专职人员。NAIRR应该与资源提供商合作,通过用户访问门户提供广泛的资源。NAIRR管理实体应在政府适当的监管下,灵活地与私营部门签订合同、建立伙伴关系或达成其他协议;负责解决与NAIRR支持的AI研发相关的多样性、公平性、包容性和可获得性问题。

3. NAIRR的治理和监督。NAIRR的管理和行政应遵循正式章程和相关政策,由行政领导小组管理日常业务。NAIRR的管理政策和业绩应由董事会监督,并辅之以外部咨询、监督和评估机制。

4. NAIRR的资源分配与持续发展。访问NAIRR资源应视研究项目提案审查情况而定,遵循明确的使用政策和用户协议,并符合公开共享研究成果的相关要求。NAIRR资源分配流程应为预期用户提供便捷通道,尽可能轻量化且具有包容性。费用结构应采用分级模式,其中一些资源是收费的,另一些则是免费提供的。NAIRR资源分配框架应当能够激励用户为NAIRR或公共利益做出贡献。NAIRR管理实体应探索相关机制,以激励对数据和元数据方面的贡献,这将有助于增加资源的价值。

5. NAIRR的绩效指标和衡量标准。NAIRR的评估方法应以达成所设目标的最佳实践为基础。合格的外部评估者应定期评估NAIRR的绩效。NAIRR管理实体应收集和记录与绩效指标相关的数据,以支持资源评估,并应及时与公众共享这些数据。NAIRR管理实体应有充足预算用于稳定支持可靠基线数据收集和评估活动,并设计相关流程以便从一开始就掌握关键的分析方法;建立可公开访问的平台来跟踪NAIRR支持的研究的使用和产出,以及外部评估结果。NAIRR章程中应建立相应机制,使评估能够直接服务于NAIRR的战略目标、业务职能和资源能力等调整,以提升影响力和满足不断变化的需求。

二、NAIRR能力保障的调查与建议

NAIRR工作组针对AI研发资源和需求进行了调查,并结合相关工作会议、专题讨论、专家对话等,就资源要素、系统安全、隐私伦理等提出相关建议。

(一)NAIRR的资源要素和能力

1. 数据

工作组发现:(1)如果没有高质量、可信、密集、透明的数据资源,往往无法进行严谨的人工智能研发;(2)大多数领域和跨领域间存在数据质量挑战;(3)数据管理对于所有领域的研究人员来说都是一个巨大的挑战;(4)融合和连接异构数据的成本很高;(5)正在进行的一些有关数据的工作或活动可以服务于公共利益。

工作组建议: NAIRR应该:(1)协调一个由可信数据、计算供应商、主机组成的网络,以建立一个强大、透明和负责任的数据生态系统;(2)保护隐私应遵循安全使用的“五安全”框架(安全项目、安全人员、安全数据、安全设置和安全输出);(3)NAIRR领导层应建立并定期更新政策和管理结构,以处理、衡量和报告数据质量、使用和公平访问问题;(4)保护公民自由和公民权利,采用最佳的技术方法来建立管理政策,资助监督实体和评估,使公众参与,促进透明度,并减少与NAIRR数据使用相关的偏见和潜在危害;(5)NAIRR生态系统应鼓励向联邦系统提供AI研发的高质量数据,借此最大限度地利用社区访问;(6)为供应商、主机或社区的数据管理提供基础设施和人员支持,并鼓励研究社区特有标准持续发展,以及激励领域特有数据质量提升;(7)投入大量资源用于建立关于NAIRR数据政策、使用和管理的培训计划,以最大限度地提高各研究社区提供实质性贡献的能力,并促进最佳安全实践;(8)围绕可用于AI的数据建立一个有价值的生态系统,并支持数据搜索和发现;(9)如果NAIRR包含机密或敏感数据,则需要设置分级访问,且由数据提供者控制,并连同计算资源通过统一门户来获得。

2. 政府数据集

政府数据通常伴随着获取、治理、分发和管理方面的挑战。工作组建议,NAIRR管理实体应该:(1)探索通过NAIRR提供三种类型的政府数据:统计数据、行政数据和联邦资助的研究产生的数据;(2)基于现有联邦数据共享行动,促进研究人员访问政府数据集用于核准用途,同时通过基础设施提供必要的控制和保护。

3. 计算资源

工作组发现:(1)AI研发同时利用“生产”型(直接使用)和“实验”型(需改造)计算资源;(2)计算技术(从硬件到软件)发展迅速;(3)在大数据研究网络基础设施中,有效的计算可能需要将数据与处理数据的硬件共置;(4)边缘计算是人工智能研发的一个新兴领域,前景广阔。

工作组建议:NAIRR应该:(1)为不同的利益相关者提供对联邦内部以及商业计算资源的访问途径,包括传统服务器、计算集群、高性能计算和云计算;(2)用于NAIRR计算资源的软件应该跨越基础功能(存、算、网)、AI应用、APIs和服务访问等三个“层级”,以支持广泛的用户群;(3)NAIRR不应该包含可能降低总体能力的成熟应用,而应试点或酌情扩大那些支持AI研发的服务;(4)分阶段逐年部署计算资源;(5)支持联合外部边缘计算资源。

4. 试验平台

工作组发现:试验平台可以:(1)加速AI研究,推动特定领域进步;(2)增加AI研究的公平参与;(3)支持AI的质量评估;(4)激发AI研究的广泛参与;(5)服务于比较或验证。

工作组建议:NAIRR应该:(1)促进AI研发试验平台的使用;(2)优先考虑比较型试验平台以加速AI研究,验证型试验平台不是NAIRR的重点;(3)确保所有AI比较型试验平台(包括现实世界测试、竞赛和现场实验室)都被编目,并促进其广泛使用。

5. 用户界面

工作组发现:(1)NAIRR可以通过支持数据使用最佳实践,推动更广泛的研究社区走向以数据为中心的网络基础设施生态系统;(2)用户门户的设计和功能必须满足广泛利益相关者的需求;(3)一些社区的共享空间和协作工具有助于促进研究和教育方面的合作。

工作组建议:NAIRR:(1)必须提供安全和方便用户访问的综合服务、资源、数据和培训材料;(2)应该利用最先进的用户门户设计方法,以满足多元用户需求;(3)应该尽可能采用相关标准,包括事实标准以及最佳的开源解决方案,以确保一个充满活力的、不断增长的AI生态系统;(4)应该将适合不同技能水平和不同社区特性的技术支持和培训材料整合到用户门户中。

6. 教育和服务

工作组发现(1)需要对不同技能水平的用户进行培训,随着NAIRR中新资源的增加,培训主题需有扩展空间;(2)资源提供商已经创建了培训内容和教程;(3)获得特定学科的技术专业知识和先进的软件开发和IT操作等方面的支持将是一个挑战。

工作组建议NAIRR应该:(1)促进相关教育和培训材料的识别、整理和编目,以适合不同技能水平用户;(2)促进相关的教育活动,而不是开发新的教学内容;(3)NAIRR管理实体应提供若干级别的用户支持,包括服务台和解决方案咨询,并激励社区层面支持。

(二)系统安全和用户访问控制

工作组发现:(1)公共和私营部门在网络基础设施的安全程序和政策方面的广泛工作可以被用于新系统建设;(2)不断变化的安全形势需要持续更新专家队伍;(3)网络基础设施安全风险既包括人为风险也包括技术风险。

工作组建议:NAIRR应该:(1)在为期两年的过渡期内使用美国联邦风险和授权管理计划(FedRAMP)标准,同时制定符合适用法律和法规的NAIRR专门批准程序;(2)使用零信任架构以及“五安全”框架保障系统安全;(3)NAIRR管理实体应对机密和敏感数据进行分级访问控制,以适应不同的安全需求;(4)为工作人员和用户提供定期和持续的实践培训;(5)将定期的系统监测和更新以及相关的安全控制列为NAIRR管理、治理和行政活动的一部分;(6)为了适应不断变化的需求,设置专门的技术安保专员,他们由NAIRR管理实体直接聘用,能够跟上不断变化的要求并可获得足够的报酬。

(三)隐私、公民权利和公民自由

工作组发现:(1)为确保隐私、公民权利和公民自由得到适当的考虑和保护,不同利益相关者的参与至关重要;(2)目前用于AI研发的资源和工具,在设计时往往没有考虑到隐私、公民权利和公民自由;(3)为了保障隐私、公民权利和公民自由,AI研究人员需要接受培训,以识别潜在的挑战和问题;(4)为了有效地识别、监测和解决可能挑战隐私、公民权利或公民自由的问题,必须将监督流程纳入AI研发项目的管理和运行中。

工作组建议:NAIRR应该:(1)加强透明度、多样性用户、监督等;(2)建立一个伦理审查程序,以审查系统中的所有资源和相关研究;(3)用户应该在获准访问NAIRR前完成培训,而且这种培训应该每年更新;(4)专门支持AI可信度研究,并应制定缺陷模型和信息治理的最佳实践。

尊重知识产权,引用转载请注明来源。

使用许可:CC BY

声明:本文来自战略科技前沿,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。