这次开发出的数据保护工具,可确保关键数据集中的敏感个人信息通过严密检查后再公开共享,比如用于跟踪COVID-19疫情蔓延的数据集。
澳大利亚国家科学机构(CSIRO)下辖Data61专家小组、新南威尔士州政府、澳大利亚计算机协会(ACS)等多家机构合作开发了一款隐私保障工具,被命名为个人信息因素(Personal Information Factor,简称PIF),可评估任意数据集内的个人数据风险,建立起有针对性的高效保护机制。
传统上,这类评估往往由领先的数据与隐私专家进行。如今,专家们可以使用计算机模型快速验证数据敏感性评估结果。
自2020年以来,澳大利亚国家科学机构一直与本国网络安全合作研究中心(CSCRC)合作探索增强这款工具的方法。
01 使用复杂的数据分析算法
PIF工具使用了一种复杂的数据分析算法,对数据集敏感信息的还原风险(已脱敏的个人信息是否还能与实际所有者重新匹配起来)做出评估。
自2020年3月以来,新南威尔士州政府一直使用这款工具的早期版本对州内的COVID-19疫情传播数据集进行跟踪,旨在保证数据内容公开发布前得到适当保护。
新南威尔士州政府首席数据科学家Ian Oppermann博士表示,“目前,PIF工具的作用可以说是独一无二。它经历了长期的合作与发展,源自各州、联邦政府以及行业从业者们的不懈努力。”
“每一天,它都在帮助我们对新南威尔士州民众的匿名COVID-19感染数据集进行安全性与隐私风险评估。在它的帮助下,我们能够在公开发布数据内容之前,将敏感信息还原风险降至最低水平。”
Oppermann博士还提到,COVID-19进一步增强了公众对于数据隐私需求的认识。
Oppermann博士指出,“考虑到社区对于不断增长的COVID-19病例的强烈关注,我们需要在细粒度层级上及时发布关键信息,详细介绍何时、何处确认了新的COVID-19病例。这项工作要求我们在疫情流行初期推理出可能的感染原因,并确认感染者的年龄范围。”
“我们希望相关数据尽可能详尽精准,同时切实保护与这些数据集相关的个人隐私与身份信息。”
02 数据去身份化方法可进一步提高隐私水平
澳大利亚国家科学机构Data61项目首席研究员兼高级研究科学家Sushmita Ruj博士表示,新的数据去身份化方法有望进一步提高隐私水平,并保证个人私密数据得到严格保护。
Ruj博士提到,“在研究了多种隐私指标之后,研究小组决定采取一种统一的衡量方法,用于评估对特定数据成功进行身份还原的风险水平。”
“PIF一直在探索新的方法,考虑如何消除各类能够实现身份还原的攻击方法,并据此对不同数据集采用量身定制的保护手段。以此为基础,该工具将为各个数据集做出一项PIF评分。”
如果PIF高于所需的阈值,则程序将提出如何提高框架安全水平、证明数据集可以安全公开发布的相关建议。
澳大利亚网络安全合作研究中心研究主任Helge Janicke教授表示,最重要的目标是在信息共享需求与保护隐私之间找到平衡点。Janicke教授提到,“在PIF的帮助下,各方可以充分了解风险水平,这无疑补充了相关工具领域的空白。”
“数据分析已经成为一项广为人知的技术方案,但我们以往很难把握共享输出结果的具体质量。正因为如此,PIF在根据指标评估关键数据共享行为的道德保障与负责任水平方面,发挥着极为重要的作用。借助这项技术,数据所有者可以全面评估与数据共享相关的风险与后续影响。”
PIF工具还可用于检查其他有待发布的数据集,比如在COVID-19社交隔离期间收集到的家庭暴力数据与公共交通工具使用数据。CSIRO Data61与CSCRC将继续开发PIF工具,并规划在2022年6月之前进入外部推广阶段。
声明:本文来自互联网安全内参,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。