这是一篇发表在Open Reseach Eueope上的文章,讨论了敏感数据的共享问题,作者jacknash。本公众号对该篇文章进行了转载编译。
在不同研究中, 敏感数据有多种形式,包括但不限于:
通常出现在健康和社会科学研究中的人类数据
知识产权,如新发明
国家安全数据,例如来自政府机构的机密信息
第三方数据,例如专有商业信息
其中,人类数据是敏感数据主要类型之一,其中一些数据类型,特别是当多个数据组合使用时,可以识别出个人,导致个人信息泄露风险增加。因此,妥善处理人类数据至关重要。人类数据可能包括:
与态度、观点或经历相关的图像、视频、音频文件或定性数据
临床试验结果
来自社交媒体网站的数据集
个人身份信息,例如年龄、种族、位置和性取向
敏感的健康状况信息,例如酒精依赖
敏感数据只有在采取足够的保护措施时才能公开共享。本文详细列出了安全地开放共享敏感数据的方法步骤,科研人员可以依据步骤进行操作。
一共有7个步骤,具体包括:
1、 创建数据管理计划(Data Management Plan, DMP)
目前,很多项目资助前都要求提交数据管理计划(DMP)。同时,DMP也是确保安全共享敏感数据的最佳方法之一,帮助研究人员在研究开始之前就确定整个项目中可能收集、创建或重用的数据类型。创建数据管理计划将有助于告知您如何进行研究,以及如何在项目的每个步骤中处理数据。为了安全共享敏感数据,数据管理计划应包括以下内容:
确定哪些类型的数据可能是敏感的
确定哪些数据可以共享,哪些数据在任何时候都不能共享
为任何敏感数据提供足够的时间来实施替代数据共享措施
允许您在敏感数据发布之前获得机构、伦理委员会或资助者的指导。
在 DMP 中考虑人类和非人类数据非常重要,包括可能重复使用或开发的任何商业或第三方数据。一般项目资助方都会提供DMP的说明或模板,依据说明或模板创建DMP即可。
2、遵守法律要求(Identify legal data requirements)
了解与你的研究相关的所有适用法律要求,这包括数据保护和隐私法规,各地区法规政策各有不同,例如欧洲的通用数据保护条例(GDPR)。
根据联合国的统计数据,截至目前,全球有着137个国家/地区制定了数据保护政策或法律。
3、尊重数据伦理数据(Identify ethical data requirements)
在数据共享过程中,尤其是涉及敏感数据时,必须考虑伦理问题,确保尊重个人的权利和尊严。
在欧洲开放研究中心(Open Research Europe)发表的所有文章,都必须按照欧洲地平线自主协议范本中第14条( in Article 14 of the Model Grant Agreement of Horizon Europe)的道德和诚信要求进行。
同时,提交的文章还必须遵守欧洲和国家法律,如《欧盟基本权利宪章》( EU Charter of Fundamental Rights)和《欧洲保护人权与基本自由公约》(the European Convention for the Protection of Human Rights and Fundamental Freedom)
4、取得利益相关者同意(Gain consents)
在数据收集或使用阶段,确保从参与者那里获得适当的同意,这可能与数据的使用者、参与者或第三方有关。因此,清楚地传达你打算如何共享数据、数据共享的方式、授予的访问级别及其限制。
这些同意,需要被清楚地记录在DMP中。最好留下文字档案。一旦获得对方同意,研究者需要确保在利用过程中按照双方已同意的确切方式共享数据。
5、匿名化数据(Anonymize human data )
为了保证数据的机密性,在公开共享数据时可采用匿名化的方法。
但匿名化并不能替代同意,研究必须使用已经获得对方知情同意共享的数据。
具体可以对直接标识符(如全名、出生日期、地址)和间接标识符(种族、性别、性取向、出生地等)进行匿名化处理。
关键数据匿名化技术包括:
删除任何与研究无关的变量
模糊部分信息点,如城市
使用别名,代替研究参与者的真实姓名
将年龄等特定信息,以区间的方式呈现
6、控制数据访问(Control access to data)
使用受控访问数据存储库来安全地共享无法完全匿名化或公开共享的数据。
这些存储库不会公开发布数据,而是允许在满足特定条件后访问数据。
数据不公开,但可以公开元数据记录。如欧洲开放研究的数据可用性声明(Data Availability Statement on Open Research Europe )中描述了数据的位置和访问数据的条件。
7、发布与数据相关的信息(Publish data-related information)
如果数据不能公开共享,可以发布一些与数据相关的信息,如研究方法、元数据、数据可用性声明等,以帮助其他研究人员重现研究。
方法部分,详细阐述如何创建研究和后续数据
元数据,例如数据可用性声明,提供最终数据的特征描述、评估方法、数据共享免责声明
任何可以共享、使用的中间数据
来自第三方来源的数据及其详细信息
新闻内容来自以下网站,不代表GoOA头条立场:
https://open-research-europe.ec.europa.eu/blog/seven-steps-for-sharing-sensitive-data-safely