文章快速检索     高级检索
  科学与社会  2025, Vol. 15 Issue (4): 129-147  
0

引用本文 

冯君妍, 韩东屏. 数字时代人体生物样本库的信息隐私风险及其应对[J]. 科学与社会, 2025, 15(4): 129-147.
FENG Jun-yan, HAN Dong-ping. Information Privacy Risks and Countermeasures of Human Biobanks in the Digital Age[J]. Science and Society, 2025, 15(4): 129-147. DOI: 10.19524/j.cnki.10-1009/g3.2025.04.129.

作者简介

冯君妍,上海大学马克思主义学院马克思主义中国化时代研究中心研究员。研究方向为生命伦理学、马克思主义中国化;
韩东屏,华中科技大学哲学学院教授、博士生导师。研究方向为文化哲学、政治哲学、生命伦理学等

项目资助

国家社会科学基金青年项目“人体生物样本库的伦理挑战及治理对策研究”(23CZX046)。

数字时代人体生物样本库的信息隐私风险及其应对
冯君妍1, 韩东屏2     
1. 上海大学马克思主义学院;
2. 华中科技大学哲学学院
摘要: 人体生物样本库保藏着海量与个人健康紧密关联的敏感数据信息,本应纳入高度保护范畴,但其信息隐私泄露的潜在风险却随数字化进程持续加剧。数字时代背景下,如何在充分释放人体生物样本库巨大潜能的同时,有效规避信息隐私泄露的伦理风险,实现科学发展与权利保障的统筹兼顾,已成为亟待深入探讨的重要研究议题。本文在界定人体生物样本库信息隐私概念的基础上,深度剖析了数字时代该领域信息隐私风险的具体表现,探寻了信息隐私泄露的多重因素。研究表明,通过完善法律规范、技术防护、公众参与等多元举措协同发力,可有效防范人体生物样本库的信息隐私风险。
关键词: 数字时代    人体生物样本库    数据    信息隐私    伦理风险    
中图分类号: R-05           文献标识码: A
DOI: 10.19524/j.cnki.10-1009/g3.2025.04.129

作为生命科学研究的战略性资源,人体生物样本库日渐成为支撑其创新发展的关键基础设施。在数字化背景下,医疗机构、科研院所与生物医药企业等竞相构建、整合人体生物样本与数据资源,并通过高通量测序技术将人体生物样本与敏感遗传数据深度关联。与此同时,研究者对人体生物样本和数据的采集、整合及多维挖掘能力显著提升,这类兼具生物性与信息性的特殊资源,已逐渐作为优质生产要素,显现出巨大的社会经济价值,成为新质生产力的重要组成部分[1]。然而,当涉及生命本质的遗传信息被持续整合或二次利用时,人体生物样本库将面临知情同意模糊与范围扩张[2]、数据泄露与再识别、基因歧视与社会排斥、社会信任与公平性缺失等伦理挑战。尤其当样本和数据脱离个体控制范畴,而现有保护机制难以应对其特殊敏感性时,公众对其信息隐私泄露的焦虑与日俱增。在此背景下,如何在释放人体生物样本库巨大潜能的同时,既有效规避信息隐私泄露的伦理风险,又能构建兼顾其科学发展与权利保障的治理框架,已成为核心伦理议题之一,也亟待学界从理论层面予以回应。

一、人体生物样本库信息隐私释义

信息隐私并不是一个新兴概念。国外探讨信息隐私的最早文献,应属1890年塞缪尔·沃伦(Samuel D. Warren)和路易斯·布兰代斯(Louis D. Brandeis)两位学者在《哈佛商业评论》上联合发表的《隐私权》一文[3]。《斯坦福哲学百科全书》从规范意义上界定了信息隐私的内涵,指出信息隐私通常是指个人对关于自己的信息、他人可能获取关于自己信息的情况以及可用于生成、处理或传播关于自己信息的技术拥有直接或间接控制权的一种非绝对的道德权利[4]。贝亚特·罗斯勒(Beate Rossler)则在《隐私的价值》一书中,依据不同的隐私关切,将隐私分为“信息隐私”“空间隐私”“决定隐私”三类。其中,贝亚特·罗斯勒关于“信息隐私”的界定,更倾向于“隐私控制理论”[5],即个人信息被谁获取以及通过何种方式、何种渠道获取[6]。与此相关,荷兰蒂尔堡大学法学院伯特-贾普·库普思(Bert-Jaap Koops)等学者在《隐私类型学》一文中,通过构建模型将隐私细分为九大类型,指出信息隐私就是与其他八种隐私相重叠但不重合的一类,而且是九大类型中最为重要的一种[7]。他们将信息隐私概念化,将其作为每一种基本类型的首要方面,典型表现为防止关于自己的信息被收集或被控制。他们认为尽管信息隐私经常被归为单独类型的隐私,并因此与其他类型的隐私处于同一水平,但应该被代表为一个总体方面[7]。格雷姆·劳里(Graeme Laurie)教授则基于“隐私独立理论”[5],从空间与信息双维度赋予了隐私全新内涵。在《基因隐私:对医学——法律规范的挑战》一文中,他将信息隐私定义为个人信息不被他人接触的状态[8]。空间隐私则作为非信息隐私的重要构成,是隐私在空间维度的具象化呈现,与信息隐私共同构筑起隐私的多元面向。他认为空间隐私强调个人对其物理空间或虚拟空间的支配权,其核心是“不受非法侵入”,例如未经允许而进入他人住宅或非法监控私人空间,均属侵犯空间隐私[8]。国内学界对数字时代信息隐私的研究已初步形成多维度的理论图景。《中华人民共和国民法典》第一千零三十二条指出,“隐私是自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动、私密信息”[9]。与此相关,有学者认为,传统隐私观聚焦于“不愿为人所知的秘密”,而大数据与人工智能的深度应用则催生出“推断性信息”这一新维度,即通过算法模型对离散数据的整合分析,可衍生出个体既未主动披露也不愿公开的潜在隐私[10]。这一提法,不仅反映了公民权利意识觉醒后对隐私保护的更高诉求,更揭示了技术创新与隐私权保障之间日益凸显的结构性矛盾[11]。而法学界则敏锐察觉到法律体系在应对新型隐私侵权时存在的滞后性[12]。此外,也有学者认为随着数字技术重塑社会生态,物理空间与数字空间的边界逐渐消融,个人隐私与信息载体呈现双向渗透的特征,即隐私要素全面数据化,任何数据在特定算法解析下都可能转化为隐私风险源[13]

通过对上述理论与研究的梳理,我们不难发现,当前学界对信息隐私的界定在不同视角与理论框架下呈现显著差异,且尚未形成共识。这些多元化的解读虽然丰富了信息隐私的内涵,但却使之在具体实践中缺乏统一标准,尤其在生命科学研究领域中更显突出。在人体生物样本库这一具体研究场景中,信息隐私的范畴需被进一步明确和细化。本文所研究的信息隐私主要从伦理学研究视角出发,主要关乎人体生物样本和数据捐献者的信息。这不仅包含捐献者的姓名、性别、年龄、联系方式、家庭住址等可查询到的浅表性信息,更涵盖了通过基因测序等技术手段获得的遗传数据等深层次的、敏感性的基因信息。这些基因信息承载着个体独特的生理特征、疾病易感性甚至所在族群的遗传信息,其特殊性和敏感性程度远超个人基本信息,直接关乎个人自主性与尊严。因此,在人体生物样本库的研究和发展过程中,保护信息隐私安全、有效规避其泄露风险,既是对人体生物样本和数据捐献者的合法权益的基本保障,也是推动生命科学研究健康有序发展的重要前提。

二、数字时代人体生物样本库的信息隐私风险

在数字技术尚未普及的时代,人体生物样本库相关信息多以纸质记录为主,存储分散且共享有限。此时,人体生物样本和数据信息泄露的影响范围相对较小,更易追溯,且这类信息与个人身份的关联较弱,其泄露对个体或所在族群产生的风险较低。而随着数字技术的飞速发展,人体生物样本库的信息隐私面临重大挑战。以人工智能为代表的智能技术不仅使得信息隐私的空间更易侵入、获取,还使之受到重大冲击[14]。尤其当这类信息被转化为电子数据后,人们通过网络技术可快速将其跨地域共享,相关数据的“可复制性”“可传输性”也随之显著增强。这种由技术所引发的风险不仅带有极强的隐蔽性,而且超出了人类通过自然感官所感知的范围,是一种不可视的存在[15]。这类信息隐私一旦泄露,可能会引发大规模扩散,且溯源难度极大,最终将直接威胁个人、所在族群的利益,甚至影响到国家和民族的安全。人体生物样本库关涉人们敏感信息,本应得到更高程度保护,但其信息隐私泄露的潜在风险却随数字化进程日益凸显。具体说来,这些潜在的伦理风险主要体现在以下几个方面。

第一,知情同意的模糊性与范围扩张风险。在人体生物样本库的研究实践中,样本库通常采用广同意模式。这种模式允许人体生物样本及数据在未来多项研究中被使用,而无需对每项具体研究进行详细告知。然而,这种模式存在明显缺陷。一方面,捐献者可能无法充分理解样本和数据的未来使用范围,导致知情同意流于形式,难以真正体现其自主权;另一方面,在广同意模式下,样本和数据信息的使用范围可能被过度扩大,进而超出捐献者初始的同意范畴,甚至涉及商业开发等敏感领域,直接危害捐献者的自主权利。以英国生物样本库(UK biobank)为例,作为全球生物医学发展的重要资源和促进公共卫生研究的核心平台,该库保存了约50万个年龄在40—69岁人群的样本和数据信息[16],这些信息可供获得批准的机构及研究人员使用,旨在通过推动医学研究改善公众健康。然而,该库在样本和数据获取之初主要采用广同意模式,这一模式在实际应用中引发了诸多争议。有研究者指出,英国生物样本库的同意文件及参与者信息存在明显缺失,尤其同意书将“健康研究”限定为疾病与治疗领域,在一定程度上掩盖了参与者的数据的全部潜在用途[17]。更值得关注的是,该样本库现已获批的数据用途不仅涵盖保险公司,还包括直接面向消费者的基因检测公司,这显然超出了其宣称的目标范围。而当这些数据被用于预测“智力”、胚胎筛选等商业性服务时,更可能对公众利益造成多重不良后果[17]。作为人体生物样本库的典型代表,英国生物样本库的广同意模式表明,信息隐私泄露与知情同意的模糊化、扩张化存在内在关联。广同意的模糊性为信息隐私泄露提供了空间,而信息隐私的泄露反过来又会加剧知情同意的模糊化和同意范围的扩张,最终消解了参与者对自身生物信息的自主权,这正是人体生物样本库在伦理治理中需要警惕的核心风险。

第二,数据泄露与再识别风险。在数字化浪潮席卷的当下,样本和数据捐献者于无形之中被暴露于数据泄露与再识别风险之中。人体生物样本库存储着海量与个人健康息息相关的生物样本及数据信息,而其中每一份信息,都如同携带着个人基因奥秘的敏感档案。尽管样本库普遍采取去标识、匿名化等手段,但技术的迭代与发展逐渐打破这些安全屏障。以“全基因组关联研究”(Genome-Wide Association Studies,GWAS)技术为例,即便人体生物样本和数据信息已经过匿名化处理,相关人员仍有可能凭借先进算法与大数据分析,精准追溯甚至识别出样本和数据信息背后的个体身份。这对样本和数据的捐献者而言,无疑是一种潜在的风险。与此同时,人体生物样本和数据信息的相关接触者,无论是科研人员还是第三方机构,都可能因伦理底线的失守或利益的诱导,成为信息隐私防线的“溃堤口”。曾一度风靡全球的基因检测公司23andMe可谓典型案例[18]。作为国际上较早向普通消费者提供基因检测服务的企业,23andMe凭借帮助用户追溯家族历史、解析基因特征、评估潜在健康风险等个性化服务,迅速积累了庞大的用户群体并获得丰厚经济回报。然而,这家“行业标杆”却在2023年遭遇了一场由网络犯罪分子Golem策划的重大数据泄露事件。起初,约有1.4万个用户的账户被非法入侵。然而,由于23andMe平台内“DNA 关系查找与家族树”等服务具有深度挖掘功能[19],导致此次泄露的规模呈指数级扩大,最终有将近690万用户的隐私信息被泄露。其泄露内容不仅包含姓名、性别,更涉及出生日期、居住地、个人照片、详细住址等信息,甚至涵盖DNA数据、亲缘信息等高度敏感的隐私内容[20]。此次事件发生后,23andMe的用户数量急剧下滑,公众对其基因隐私保护能力的质疑逐渐高涨。用户普遍担忧个人疾病易感倾向、种族特征等核心基因信息被泄露、二次识别,甚至被滥用或非法贩卖。这场数据泄露事件引人深思,黑客入侵仅是信息隐私泄露的途径之一,现实中导致数据泄露的因素往往更为复杂多元。回到人体生物样本库的应用和发展之中,一旦样本库的信息防护体系出现漏洞,捐献者及其所在族群的敏感信息可能会如决堤之水被暴露在未知风险中。这不仅会威胁每一位捐献者及其所在族群的生活秩序,更可能对他们的未来造成难以预估的潜在伤害。

第三,基因歧视与社会排斥风险。根据《通用数据保护条例》的界定,“基因数据是与自然人的遗传或基因特征相关的个人数据,这些特征源于对该自然人的生物样本的分析,能提供关乎其生理或健康状况的独特信息”[21]。人体生物样本库中存储的海量基因数据,犹如记录生命密码的“敏感档案”,兼具生命预测性、身份辨识性和永久保持性,构成个体最核心且绝对的隐私[22]。而其中每一段基因信息都像一个“隐形开关”,潜藏着影响个体命运的巨大能量。随着基因组学技术的飞速发展,这些承载生命密码的数据正面临前所未有的暴露风险。一旦基因数据被泄露或被不当利用,基因歧视与社会排斥便可能如影随形。职场与保险领域首当其冲:雇主可能借遗传信息实施“基因筛选”,剥夺特定基因携带者的公平就业机会;保险公司则可能将遗传疾病作为抬高保费甚至拒保的依据,冲击个体的社会保障权益。王雨事件以及“中国基因歧视第一案”,便是职场中典型的基因歧视案例。2023年,王雨在厦门市思明区中小学教师招聘中笔试、面试的成绩优异,却因其携带地中海贫血基因,被思明区教育局以“血液系统疾病,不合格”为由拒录[23]。而早在2010年的“中国基因歧视第一案”中,三名广东考生同样因携带地中海贫血基因被公务员岗位拒之门外[24]。这两个案例如出一辙,背后均反映出基因歧视的困境,虽然医学上这类携带者多无明显症状,且几乎完全能正常工作生活,其遭遇却凸显了基因信息被滥用对平等权的侵害。此外,由此引发的社会排斥的阴霾同样不容忽视。基因歧视不仅影响个体的职业机遇,更会对其造成心理、经济与社会层面的多重困境。例如,罕见病或遗传性疾病患者及其家属,常因社会对遗传疾病的误解与恐惧遭受无端排斥,这种歧视既带来心理创伤,又切断了他们与社会进行正常交往的纽带,使其陷入孤立。在基因检测等数字技术日益普及的今天,人体生物样本库的信息隐私保护早已超越初始的隐私范畴。当捐献者的基因数据被层层深挖,其影响将直接扩散至职业发展、保险准入、教育机会等诸多领域。那些携带特定基因标记的个体可能遭遇社会排斥,看似客观的基因信息成为无形的“标签”,既侵蚀着个体尊严,又影响社会的公平公正。可以说,基因歧视的阴影也许从未真正消散,它正以更隐蔽且更深刻的方式潜伏在社会肌理之中。如何在样本库中筑牢基因信息的安全防线,杜绝基因歧视与社会排斥,成为现代社会必须直面的挑战。

第四,社会信任与公平性缺失风险。在大数据与人工智能的技术浪潮下,人体生物样本和数据经由数字化处理,转化为抽象的代码或符号,构成样本捐献者的“数字身份”[25]。尤其“数字身份”作为数据化的特殊信息集合[26],它在为经济社会发展提供正向价值的同时,也可能存在样本或数据捐献者的身份易追溯、身份信息泄露、身份被盗用、甚至造成技术与人的自由发展相悖逆等伦理风险[27]。这些“数字身份”看似客观中立,实则暗藏个体自主权丧失的风险。此外,社会信任也与“知情同意”“公共利益”等承诺的实现密不可分。然而,在实际应用中,可能出现缺失知情同意、偏离公共利益初心、削弱社会信任、影响社会公平的不当行为。比如,一些机构可能过度采集弱势群体的生物资源,却未能保障其公平享受研究成果,这不仅是对“公正”与“受益”伦理原则的公然违背,更消磨了公众对生命科学研究的信任根基。再如,部分研究机构或在未获官方许可,或在绕过样本与数据捐献者的充分知情同意的前提下,对样本和数据信息的流向刻意隐瞒,这种行为同样会削弱公众对研究机构乃至社会的信任。早在2015年,两则来自中国科技部官网的行政处罚公告,将深圳华大基因科技服务有限公司、复旦大学附属华山医院等业内颇具影响力的生命科学研究机构推至舆论风口。公告清晰指出,这些机构在未获官方许可的情况下,擅自与英国牛津大学开展国际合作研究,将部分人类遗传资源信息通过网络渠道违规传递出境[28-29]。在收到行政处罚后,深圳华大基因科技服务有限公司等机构虽然立即停止了相关研究工作,并销毁该研究工作中所有未出境的遗传资源材料及相关研究数据,并推进了整改工作[27-28]。但此类数据信息的不合规使用乃至潜在泄露风险,已向公众敲响警钟,当涉及人类遗传资源的敏感信息被非法使用或者流动时,个体隐私、族群权益乃至国家生物安全都将面临威胁。人体生物样本库作为人类遗传资源的重要保藏平台,不仅储存着个体隐私数据信息,更承载着族群的核心生物特征信息,其安全防护本应是生命科学研究的底线。然而,此次事件中暴露的管理漏洞与合规缺失,让人们对相关机构的专业操守与责任意识产生了深刻质疑,也使得被视为“医学进步基石”的人体生物样本库的公信力大为减弱。

三、数字时代人体生物样本库信息隐私泄露成因分析

上述分析表明,大数据与人工智能技术的深度应用,使得人体生物样本库中存储的捐献者的基因数据、临床信息及行为特征等多维敏感信息,被持续进行关联、挖掘与二次利用。这些被深度开发的数据,在促进科学发现的同时,也将导致个体信息隐私边界被系统性突破。更值得关注的是,由此引发的信息隐私泄露风险可能会超越传统范畴,呈现出复杂的伦理维度:无论是知情同意模糊与范围扩张风险,还是可能造成的数据泄露与再识别、基因歧视与社会排斥风险,抑或是社会信任与公平性缺失风险,均可能会对现有伦理框架构成严峻挑战。为系统应对多维化危机,亟需从技术、主体与社会三大层面[30],解构信息隐私泄露风险的生成逻辑,进而构建出具体的治理路径。

1. 技术层面的因素

在数字化浪潮中,大数据与智能技术正深刻地重塑着我们的生产与生活方式。大数据与智能技术的应用,深度依赖于数据的挖掘与共享机制,然而,这一过程本身也成为信息隐私风险滋生的关键环节。人体生物样本库通过提供大量人体生物材料和相关数据,使高通量科学分析成为可能,使得生命科学研究和生物医学研究等能够顺利开展。通过挖掘大量不同人群、不同类型的人体生物样本和数据,既可以帮助研究者探索疾病发生和发展的过程,又可助其了解基因与环境之间的复杂关系。然而,人工智能及其处理数据的能力以多种形式破坏了信息隐私[31],即在一定程度上引发了人体生物样本库信息隐私风险的产生。例如,数字技术的发展,不仅使得人们的空间隐私受到挑战[32],还改变了信息传播的架构,增加了信息隐私泄露的渠道与节点[33]。首先,数据会在个人掌握之外,不断被收集和存储,而我们每个人留下的数字“痕迹”极具多样性,这就使得我们对每一条信息的控制变得更加困难[34]。通过大数据和人工智能技术,研究者可以对个人的生物样本或数据进行分析和挖掘,从中提取出具有个人身份或者基因特征的敏感信息,而通过基因测序技术则可以进一步挖掘人们的遗传特质和潜在的疾病风险,从而导致个人敏感信息的泄露。其次,大数据技术可以将不同来源的人体生物样本或数据信息进行关联和匹配,从而产生更丰富的信息。当样本库的信息与其他数据相关联时,就有可能导致更加特殊和敏感的基因信息被揭露出来。再者,人体生物样本库的样本和数据信息可能被存储在数字化平台或云端系统中,这也在一定程度上增加了个人健康数据被黑客攻击或未经授权访问的风险。换句话说,将大量包括医学和遗传信息在内的敏感数据汇集到电子数据库中,让更多的人群都能访问,这也会损害个人的信息隐私安全。如果相关安全措施不足或不当,则可能导致个人甚至所在族群的隐私数据被泄露、篡改甚至滥用。最后,大数据和人工智能技术的内部运行机制非常复杂,要实现对人体生物样本库的充分利用,可能需要对海量的样本或数据信息进行搜集、整合、分析、挖掘。但是,捐献者往往无法决定自己的生物样本和数据信息未来具体会被用作何种用途,也无法预料其具体使用方式和后续影响。因而,这在一定程度上,也为人体生物样本库信息隐私的泄露提供了可趁之机。

2. 主体层面的因素

人体生物样本库各主体层面的因素,也是信息隐私泄露风险发生的重要原因。

(1)捐献者层面。这里的捐献者主要是指人体生物样本和数据信息的原初捐献者。在数字时代,我们首先要保护的也是这类捐献者的信息隐私。然而由于捐献者对于样本和数据价值认知的缺乏和自身隐私观念的薄弱,也在一定程度上造成了信息隐私泄露风险的发生。一方面,捐献者可能缺乏相关的专业知识和认知能力。他们之所以愿意捐献自己的样本和数据,大多是因为一些生物样本和数据在他们的认知中无法产生价值。在这种认知前提下,他们同意将其捐赠给医院或者研究机构,期待能为医学研究提供一些帮助。但事实上,他们对样本和数据本身所包含的信息量以及研究背后可能侵犯个人隐私的问题并无深入了解。另一方面,人们对于个人信息隐私泄露的划分与接受底线正在向前推移,即个人隐私观日趋开放,隐私观念在数字时代中逐渐淡化。例如,个人对信息隐私的保护意识不足,使用弱密码、经常在社交平台大量分享个人信息或未经谨慎考虑的行为,都可能导致信息泄露。通俗来说,越来越多的人喜欢利用微博、微信、抖音等网络平台分享自己的生活、学习和工作环境,同时也存在越来越多的用户浏览或搜集网络信息。这种开放性在一定程度上加深了人们对于数据共享的认同,但同时也为信息隐私的泄露提供了土壤[35]

(2)管理者层面。在数字时代,人体生物样本库的重大科研价值、经济价值逐渐被挖掘出来,越来越多的医院、科研院所、企业等都建立起了自己的人体生物样本库。作为人体生物样本和数据的储存平台,其管理者应承担起首要的保管职责。这就意味着,管理者应对人体生物样本库的信息隐私安全负责。然而,我国人体生物样本库在建设和发展过程中,不同平台设立的样本库存在质量参差不齐、管理标准不一等问题,也存在因管理者使用不当、疏忽大意或缺乏安全意识而产生信息隐私泄露等问题[36]。随着人们现实观念的变化,隐私意识逐渐在实践环节中被冲淡,隐私问题也接踵而来。比如,在人体生物样本库的内部管理中,有些工作人员可能存在对捐献者的信息隐私保护不强,不重视信息安全,缺乏相关训练等问题,或者容易在工作中产生一些疏漏或错误操作,例如随意复制、传递或存储数据、未正确采取数据安全保护措施等,从而导致信息隐私泄露的风险增加。又比如说,有些工作人员可能不恰当地使用人体生物样本库中的数据,如将之泄漏给第三方机构,私自出售或使用数据进行非法活动等。这些行为都在一定程度上加剧了信息隐私泄露的发生率,值得我们警惕。

(3)使用者层面。一般而言,人体生物样本和数据的使用者主要包括研究人员、医疗机构、生物技术公司等。这些使用者由于责任意识的淡漠,在对人体生物样本和数据进行研究或开发利用的过程中,也存在泄露捐献者信息隐私的可能。特别是进入数字时代,无论研究还是开发,都离不开样本或数据的共享,而样本或数据的共享不当则可能给捐献者带来信息隐私泄露的风险。人体生物样本库所收集的基因数据、生理指标等敏感信息,在与其他机构或个人共享时,存在信息隐私泄露的风险。特别是在数据传输、存储和处理过程中,若数据安全保护措施不足,就极易被第三方非法获取。此外,部分使用者可能在未经个体同意的情况下,擅自使用或者泄露其生物样本或数据信息,这也可能导致个体的信息隐私受到侵犯。在科学技术迅速发展的今天,人体生物样本或数据的使用者可能难以精确控制和监管数据的使用范围及方式,从而容易引发数据滥用问题,进而加剧信息隐私泄露的可能性。

3. 社会层面的因素

在数字时代,数据的共享与挖掘是引发信息隐私泄露的直接因素。然而,无论是技术还是实践主体,都无法脱离社会背景而独立存在。因此,除了技术和主体层面的因素外,社会层面的因素同样是引发人体生物样本库信息隐私泄露风险的重要考量。

(1)人体生物样本库背后潜藏的巨大利益诱导不容忽视。作为收集、储存与管理样本及相关数据的重要资源库,它汇聚了血液、器官、头发、细胞、DNA等关乎人体的核心生物样本与信息。这些样本和数据在科研探索、临床诊断及药物研发等领域蕴含着广阔的应用前景,随之而来的利益驱动也愈发显著。首先,样本库为生命科学研究注入了强劲动力。研究人员借助样本库中的宝贵资源,能够更深入地探寻疾病的发生机制,研究新型治疗途径,并精准验证药物的有效性,这无疑为科学进步与医学发展提供了坚实的基础。其次,在临床诊断领域,样本库的作用同样至关重要。医生通过剖析患者的生物样本与数据信息,可实现疾病的精准诊断、病情进展的动态监测以及治疗效果的科学评估,同时依托样本库的数据支撑制定个性化治疗方案,让诊疗水平得到质的提升。此外,样本库在新药研发中更扮演着关键角色。例如,制药企业能利用库中的样本和数据开展药物筛选与疗效评估,大幅加快药物从研发到应用的进程。然而,即便样本库在生物医学研究、临床诊断和药物开发等领域绽放出巨大价值,但其背后的利益诱导也使得信息隐私泄露的风险不断攀升,成为当下亟需破解的伦理难题。

(2)伦理和法律监管不足。人体生物样本和数据关涉个人隐私等权益,其收集、保存和使用等应受到严格的伦理和法律监管。比如,样本和数据的采集和使用需要取得捐献者的知情同意,并保护捐献者隐私。然而,有些样本库存在未经充分知情同意的情况下,共享、挖掘了这类信息,从而导致捐献者的个人信息隐私受到侵犯。又比如,样本库的使用可能涉及敏感信息。而某些研究可能涉及个人的遗传信息,如基因组测序。如果这些基因被认定为具有较高的致病风险,那么相关个体在购买商业保险时可能会面临保险公司的歧视或拒保。此外,法律法规的不完善也是引发信息隐私泄露的重要因素。目前,我国在人体生物样本库管理方面缺乏专门的法律法规,现有相关法规和规定也不够完备,同时缺乏专门的执法机构对样本库进行监督和执法。例如,样本库中的样本和数据可能被用于商业用途、政治目的或其他不当用途。如果没有健全的法律监管框架,人体生物样本库中的样本或数据可能面临未经授权的存储、使用或转移,甚至可能被窃取或篡改,从而对个人的生命安全、身体健康,甚至对国家和民族的生物安全和健康构成威胁。

四、数字时代人体生物样本库信息隐私风险的应对策略 1. 完善法律监管,严格伦理审查

完善的法律与伦理规范是守护人体生物样本库的信息隐私安全以及规范行业发展的坚实基石。

(1)强化信息隐私保护的立法与监管。目前,我国已陆续出台《电信和互联网用户个人信息保护规定》(2013年)、《中华人民共和国个人信息保护法》(2021年)以及《人类遗传资源管理条例实施细则》(2023年)等规范,这些法律条款为个人数据信息的采集与使用提供了基础规制。然而,在人体生物样本库的建设中,保护捐献者的信息隐私不仅是法律义务,更是公共道德或者公共善的必然要求[37]。针对样本和数据信息的特殊敏感性,需构建全流程法治化保护框架。例如,在人体生物样本和数据的采集环节,可通过标准化文书明确样本和数据的存储期限、用途及标准,确保捐献者对样本和数据后续用途的知情权与选择权;在使用环节,设立人体生物样本库监管机构,由跨学科委员会制定隐私泄露负面清单,对样本和基因数据研究进行严格评估,防范基因歧视等衍生风险;在共享环节,采用先进技术对样本和数据共享的全过程进行适当监管。在此基础上,进一步明确人体生物样本和数据泄露、滥用的惩处办法,在充分发挥其多方效能的基础上,有效防范信息隐私泄露等数据安全问题[38]

(2)严格人体生物样本库的伦理审查和监督体系。首先,设立伦理审查委员会等专业机构,对样本库从建设到运行的全过程进行严格的伦理审查和监督。其次,制定规范化的人体生物样本库伦理准则,为样本库构建规范化的知情同意书,杜绝模糊与广泛性表述。此外,还应建立动态化的知情同意更新机制,及时获取样本和数据捐献者的最新同意。最后,通过定期开展伦理审查,科学分析信息隐私泄露风险发生的概率与影响程度,动态优化风险防范策略,持续提升人体生物样本库的风险防范能力,为其稳健发展提供伦理屏障。

2. 加强样本库管理和技术创新

依托管理和技术的双重驱动作用,人体生物样本库才能不断获得生机与活力,生命科学研究也才能事半功倍[39]

(1)加强内部管理与工作人员的职业道德培养。人体生物样本库的管理人员掌握着大量涉及个人隐私的生物数据信息,其行为不仅关系到样本和数据捐献者的利益,还关系到公众对生物医学研究和社会的信任。因此,不仅应加强工作人员的内部管理与职业道德培养,还应督促其严格遵守法律和伦理规范。例如,在采集样本和数据时,内部工作人员应充分尊重捐献者意愿,做好知情同意与信息隐私保护;在样本和数据的使用过程中,应杜绝私自挪用、泄露、买卖等违规行为。只有将内部管理与工作人员的职业道德培养相结合,才能为人体生物样本库在科学、伦理的轨道上运行,推动生命科学研究朝着健康、可持续的方向发展创造良好条件。

(2)创新人体生物样本库的信息隐私防护技术。为应对潜在的信息隐私泄露风险,可引入“联邦学习”(Federated Learning,FL)、“差分隐私”(Differential Privacy,DP)、“安全多方计算”(Secure Multiparty Computation, SMPC)等国际前沿技术,对样本和数据信息进行严格处理。例如,利用联邦学习等技术模式,在传输样本和数据模型参数的同时,实现分散的数据训练[40]。此种方式之下,样本和数据信息的使用者无法获取原始信息,且人体生物样本库依然保留着对原始数据的控制权,这在一定程度上降低直接共享而产生的信息隐私泄露风险。又比如,可以采取与联邦学习紧密相关的信息模糊技术——差分隐私。主要通过添加噪声,“隐藏”特定的数据信息,同时仍然允许在群体层面进行学习[41]。这种方式既有利于提高样本和数据信息的利用率,又为其信息隐私保护的实现提供了创新型解决方案。此外,还可采用安全多方计算等方法,即安全支持计算、查询和数据匹配需求,使其在协同计算时不暴露原始信息[42]。这种让人体生物样本和数据信息“可被使用但不被暴露”的处理方法,也能在一定程度上为其信息隐私保护的实现提供技术保障。

3. 激发公众参与活力,明晰利益分配机制

积极的科普教育和畅通的公众参与,以及完善公平合理的利益分配机制,可以将公众由被动的捐献者转变为积极的参与者,从而在一定程度上降低人体生物样本库信息隐私泄露风险的发生率。

(1)搭建多维科普教育平台。人体生物样本库于研究者而言,并不是一个新兴事物,但对于大多数公众而言,则可能不熟悉、甚至完全陌生。为降低人体生物样本库信息隐私泄露风险的发生率,相关机构可以通过丰富多样的形式,向社会大众普及人体生物样本库的运行机制、研究意义和潜在的风险等知识。比如,利用现在公众比较容易接受的新媒体平台,推出系列科普视频;深入社区开展问卷调查、开展与人体生物样本库相关的科普讲座;制作与人体生物样本库相关的公益短片、动画等。通过简洁易懂的知识传递,帮助公众明晰人体生物样本和数据信息的独特价值,强化公众的信息隐私保护观念与风险防范意识,努力使样本和数据的捐献者既能成为生物医学研究的基础贡献者,也能使之成为保护自身信息隐私安全的“第一责任人”。

(2)畅通公众参与和监督通道。尼尔·曼森(Neil C. Manson)和奥诺拉·奥尼尔(Onora O’Neil)等学者曾提出“尊重隐私是一种信息义务,它在生物医学研究中意义重大”[43]。除了搭建多维科普教育平台,还可从公众参与等角度,保障和维护捐献者的信息隐私安全。一方面,建立全过程公众参与机制,在样本库建设规划、运营管理等关键环节,主动邀请公众代表参与研讨,广泛吸纳公众意见和智慧。另一方面,构建公开透明的监督通道,完善问题接收、处理与反馈等环节,鼓励公众对人体生物样本库的信息隐私安全问题等进行监督,以公开透明的处理方式加强公众信任,形成共责与共治的治理格局[44]

(3)完善公正合理的利益分配机制。构建科学的利益分享体系,在样本库研究的采集、成果转化与实现等环节,充分考量样本捐献者的基础性贡献。例如,在样本和数据的采集环节,通过专项政策,对捐献者给予健康体检、资金补贴等合理补偿;在研究成果转化和实现等环节,给予捐献者以适度倾斜,确保捐献者能获得公平性回报。此外,还可以根据样本和数据的研究成果与社会价值,进一步优化利益分享方案,让生命科学研究的红利能够真正惠及每一位参与者,让更多的公众能够积极主动参与到样本库的建设和发展之中,共同为人类健康福祉的实现贡献力量。

五、结 语

在生命科学与数字技术深度交融的时代浪潮中,人体生物样本库如同一座座“生命宝库”,正以一种前所未有的速度蓬勃崛起。这些承载着人类生命密码的宝库,不仅是解锁重大疾病奥秘、推动医学创新的关键钥匙,更在精准医疗、新药研发等领域展现出巨大的应用潜力。然而,人体生物样本库在凸显重大价值的同时,也衍生出信息隐私保护的伦理挑战。通过完善法律规范划定行为边界,借助前沿技术筑牢安全防线,提升公众意识强化自我保护等措施,建立起覆盖法律、伦理、管理、技术、公众参与等较为多元化的防护网络,既能有效防范信息隐私泄露的潜在风险,守护个人信息隐私安全与合法权益,又能充分释放人体生物样本库的科研价值,让这座“生命宝库”持续为生物医学研究和人类健康福祉注入强劲动力。

参考文献
[1]
李涛, 欧阳日辉. 数据是形成新质生产力的优质生产要素. 光明日报, 2024-4-23(11).
[2]
Bregman-Eschet Y. Genetic Databases and Biobanks: Who Controls Our Genetic Privacy. Santa Clara Computer & High Technology Law Journal, 2006: 1-59.
[3]
Warren S D , Brandeis L D . The Right to Privacy. Harvard Law Review, 1890, 4(5): 193-220.
[4]
Stanford Encyclopedia of Philosophy. Privacy and Information Technology. https://plato.stanford.edu/entries/it-privacy/[2024-5-10].
[5]
阿里·埃斯拉·瓦尔德曼著. 隐私即信任: 大数据时代的信息隐私. 张璐, 译. 北京: 法律出版社, 2022: 206.
[6]
Rössler. B.The value of privacy. Polity Press. 2004: 4−10.
[7]
Koops B J, Newell B C, Timan T, et al. A Typology of Privacy. University of Pennsylvania Journal of International Law, 2016, 38(2): .p566-567.
[8]
Laurie G . Genetic Privacy: A Challenge to Medico-Legal Norms. Cambridge University Press, 2002: 6.
[9]
中华人民共和国全国人民代表大会. 中华人民共和国民法典. 2020年.
[10]
毛典辉. 大数据隐私保护技术与治理机制研究. 北京: 清华大学出版社, 2019: 7.
[11]
孟小峰等. 数据隐私与数据治理: 概念与技术. 北京: 机械工业出版社, 2023: 2.
[12]
毛牧然, 董晓梅. 论信息隐私伦理风险的成因与治理. 自然辩证法研究, 2023, 39(4): 23-28. DOI: 10.19484/j.cnki.1000-8934.2023.04.002.
[13]
齐延平, 田奥妮. 司法数字公开中个人信息隐私保护的“整体—责任”模式. 中国法律评论, 2024,(4): 102-113.
[14]
邱遥堃. 作为义务的隐私: 数字时代下的挑战与应对. 现代法学, 2023, 45(6): 85-97.
[15]
李谧. 风险社会的伦理责任. 北京: 中国社会科学出版社, 2015: 12.
[16]
UK Biobank. Who we are. https://www.ukbiobank.ac.uk/about-us/who-we-are/ [2025-08-15].
[17]
Barn G. Consent and its discontents: the case of UK BiobankMed Health Care and Philos, 2025. https://doi.org/10.1007/s11019-025-10276-5[2025-8-15]
[18]
Gerke S, Jacoby M B, Cohen I G. 23andMe's bankruptcy raises concerns about privacy in the era of big data. BMJ, 2025, (389).
[19]
23andMe. Health +Ancestry Service. https://www.23andme.com/dna-health-ancestry/[2025-08-15].
[20]
Kwon D . What went wrong at 23andMe? Why the genetic-data giant risks collapse. Nature, 2025, 638: 14-15.
[21]
Brizi M R. Biobank Research and Data Protection Issues Under the GDPR//Beneduce C, Bertolaso M. Personalized Medicine in the Making. vol 3. Switzerland: Springer, 2022: 272.
[22]
郭明龙. 基因科技成果利益分享研究——以人体组织捐献者私权保护为视角. 北京: 中国人民大学出版社. 2019: 27.
[23]
重庆日报. 不影响生活却“影响”考编, “地中海贫血”基因携带者的进编之路. https://cqrb.cn/shishi/2024-08-30/2010608_pc.html [2025-8-15].
[24]
中国新闻网. “基因歧视第一案”分析: 基因检测滥用侵犯隐私. https://www.chinanews.com.cn/fz/2010/08-12/2463646.shtml [2026-1-9].
[25]
焦艳玲. 个人生物识别信息的界定. 重庆大学学报(社会科学版), 2023(3): 200-211.
[26]
葛秋萍, 王珏. 大数据技术应用中个人数字身份的伦理规制. 中州学刊, 2020(10): 95-101.
[27]
董军, 程昊. 大数据时代个人的数字身份及其伦理问题. 自然辩证法研究, 2018, 34(12): 76-81. DOI: 10.19484/j.cnki.1000-8934.2018.12.014.
[28]
中华人民共和国科学技术部. 行政处罚决定书 国科罚〔2015〕1号. https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/xzcf/202302/t20230228_184774.html [2025-8-15].
[29]
中华人民共和国科学技术部. 行政处罚决定书 国科罚〔2015〕2号. https://most.gov.cn/xxgk/xinxifenlei/fdzdgknr/xzcf/202302/t20230228_184773.html [2025-8-15]
[30]
冯君妍. 医疗人工智能的信任问题及规避路径. 阅江学刊, 2023, 15(5): 85-94+171.
[31]
Manheim K , Kaplan L. Artificial Intelligence: Risks to Privacy and Democracy. Yale Journal of Law & Technology, 2019, 21: 106-188.
[32]
Ric Simmons, Smart Surveillance. How to Interpret the Fourth Amendment in the Twenty-First Century. Cambridge University Press, 2019: 14−35.
[33]
Michaels, Jon D. Privatization's Pretensions. University of Chicago Law Review, 2010, 77(2): 717-780.
[34]
Luciano Floridi, Linnet Taylor, Bart van der Sloot . Group Privacy: New Challenges of Data Technologies, Springer, 2016: 60.
[35]
薛孚, 陈红兵. 大数据隐私伦理问题探究. 自然辩证法研究, 2015, 31(2): 44-48.
[36]
冯君妍. 人体生物样本库的伦理问题研究. 华中科技大学. 2021.
[37]
龚群. 追问正义: 西方政治伦理思想研究. 北京: 北京大学出版社, 2017: 203.
[38]
李爱君, 于施洋著. 论数据治理. 北京: 法律出版社, 2024: 16.
[39]
李斌. 生物经济: 一个革命性时代的到来. 北京: 中国民主法制出版社, 2022: 66.
[40]
Shenoy D, Bhat R, Prakasha K K. Exploring privacy mechanisms and metrics in federated learning. Artificial Intelligence Review, 2025, (58), Article 223.
[41]
Juba Ziani. How Differential Privacy Impacts Data Elicitation. ACM SIGecom Exchanges, 2024, 20(2): 75-81.
[42]
杨博. 安全多方计算技术及其在不同密态搜索场景下的应用研究. 华东师范大学, 2024.
[43]
尼尔·曼森, 奥诺拉·奥尼尔著. 重新思考生命伦理中的知情同意. 胡位钧, 译. 北京: 商务印书馆, 2023: 275.
[44]
王国豫. 共享、共责与共治——精准医学伦理的新挑战与应对. 科学通报, 2023, 68(13): 1600-1603.
Information Privacy Risks and Countermeasures of Human Biobanks in the Digital Age
FENG Jun-yan1, HAN Dong-ping2     
1. School of Marxism, Shanghai University;
2. School of Philosophy, Huazhong University of Science and Technology
Abstract: The human biobank stores a vast amount of sensitive data closely related to individual health, which should be subject to high-level protection. However, the potential risk of information privacy leakage has continuously intensified along with the digitalization process. In the context of the digital age, how to fully unleash the huge potential of the human biobank while effectively avoiding the ethical risks of information privacy leakage, and achieving a balance between scientific development and rights protection, has become an important research topic that urgently needs in-depth discussion. Based on the definition of information privacy in the human biobank, this article deeply analyzes the specific manifestations of information privacy risks in this field in the digital era, and explores the multiple factors of information privacy leakage. The research shows that through the coordinated efforts of various measures such as improving legal norms, technical protection, and public participation, the information privacy risks of the human biobank can be effectively prevented.
Keywords: the digital age    human biobanks    data    information privacy    ethical risk    

作者简介:冯君妍,上海大学马克思主义学院马克思主义中国化时代研究中心研究员。研究方向为生命伦理学、马克思主义中国化;
韩东屏,华中科技大学哲学学院教授、博士生导师。研究方向为文化哲学、政治哲学、生命伦理学等。
项目资助:国家社会科学基金青年项目“人体生物样本库的伦理挑战及治理对策研究”(23CZX046)。