国家穷,人民健康水平差,大数据能改变这一切吗?

大数据

大数据提升中低收入国家健康水平

Intetix Foundation(英明泰思基金会)由从事数据科学、非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善人类社会和自然环境。通过联络、动员中美最顶尖的数据科学家和社会科学家,以及分布在全球的志愿者,我们创造性地践行着我们的使命:为美好生活洞见数据价值。

简介

无论是对个人还是社会,医疗保健服务都是一项复杂的工作。从临床角度来说,医生需要通过病史、体检、生命体征和其他指标为病人量身定制医疗方案。在21世纪,加强学习、测评以及提升服务质量也被补充到服务指标当中。对数据进行高质量的收集和分析对于提升医疗保健服务的效果和效率至关重要。医疗保健支出中有相当大一部分被浪费在某些临床情况下对于特定病人的治疗方案的不确定。而在基于人口的研究中,干预措施表现得非常成效。然而,在没有任何监督以及试图识别其对于患者利弊的情况下实施干预措施着实令人担忧。在低收入和中等收入国家中,临床数据的生成、分析和应用是很困难的。考虑到庞大的人口规模以及医疗保健服务惊人的复杂性(数以千计的疾病以及医药,包括与其相关的干预措施),利用数据改善具临床医学是一项复杂的工作。不过值得期待的是,最近发展起来的能够收集、分析并应用大规模数据的新方法,即大数据,也许可以填补医疗保健服务和人口健康之间的落差并改善人口健康状况。这些方法可以收集、组织并概念化数据,为人口健康提供了巨大的可能性。就像医学成像对患者提供的帮助一样,这些大数据使得分析更加精确。

近十年,在许多领域中数据的规模迅速扩大,新的数据应用也得到发展。虽然医疗健康领域的数据一直在增加,但是数据在提升医疗保健方面的应用却缺少相应的改变。因此,开发人员设计了一些原型应用并极力推荐给专业医疗人员。但是到目前为止,他们只获得了极少数有实际效用的系统性数据。在本文中,我们探讨了一些已有的和潜在的应用于中低收入国家的公共健康和医疗保健服务领域中的大数据。我们在PubMed和Embase数据库以及灰色文献中检索了相关文章,并根据所选文章的参考文献查找了其他来源的相关信息,分析了大数据在医疗健康领域的收益、风险和机遇,并且给出了在中低收入国家医疗健康服务中应用大数据的相关建议。而大数据在基因组学和生命科学中的多种应用由于已有大量报道,故本文没有涉及。

定义

大数据是指快速收集大量复杂数据的新兴方法,数据量级会达到兆字节、特字节甚至泽字节。大数据的特性可以通过数量、速度、种类和真实性四个维度定义。随着越来越多信息加速累积,大数据的数量和速度也在增加。使用“种类”这个纬度标志着从多个数据源中收集到的数据可以直接转化为信息。随着数据源更加多样化,大数据成果的价值也逐渐增加。在人口层面,传统健康数据只包括人口统计信息和入院统计信息,而在过去的几十年中,有更多的健康数据加入,其中包括电子医疗记录、手机和购买记录、地理定位系统和社交媒体等等。“真实性”维度是围绕数据的不确定性进行收集、标准化和验证的过程。鉴于对报道数据的量化和清晰度考察是多年来医疗健康领域研究与实践的一部分,对于医疗行业从业人员来说,其对数据准确性的理解要优于其他许多大数据用户。在用这些数据撰写的报告中,报告不确定性和置信区间的做法已经十分普遍。总之,这些维度使得大数据得以应用在医疗健康领域,并通过大型数据集的分析来协助医疗健康侧重点和相关政策的制定与实施。

应用

分析来自不同行业的链接数据集,可以为改善人口健康状况提供新机会。例如,在美国北卡罗来纳州的达勒姆郡,城市卫生保健部门决定利用数据引导社会和卫生保健服务。他们搭建了一个综合数据系统用于提高急救和对糖尿病患者医护的服务质量。通过将地理信息、人口普查数据、纳税情况以及血液铅浓度进行整合,该综合数据系统可以用于定位铅暴露以及其风险评估。通过筛查找出铅暴露风险较高的区域,有关部门可以发现并应对儿童铅暴露的问题。这种信息共享与分析可以弥合传统上公共健康和个人临床治疗之间的鸿沟。

大数据在早期应用于高收入国家时,人们遇到了来自后勤、技术、伦理和管理的挑战。比如在1998年,冰岛政府宣称健康数据,包括基因数据,都是国家资源,并且可以在未经个人允许的情况下为私人企业使用。然而,国内和国际上的反对阻止任何数据的传输,使该项目在2003年流产。贝斯特等人指出,通过世界范围内精细地对照试验,50%-80%的电子医疗数据项目都是失败的。虽然我们已经收集了PB级的数据,但是却将其束之高阁。

虽然在中低收入国家应用大数据是一项特别复杂的工作,但是这项工作也着巨大的潜在价值。大多数中低收入国家都有控制人类免疫缺陷病毒、肺结核、疟疾和其他传染病的纵向方案。这些方案所需的详细信息由公共卫生工作人员收集。然而由于行业协会外勤人员收集用于报告、追踪和研究的数据的能力有限,经常不能满足项目对于信息的需求。这时电子工具的出现正好解决了数据收集方面的质量和供给问题。公共卫生工作人员可以用手机、平板和电脑来实现调查研究和病人护理。

印度雄心勃勃地推出的个人识别方案可谓是大数据在全球健康应用中最有前景的例子之一。从2010年起,印度政府已经为全国12亿民众发放了Aadhaar卡和唯一的识别号。卡片、识别号和相关的生物特征为大范围生成和监督卫生和社会数据(包括电子医疗记录和低收入家庭的医疗保险信息)提供了可能。即使Aadhaar系统停止发展,现有的骨干网也可以支持更可靠、更庞大的医疗数据服务。反过来,这会使公共卫生干预措施的计划和实施得到显著改进。

最近,跨部门数据共享正在刺激大数据快速地创新和发展。例如,在2013年,科特迪瓦政府同意公布五个月的匿名手机数据,用于建立流行病传播的模型。实体企业和政府之间为了公共健康而共享匿名数据这种慈善性质的行为为营利性部门和其他利益相关者之间的合作提供了新的思路。

使用

在中低收入国家中,新技术的传播通常伴随着拨款与扩散。与高收入国家不同的是,新技术的传播经常会跨越式发展。举例来讲,在有线电话网络发展完备之前,手机已经在过去15年间渗透进了中低收入国家。手机的传播带来了提升健康服务的机会,并激发了人们对所谓的移动健康或者M-Health项目的热情。一些小规模的移动健康项目已经被概念式地验证演示,但是大规模的应用还非常罕见。

大数据和典型的移动健康项目是不同的。总体而言,移动健康项目是相对大众化的,其准入门槛较低,通过个人手机即可实现。虽然该项目的影响是立竿见影的,但是实际收益十分有限。大数据与之相反,方法本身需要更高的技术水平、专业设备、互动性标准、相干数据收集和分析系统,以及监督管理。除了技术方面,优秀的组织文化也是高效卫生信息系统的主要驱动力之一。然而在大多数国家,医疗保健工作者和系统管理员并没有受过数据科学的正规培训。

为了支持良好的数据采集工作,基于固定标准的可互操作的信息系统也需要及时跟进。在高收入国家建立的高度管制和路径依赖遗留系统导致中低收入国家的相应系统变得支离破碎之前,人们必须制定全球标准。在智能使用数据以支持实证科学的过程中,大数据已经改善了健康状况,例如在高容量和低成本的印度,Narayana Hrudayalaya医院已经实施了以结果为导向的数据分析与共享方法。虽然在跨系统整合数据过程中还存有障碍,但是数据所有权正在中低收入国家中萌芽。储存收集到的健康数据正是这种萌芽的迹象之一。

挑战

在中低收入国家,全面实施大数据系统还面临许多挑战。例如所有大数据方法的前提都是个人信息的采集,然而采集行为却包含了各种道德、法规和技术问题。鉴于该领域日益复杂的情况,隐私保护的重点将转向数据的正当使用、风险评估和风险最小化。匿名数据必须被稳健的监管和使用,并且与社会价值观的发展相一致。此外,在资源匮乏的环境下,应用大数据方法会放大医疗保健服务中业已存在的困境。在一线的卫生工作者在这种环境下很难将他们的管理范围拓展到数据的非必要集合。一些政客将大数据简单地看作为中低收入国家准备的消遣,而另一些人则认为大数据是这些国家在进步道路上的一个重要里程碑(box 1)。

Box 1.对大数据的不同观点

在中低收入国家,未来会因大数据而变好还是变坏?

1、反乌托邦观点

在最坏的情况是,大数据在高收入国家操控下变成了中低收入国家的一项昂贵的消遣。专注于疾病相关的成果而且使最需要数据存取的相关部门一头雾水。将难以共享或比较的碎片数据进行同化吸收可能会破坏本就不稳定的全球卫生。数据安全漏洞可能会威胁到人身安全,并导致歧视和种族灭绝等其他暴力行为。所以全球卫生界要监督花费在大数据项目上的巨额支出。

简要地说,大数据可能带来以下问题:

•对于需要干预的重心和资源的分流缺乏干预管理;

•不完善的数据管理——由私营公司建立的数据库频繁泄漏而公民又无追索权;

•通过设计不当的同意制度同意卸载,这些制度可能会威胁到个人安全;

•缺乏互操作性,分割后的信息系统无法汇总;

以及

•信息表现力差,难以分析,这被视为不合格或不可靠的。

2、乌托邦观点

与上述相反,大数据时代可以代表全球卫生改善的一个重要而且有益的转折点。在低收入和中等收入国家的决策者们可能会建立一个“需求方”平台,以确定他们最需要的信息。学术界、产业界、政府、国际组织和非营利部门可以合作帮助提供创新解决方案。虽然理想化的方案非常乐观,但是它与“实现千年发展目标”,“消除小儿麻痹症”和“控制疟疾”这些想法同样野心勃勃。大数据“最佳案例”的发展模式可以帮助我们实现所有目标。

简要地说,大数据可能带来如下好处:

•患者将拥有个人的健康数据;

•稳健的管理流程已经发展到能够保证在使用数据过程中遵守价值标准以及准则规章;

•以少量精力和低成本,实现数据自动汇总;

•互操作性标准支持数据无缝汇集与连接;

•在建立了充分保障的前提下,法律允许实时共享与汇集匿名数据;

以及

•数据对于患者、卫生保健提供者、企业家和政策制定者会呈现一种更有效的模式。

即使在最好的情况下,对个人健康信息的隐私威胁仍然存在。当信息涉及到弱势群体,这种威胁就更令人担忧。甚至连基础的健康数据---例如,种族、生殖健康、性传播疾病、基因遗传病和疾病暴露风险---可能被滥用并导致歧视,降低个人安全。任何电子资料库都有被破解的可能,而有意或无意地违反数据安全的行为更有可能会在高文盲率和社会堕落人群中产生。在这样的背景下,通过立法来保证信息服务的私密性和安全性通常是不可靠的,而且这种法规很少被有效地执行。

即便在高收入国家,随着对数据的应用越来越复杂,特定用途的告知授权愈发地被证实毫无意义。隐私保护是每个人的权利,对公信力保护也是非常必要的,随着大数据改善人类健康状况的潜力被逐步开发,人们同样有权利得到其中的潜在利益。而匿名数据的使用需要加入风险最小化的考虑中。因为对数据透明和有效管理的要求越来愈高,传统同意协议被取代或者补充的需求也日益增大。目标人群的价值观和需求需要运用于最佳实践中,以此平衡数据利用的好处和风险.这关系到数据共享和正当利用的顺利进行。

大多数低收入国家建立的薄弱的卫生系统和有限的管理架构却成为了大数据的希望。这些国家非常需要健康指标,但是收集出生和死亡的统计数据却非常麻烦。这些国家收集的流行病学数据是变量可靠的。数据被小站点收集而且很少被数字化。对于世界上超过二十亿的人口来说,当务之急依然是改善食物,水和卫生设施的供给。在许多低收入国家,可能只有在消费实际卫生服务时才能收集相关数据。据联合国报道,“大数据和实时分析并非解决长久发展问题的灵丹妙药,认识到这一点很重要。”但是,由于电子化地整合协调资源与服务导致成本降低,大数据可能为中低收入国家带来巨大的利益,对干预措施资源限制越多,对干预措施的定位和目标就越重要。

垂直(特定疾病)规划和水平(卫生系统)途径之间的持续紧张仍然没有得到解决。大数据更适合水平方案,这有利于潜在地改善所有人类疾病的控制和治疗。目前,全球健康仍然受到特定疾病的干扰,而宣传特定疾病组织能有效地带头前往大数据队列---卫生界分裂的风险更大。

下一阶段

大数据收集所扮演的角色---无论是被视为工具或威胁---仍不清楚。对于积极的方面,数据获悉,反思和资源管理是至关重要的。目前,全球卫生治理架构相对脆弱。在2009年,联合国设立了全球脉搏行动。“它的使命是采用可持续发展和人道主义行动的方式,加速研究、开发和规模化大数据创新。”不幸的是,全球脉搏当前的数据保护标准非常过时,因为他们以1990年对电脑化个人数据文件的校准作为基础。

在世界经济论坛全球健康数据宪章中给出了关于收集和利用健康数据的一些指导。对于健康数据,章程确定了八个主要挑战,并强调一些扶持性的活动。大数据的广阔来源需要多个利益相关者的合作。无论是大学,专业协会,政府机构,还是研究驱动型企业,都是可以开发和运营数据系统,以支持医疗机构的例子。这个其中需要一个清晰的治理决策框架,来告知每个利益相关者其义务和在每个进程中的责任。在定位和解决任何问题时都需要透明度,直至重要决策被制定。问题难以解决的原因大多是因为在谁去解决问题,他们应该如何解决问题这些事情上缺乏清晰的共识。比如在一个新兴的领域,如大数据,其中的协议仍在发展,管理方式是能使利益相关者相信这里有能解决问题的系统的重要依据。然而,全球卫生界在技术性发展的管理方面有非常不调和的记录。优化的大数据应用将包括更多保密保障和最低标准等等。努力建立互操作性标准是势在必行的,这能最大限度地增加大数据所带来的好处。全球卫生治理的模式需要从被动的变为主动的,规范的。

结论

在卫生保健服务领域,大数据可能是一个重要的里程碑。它促进了护理学习系统的发展,通过个人精确管理提高了整体健康水平。庞大的规模使得潜在风险和潜在利益并存。虽然大数据方法在中低收入国家中最有价值,但数据碎片化和滥用的风险也蕴含其中。规避风险需要协同治理,认真分析和建立技术合作伙伴关系,这些操作的复杂性不可低估。在中低收入国家,从纸质记录到PB级数据存储的过渡指导为全球卫生机构提供了另一个达到有效管理的机会。

原作者:1.Rosemary Wyber ,2. Samuel Vaillancourt ,3. William Perry , 4.Priya Mannava , 5.Temitope Folaranmi ,6. Leo Anthony Celi

参与人员:

编译 – 于大江、徐敏 ;

编辑 - 腾翼;

策划 - 徐睿艺、樊茜茜;

推广 - 吴荃雁、申洪浩、李华芳

声明:本文内容和图片仅代表作者观点,不代表蓝时代网立场。蓝时代 » 国家穷,人民健康水平差,大数据能改变这一切吗?

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址