人工智能来势汹汹，AI医疗何去何从？

【猎云网（微信号：）】8月10日报道（编译：张璐璐）

编者注：本文作者Jeremy Hsu是一名自由撰稿人，主要撰写科技类文章。

诸如“AI医生”、“AI诊断”以及“人工智能将最终成为人类的医生”之类的头条新闻或多或少使人们相信，人工智能不久后将真正取代人类医生，但专家表示，事实上AI与人类医生将形成一种合作关系，并非完全取代：患者很快就会发现，临床医生将与人工智能携手，共同为他们提供服务。

在医学界，人工智能的前景毫不悲观。但许多人表示，针对AI的炒作尚未在真实的临床环境中得以实现。对于人工智能服务将如何产生巨大影响，各界人士的看法褒贬不一。目前，尚不清楚人工智能能否改善患者的生活，对于硅谷企业、医疗保健组织和保险公司等期望达到的最低目标也不得而知。

哈佛医学院生物医学信息学研究员Isaac Kohane表示：“我认为所有的患者都真正希望人工智能技术能够应对医疗系统的弱点，但实现这一点的方式并不是通过硅谷的炒作。”

如果AI医疗以预期的方式成功构建，就可以通过提高医疗欠缺地区的服务水平和降低成本的方式来实现医疗保健的民主化。尽管美国人均医疗费用为1.0739万美元，但许多治疗措施远次于其他某些国家。因此，医疗保健的民主化将成为美国社会的一个巨大福音。AI可以解放一些工作严重超负荷的医生，降低医疗事故发生率。据悉，美国每年有成千上万的患者死于医疗事故。在许多医生数量严重不足的国家，AI技术的益处显而易见。例如，在中国，熙熙攘攘的城市医院门诊部每天候诊的患者多达1万人。

但批评人士指出，如果急于构建AI医疗，反而践踏了患者的隐私权，忽视了偏见和限制，或医疗健康服务本身未能惠及广大群众，那么这种技术的构建得不偿失。

Human Diagnosis Project（Human Dx）的创始人兼主席Jayanth Komarneni表示：“AI就像技术一样，既可以填补差异，也可能会加剧差异，而在加剧差异的能力方面，没有任何事物能与AI媲美。”Human Dx是一家专注于众包专业医疗的公益机构。

当前，最热门的AI技术是机器学习和深度学习。与严格遵循人类编写规则的计算机程序不同，机器学习和深度学习算法都可以通过查看数据集进行学习，并做出新预测。最值得一提的是深度学习，这一技术还可以通过发现人们潜在错漏的数据模式来做出有价值的预测。

但是，仅仅依靠AI，还不足以充分发挥这些预测在医疗保健方面的作用。然而，人类仍然必须做出可能对健康和资金产生巨大影响甚至后果的决策。由于AI系统缺乏人类的一般智力，系统的预测或许模棱两可、令人困惑。如果医生和医院毫不保留地相信AI，可能会酿成大祸。

针对这一点，微软研究院高级研究员Rich Caruana曾于去年在杂志《Engineering and Technology》上利用一个经典案例进行解释。20世纪90年代，Caruana参与了一个使用早期的机器学习形式来预测肺炎患者生存风险高低的项目研究。但是，机器学习模型在预测哮喘患者时出现了差错。该模型将这些患者视为低风险，仅需进行小型治疗而无需住院治疗（若采用人类医生诊断，一定会选择后者。）。而实际上，这些患者的生存风险很高，因为哮喘导致的呼吸困难极易引发肺炎。

斯坦福大学生物医学信息学研究中心的研究科学家Kenneth Jung表示：“如果盲目地信任这个模型，只会被泼凉水。因为模型会告诉我们，这个患有哮喘的孩子得了肺炎，但我们不需要担心，开一些抗生素给他，然后送他回家就行了。”

深度学习预测在首次遇到异常的数据点（例如特殊的医疗病例），或者在学习无法良好普遍适用的特定数据集中时，也会出现谬误。

在应用于海量数据集时，AI预测的表现最佳。例如，由于可以访问大量人群和患者数据，中国在训练AI系统方面具有优势。2月，《Nature Medicine》杂志发表了一项由中国广州和圣地亚哥研究人员展开的研究。该研究基于超过56.7万名儿童的电子健康记录，可以诊断出许多常见的儿童疾病。

但即使数据库足够大，仍无法确保100%的准确率，特别是当研究人员尝试将算法应用于新的人群时。在上述该项研究中，参与研究的50万名患者均来自广州某医疗中心，这意味着从该数据库得到的诊断经验无法保证在其他地区的儿科诊断中适用。不同的医疗中心拥有不同特征的患者群体。例如，以心血管闻名的医院可能会吸引更多更严重的心脏病患者就诊；从一家患者大多数为华人的广州医院得到的研究成果，也不适用于一家患者大多数为非华裔外国人的上海医院。

在其他情况下，这种预测仍然很难实现。例如，多伦多大学计算机科学家和生物医学工程师Marzyeh Ghassemi表示：“在一家城市医院，例如贝以迪医院，有4万名ICU患者。我们可以根据所有的患者资料做出预测。这些预测结果也许适用于波士顿的另一家医院。但对另一个州或者另一个国家的医院是否适用呢？我们无法给出肯定的答案。”

虽然AI模型可能并不通用，但Ghassemi认为该技术仍值得探索。“我非常赞成将这些模型从实验室带向临床，但是必须采取非常积极的预防措施。”

哈佛大学法学教授、精准医学、人工智能和法律项目负责人I. Glenn Cohen表示，所有的预防措施在整个人工智能开发和部署过程中必不可少。整个过程可能涉及验证AI预测的准确性和透明度。在数据收集过程中，研究人员还需要保护患者隐私，并且需要经过患者同意方可利用患者数据进行AI训练。

当AI模型准备就绪，可进行真实患者的实验性临床测试时，需再次征求患者同意。“是否有必要告知患者目前我们正在测试过程中利用算法进行实验？AI在该过程中起完全或部分作用是否重要？”Cohen问道。“但对这些问题，我们极少思考。”

Ghassemi还提议AI算法需经常审核，从而确保不同种族、性别、年龄和健康保险的公平性和准确性。由于AI在其他领域的应用已经证明了它的误差率，因此这一点将非常重要。

在确保完成上述所有步骤之后，提供AI服务的人员和公司将解决某些不可避免的法律问题。与多数通常只需一个监管机构批准的医疗设备不同，AI服务或许每进行一次新数据学习，都要进行额外的审核。

一些监管机构也正在重新考虑评估AI医疗保健的方式。4月，美国食品和药物管理局（FDA）向公众发布了一份文件，征求关于如何更新相关监管审查的公众反馈意见。“一直以来，我们不懈努力的目标是让技术惠及群众，但我们也意识到目前的方法效果欠佳，”FDA数字健康总监Bakul Patel表示。“这就是我们需要纵观整个产品生命周期整体方法的原因。”

除了关于授权、隐私和法规的问题，谁将最大程度地从AI医疗服务中受益仍不可知。医疗保健的差异也已经存在：根据世界银行和世界卫生组织的统计，全球一半的人口无法获得基本医疗服务，近1亿人口因医疗费用而陷入极度贫困。依靠AI的部署方式，这些不平等或许可以得到改善，也可能使情况更糟。

“关于AI的讨论大多集中于如何使医疗保健民主化，我期待看到这种情况的出现，”瑞士联邦理工学院生物伦理学家Effy Vayena表示。“如果最终我们只是为能够承担医疗保健的人提供了更好的服务，我不确定这是不是我们正在寻求的转变。”

这一切将如何发展取决于部署AI的不同愿景。早期AI开发的切入点是非常小的医疗诊断应用，例如检查皮肤癌或指甲真菌的图像或读取胸部X光片。但近期的研究的重点已经转向更快速地诊断多种健康疾病。

2018年8月，英国莫菲尔眼科医院和谷歌母公司Alphabet旗下的伦敦AI实验室DeepMind宣布，成功训练出能扫描识别50种眼科疾病的AI系统，其能力与领域内领先的专家不相上下。同样远大的抱负也促进了圣地亚哥和广州的研究，他们希望训练出能诊断儿童常见疾病的AI系统。与高级医师相比，AI在诊断儿科疾病方面虽然表现不佳，但确实比一些初级医生出色。

或许，要实现医疗保健的民主化，这类人工智能系统并不需要达到登峰造极的程度，只需使当前的医疗标准惠及医疗欠缺的地区。尽管如此，目前大多数AI应用都致力于提高现有的医疗标准，而非推广实惠的医疗保健。Cohen表示：“实现现有医疗服务民主化，将比在许多其他领域民主化的效果更显著、影响更强烈。”

咨询公司埃森哲预计，到2026年，顶级AI应用每年可为美国经济节约1500亿美元。但目前尚不清楚由税务资金部分保障的患者和医疗保健系统是否会受益，或者更多资金是否仅流向科技公司、医疗服务提供商和保险公司。

“关键问题在于由谁主导、由谁买单，”Kohane表示。“所有的商业计划自认知道这些问题的答案，但这一点的确令人有点难以苟同。”

Kohane警告称，即使AI服务有望节省成本，人类医生和医疗保健组织也可能会由于资金短缺而启动AI系统。这指出了一个更大、更系统性的问题，美国医疗保险公司所使用的按服务付费的模式通常会由于一些增加的医疗测试和治疗操作向医生和医院提供一定的补贴，即使这些测试和操作并不必要。

实际上，仍有另一个提高健康护理质量的AI机遇，与此同时，将大多数医疗诊断的主动权掌握在医生手中。斯克里普斯研究转化研究所的主任和创始人Eric Topol在其2019年出版的《Deep Medicine》一书中谈到，可以创造出像Siri一样的AI医疗助手，产生医生与患者之间的互动、记录电子病历，并提醒医生询问患者相关过往病史。

Topol表示：“我希望简化医生的工作，帮助他们摆脱数据分析师的角色，对患者承担更多责任，从数据中解放出来，这样就不必浪费太多时间在审查上。”

Kohane说，这就像兢兢业业的医学助理或抄写员利用AI自动跟踪和转录医生与患者之间的对话。他支持Topol的想法，但补充道，目前正在开发的大多数AI应用似乎并不十分重视这样的AI医疗助手。尽管如此，Saykara和DeepScribe等公司已经着手开发这类服务，甚至谷歌也已经与斯坦福大学合作测试类似的“数字抄写员”技术。

AI助手听起来可能不如AI医生令人兴奋，但前者可以让医生腾出更多时间陪伴患者并提高整体护理质量。尤其是家庭医生，他们经常花费一半以上的工作时间将数据输入电子健康记录。这一点是身体和情绪倦怠的主要原因，甚至可能导致包括患者死亡在内的严重后果。

讽刺的是，电子健康记录本应通过降低患者信息的获取来改善医疗保健和降低成本。但Topol与其他许多专家指出，电子健康记录是当前AI医疗保健的大肆炒作。

电子健康记录的应用已在数百家私营供应商中创建了拼凑系统，成功分离了患者数据并隔绝了医生和患者的访问。若以史为鉴，许多科技公司和医疗保健组织或许会用类似的方式为自己的AI系统建立医疗数据库。

Komarneni表示，使用汇总和排列不同来源医疗专业知识的集合智能系统或许是这个问题的解决方法之一。Komarneni正与Human Dx合作试验这种方法。在美国医学协会（American Medical Association）等主要医疗机构的支持下，Human Dx建立了一个在线平台，为特定医疗案例的数千名医生提供众包建议。Komarneni希望这样的平台有朝一日也能真正获得许多不同AI服务的诊断建议。

Komarneni说：“就像未来各个不同领域的专业人员可能会看到你的病例一样，AI完全有可能做到这一点。”

Topol表示，当医生等待AI助手时，诸如HumanDx这样的众包项目“肯定会改善诊断环境，甚至可以改善治疗建议。”2018年，他在一个名为Medscape Consult的平台上合著了一篇论文。该论文的结论写道，集体人类智能可能是AI医学的“竞争或补充策略”。

但是，如果AI服务通过所有测试和现实检查，就很可能成为人类重塑现代医疗保健的重要合作伙伴。

“有些事情机器永远无法完成，也有些事情人类永远做不到，”Topol说。“所以，当我们把两者合二为一时，就可能释放出巨大的能量。”