机器学习在医药领域的应用

丹尼尔Faggella
《阿凡达》

丹尼尔是Emerj的研究主管。在联合国、世界银行(World Bank)、国际刑警组织(INTERPOL)和许多全球企业的呼吁下,丹尼尔成为了一名颇受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

制药和医学中的机器学习

当谈到机器学习的有效性时,更多的数据几乎总是会产生更好的结果——而医疗行业正坐拥一座数据金矿。麦肯锡估计大数据和机器学习基于更好的决策、优化的创新、提高研究/临床试验的效率以及为医生、消费者、保险公司和监管机构创造的新工具,制药和医药行业每年可创造高达1000亿美元的价值。

这些数据从何而来?如果我们能看到有标签的数据流,我们可能会看到研发(R&D);医生和诊所;病人;护理人员;等。这些(目前)完全不同的来源是同步这些信息并使用它们来改进医疗保健基础设施和治疗的问题的一部分。因此,当前机器学习和医疗保健交叉的核心问题是:找到有效收集和使用大量不同类型数据的方法,以便更好地分析、预防和治疗个人。

新兴的应用医药行业在未来,数据、分析和创新的同步性将成为现实。

在Emerj,人工智能研究和咨询公司,我们研究人工智能如何影响制药行业,作为我们的人工智能机会景观服务的一部分。全球制药公司使用人工智能机会风景找出人工智能在他们公司的位置,以及哪些人工智能应用程序正在推动该行业的价值。

在这篇文章中,我们利用我们的研究成果,对人工智能在制药和持续创新领域的几个开创性应用进行了分析。

机器学习在医药领域的应用

1 -疾病识别/诊断

疾病的鉴别和诊断是医学上毫升研究的前沿课题。根据2015年美国制药研究和制造商发布的报告在美国,超过800种治疗癌症的药物和疫苗正在试验中。在一次采访中布隆伯格技术奈特研究所的研究员杰夫·泰纳(Jeff Tyner)表示,虽然这很令人兴奋,但也提出了如何处理所有结果数据的挑战。“这就是生物学家与信息科学家和计算学家合作的想法如此重要的地方,”Tyner说。

毫不奇怪,大公司是最早加入这一潮流的公司之一,尤其是在癌症鉴定和治疗等高需求领域。2016年10月,IBM沃森健康宣布IBM沃森基因组学,与Quest Diagnostics的合作计划,旨在通过整合认知计算和基因组肿瘤测序,在精准医疗领域取得长足进步。

总部位于波士顿的生物制药公司伯格正在使用人工智能研究和开发诊断和治疗治疗的多个领域,包括肿瘤。目前正在进行的研究项目包括用于静脉肿瘤治疗和前列腺癌检测和管理的剂量试验。

其他主要的例子包括谷歌DeepMind健康去年,该公司宣布与多家英国公司建立合作关系,其中包括与伦敦Moorfields眼科医院(Moorfields Eye Hospital)。

DeepMind健康

图片来源:谷歌DeepMind健康——一组DeepMind健康团队的眼睛的OCT扫描

在大脑疾病领域,比如抑郁症,牛津P1vital®抑郁症治疗反应预测(PReDicT)该项目使用预测分析来帮助诊断和提供治疗,其总体目标是生产一种商用的情绪测试电池,用于临床环境。

2 -个性化治疗/行为矫正

个性化医疗,或基于个人健康数据与预测分析相结合的更有效的治疗,也是一个热点研究领域,与更好的疾病评估密切相关。该地区目前由监督式学习例如,它允许医生从更有限的诊断集中进行选择,或根据症状和遗传信息来评估病人的风险。

IBM Watson肿瘤学是一个领先的机构,在推动治疗决策变化的前沿,利用病人的医疗信息和历史,以优化治疗方案的选择:

IBM沃森和纪念斯隆·凯特琳

在接下来的十年里,越来越多的人使用微型生物传感器和设备以及拥有更复杂的健康测量和远程监控功能的移动应用程序,将提供另一大批数据,可用于帮助提高研发和治疗效果。这种类型的个性化治疗对个人的健康优化有重要的意义,但也可以降低整体医疗成本。例如,如果更多的患者坚持遵循处方药物或治疗计划,医疗成本的下降将会逐渐上升并(希望如此)回落。

行为矫正也是预防机制中必不可少的一环Catalia Health的科里·基德报道12月接受媒体采访时谈到。此外,在癌症识别、预防和治疗领域(例如)涌现出大量初创企业,取得了不同程度的成功。从一篇文章中选出两篇Entrepeneur包括:

  • Somatix-数据分析B2B2C软件平台公司,其基于mlb的应用程序使用“识别手对嘴的手势,以帮助人们更好地理解他们的行为,并做出肯定人生的改变”,特别是在戒烟方面。
  • SkinVision-这款自称“皮肤癌风险评估应用”声称自己是“第一个也是唯一一个通过CE认证的在线评估”。“有趣的是,我们在应用商店找不到SkinVision。在“SkinVision”搜索中出现的第一个应用是DermCheck在这种模式下,图像通过电话提交给皮肤科医生(人,而不是机器),以换取个性化的治疗方案——这或许证明了基于机器学习的精度在规模上的某些缺陷,但这些缺陷仍有待解决。

3 -药物发现/制造业

机器学习的应用药物的初步(早期)发现具有多种用途的潜力,从药物化合物的初步筛选到基于生物因素的预测成功率。这包括研发发现技术新一代测序

精密医学,这涉及到确定“多因素”疾病的机制,进而找到治疗的替代途径,这似乎是该领域的前沿。这项研究的大部分涉及无监督学习,这在很大程度上仍然局限于识别没有预测的数据模式(后者仍然处于监督学习的领域)。

机器学习在医药领域的应用图片来源:循环- - - - - -答:有监督和无监督学习问题的矩阵表示B:决策树将特征映射到结果。C:神经网络基于特征的变换表示来预测结果D:k近邻算法根据最相似的训练实例的值来分配类

这个领域的主要参与者包括麻省理工学院临床机器学习小组他的精准医疗研究重点是开发算法,以便更好地了解疾病过程,并设计出有效治疗2型糖尿病等疾病的方案。微软的项目汉诺威是否在多个计划中使用ML技术,包括与奈特癌症研究所开发用于癌症精确治疗的人工智能技术,目前的重点是开发一种个性化药物组合的方法急性髓细胞白血病(AML)

微软的项目汉诺威

英国皇家学会(Royal Society)也注意到了这一点生物制药行业优化的时机已经成熟。D从实验或生产过程中获得的ata有可能帮助制药商减少生产药物所需的时间,从而降低成本和改进复制。

4 -临床试验研究

机器学习在帮助塑造和指导临床试验研究方面有几个有用的潜在应用。应用先进的预测分析确定临床试验的候选人可以利用比目前更广泛的数据,包括社交媒体和看医生,以及针对特定人群的遗传信息;这将导致更小、更快、更便宜的试验。

ML也可用于远程监控和实时数据访问,提高安全性;例如,监测生物信号和其他信号,以发现任何对参与者造成伤害或死亡的迹象。根据麦肯锡,还有许多其他的ML应用程序,以帮助提高临床试验的效率,包括寻找最佳样本量,以提高效率;解决和适应病人招募地点的差异;使用电子医疗记录来减少数据错误(例如重复输入)。

5 -放射学和放射治疗

在2016年10月的一次采访中统计新闻哈佛大学医学院的助理教授Ziad Obermeyer博士说:“20年后,放射科医生将不会以现在的形式存在。它们可能看起来更像电子人:监督算法每分钟阅读数千份研究报告。直到那一天的到来,谷歌DeepMind健康正在与伦敦大学学院医院(UCLH)开发能够检测健康组织和癌变组织差异的机器学习算法,以帮助改进放射治疗。

图片来源:谷歌DeepMind健康-放疗计划

DeepMind和UCLH正致力于应用ML来帮助加速分割过程(确保没有健康的结构被破坏),并提高放射治疗计划的准确性。关于这个主题的更多内容将在我们的行业应用程序部分中介绍放射学中的机器学习

6 -智能电子健康档案

使用支持向量机进行文档分类(例如通过电子邮件对患者查询进行排序)和光学字符识别(将草书或其他速写笔迹转换为数字化字符)都是基于mlb的重要技术,有助于促进电子健康信息的收集和数字化。MATLAB的ML手写识别技术和谷歌的云视觉API光学字符识别只是这一领域创新的两个例子:

基于MATLAB的人工神经网络-手写字符识别

麻省理工学院临床机器学习小组是下一代发展的先锋智能电子健康档案它将结合内置的ML/AI来帮助诊断、临床决策和个性化治疗建议。麻省理工学院在其研究网站上指出,“需要强大的机器学习算法,这些算法安全、可解释、能从少量标记的训练数据中学习、理解自然语言,并能在医疗机构和机构中很好地推广。”

7 -疫情爆发预测

ML和AI技术也被应用于监测和预测世界各地的流行病爆发,基于从卫星收集的数据、网络上的历史信息、实时社交媒体更新和其他来源。阿片类药物的传染病是人工智能的一个直接例子今天的技术正在进步。例如,支持向量机和人工神经网络已经被用于预测疟疾暴发,并考虑气温、平均月雨量、阳性个案总数及其他数据点等数据。

预测疫情的严重程度在第三世界国家尤其紧迫,这些国家往往缺乏医疗基础设施、教育渠道和获得治疗的途径。ProMED-mail是一个基于互联网的报告项目,用于监测新出现的疾病并实时提供疫情报告:

形象资料:走向国际

利用ProMED报告和其他挖掘的媒体数据,组织“健康地图”使用自动分类和可视化协助监测和提供有关任何国家疾病暴发的警报。

图片来源:CDC - HealthMap报告,用于跟踪和预测登革热病毒的爆发

克服障碍

在将ML技术应用于制药和医药的竞赛中,仍有许多重大挑战有待解决:

  • 数据治理是目前最迫切需要解决的问题之一。医疗数据仍然是个人数据而且不容易访问,而且似乎合理的假设是,大多数公众对发布数据以代替数据隐私的担忧是谨慎的。有趣的是,2016年3月惠康基金会关于公众态度的调查在英国,商业获取健康数据的调查发现,只有17%的受访者永远不会同意将他们的匿名数据分享给第三方,包括用于研究的第三方。
  • 需要更多透明的算法必须符合严格的药物开发法规;可以说,人们需要能够看穿“黑匣子”,理解机器结论背后的因果推理。
  • 招聘数据科学人才在制药行业,建立一个强大的技能管道是非常必要的。
  • 打破“数据竖井”鼓励跨部门的“以数据为中心的观点”(即看到数据共享和集成的价值)对于帮助行业转变观念,从长期来看,拥抱并看到增量变化的价值是至关重要的。制药公司历来不愿做出改变或支持研究计划,除非有直接和重大的金钱价值。
  • 简化电子记录,目前仍是凌乱和分散的数据库,将是一个重要的初步步骤,以提高个性化治疗解决方案。

制药和生命科学领袖的荣誉

人工智能正越来越多地进入制药和生命科学领域。制药公司正寻求投资于有前途的人工智能初创企业,这将使它们在药物研发和其它研发过程中比竞争对手更具优势。他们利用Emerj AI的机会图景,对制药和生命科学领域的AI供应商进行排名,根据它们在各种业务领域提供强大ROI的可能性。联系我们了解更多。

图片来源:Udacity

保持在AI曲线的前面

发现关键的人工智能趋势和应用程序,在未来的业务中区分赢家和输家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

在Emerj,我们拥有最大的关注人工智能的在线商务读者群体——加入其他行业领袖的行列,每周收到我们发送到您收件箱的最新人工智能研究、趋势分析和访谈。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。