qratvi的Murali Aravamudan关于药物发现中人工智能的“可能性”

丹尼尔·法格拉
化身

丹尼尔Faggella是Emerj研究部主管。在联合国,世界银行,国际刑警组织和许多全球性的企业叫,丹尼尔是一个全球抢手的对企业和政府领导人AI的竞争战略意义的专家。

qratvi的Murali Aravamudan关于药物发现中人工智能的“可能性”

情节概要:在这一集里,我们和穆拉利·阿拉瓦穆丹AI-驱动药物发现启动的创始人和CEO定量,这是梅奥诊所和生物技术/数据科学公司nference的合资企业。Murali和我讨论了医疗行业中医疗信息和数据的激增,人工智能在开发治疗各种疾病的药物中的作用,以及人工智能在药物发现中的未来。

穆拉利和我都将在医疗中心发言人工智能应用峰会波士顿——2017年12月11日和12日。我很感谢峰会上的人们把我和穆拉利直接联系起来,我希望你们会喜欢这一集:

itunes播客
响亮播客
谷歌播客
订书机,播客

客人:Murali Aravamudan,Qratvi创始人兼首席执行官

专业知识:医疗信息技术、数据科学、软件开发

简要认识:默利·阿拉瓦马当是Qrativ的创办人兼总裁。他还联合创办了软件公司Veveo于2004年,直到它被Rovi公司(现在的TiVo公司)收购了其CEO任职九年。他获得了科学的班加罗尔的印度理工学院的学位。

(为了与毒品有关的AI使用情况更广泛兴趣的读者,请参阅我们最近的完整的文章标题是:“机器学习药物研发应用 - 辉瑞,罗氏,葛兰素史克,以及更多“.)

大创意:

开发一种药物需要数十亿美元。机器学习可能有助于通过发现可能由现有药物治疗的新情况来最大限度地利用这一前期成本。这个“药物再利用”的过程是非常具有挑战性的,但是人工智能可以使用病人数据和医学期刊来寻找新的应用(没有从零开始研发一种药物花费了数十亿美元)。

药品再利用,或研究用于治疗一种医疗条件和测试它与其他疾病和罕见疾病的治疗冲击批准的药物,是为了加快新药在医疗行业的发现和整合。它建立在以前的研究和药物开发数据,以确定哪些药物可以治疗工作。

研究人员可以在这个领域使用的另一个重要信息是与患者相关的数据。然而,随着大量基因组信息的可用,研究人员不可能在没有人工智能的帮助下跟上数据处理的步伐。研究人员可以利用神经网络和人工智能来识别新的药物治疗条件。

(对于对医疗IT安全领域应用人工智能的供应商公司感兴趣的读者,请查看我们的人工智能医疗供应商名单。)

qratvi的Murali Aravamudan访谈要点

以下是完整音频采访的浓缩版本,可在Emerj SoundCloud和iTunes站点的上述链接中找到。

[2.49]在机器学习和药物发现的交叉点上,今天有什么可能?如何发现以前找不到的新机会?

穆拉利·阿拉瓦穆丹:今天,可供机器查看的数据集与3、4或5年前相比呈指数级增长,因为基因测序类数据,再加上各种数字传感器等,已经提供了越来越多的临床数据。考虑到所有这些不同的数据来源,其中一个来自临床操作实践,但对于急性疾病,比如癌症,有一系列的数据来自关于癌症治愈的射线照片,他们经历了什么样的化疗,他们的身体是如何反应的,等等。

而将所有的方式,以数据集是完全临床前在本质上是在小鼠或在试管实验室实验的实验室实验已经使用某些化学品有一定风险被,所以当你有这个集合的数据集,问题然后变成三角测量中的一个。你怎么可以连接某种药物将如何工作以及与某些疾病状态的点?或者,它只能与某些遗传特征的疾病状况运行良好,所以只有某些癌细胞的人口的一个子集可以有不同的反应以及对特定药物。

所以这些类型的连接点是很难在几年前。在过去的三年中现代人工智能技术也给予的已建的各种机器学习技术,在过去的十年左右发生的顶部工具的新集。这使我们能够以更有意义的意义上,这三角问题做。而现在可以为我们生成一组假设,这是目前为止,可能较高而不正确,而不必花费多年的临床前实验。

所以能力基本上需要大量的已通过临床前试验的一定量的药物去和资产,但要使用的数据,我们已经和遇到的一些信息新件的其他资产。所以这个特定的药物现在已经被用于不同的疾病适应症,这是从来没有甚至药物的原始创新研究非常有效的机会。这是绝对有可能给他们。

(5.58),这听起来像,从商业角度看,有两种不同的大的方面来此。第一,有可能是一个适合于一种新的药物,其中有可能是一个更大的潜在市场可以从这种信息被哄骗了一个新的机会。然后对方正在使用的,因为你会把它,这是已经完成的研究。我不知道它的成本超过十年得到一个药物测试,外面的市场,你将有一个更好的比我,但是这是几百万美元,对不对?

穆拉利·阿拉瓦穆丹:这是正确的。有一个有争议的人物,因为那些钱是百药的成本是什么。对于批准的药物,你可以看到的美元十亿的估计。这是基于他们如何包括失败药物的成本为好,但它谈何容易。不失一般性,可以假设它是在美元的数百万元。

(6.57)假设是安全的。我们说的是十年;我们说的是非常昂贵的设备和专业人员,漫长的过程,任何在当今时代需要十年的东西。很多专业人士都在等这么长时间。所以也有这种能力来弥补以前的研究,当你和我在麦克风前谈话时,你在说,在十年的过程中,有时,五年之后,由于监管原因,专利,公司的方向改变,或者不管是什么情况,有些事情必须停止。

如果同样的信息不能被挖掘、利用,也许不能被用来寻找一个新的机会来进行新的药物匹配,而这种匹配仍然是富有成效的,利用以前的工作是有可能的,那就太可惜了。因此,效率和新收入似乎都是潜在业务的一部分。

穆拉利·阿拉瓦穆丹:是啊,别忘了那些病人——那些病人,他们今天甚至可能没有药物治疗。现在对他们来说是上帝派来的,对吧?从纯商业的角度来看,我们有可能在这个过程中获得大量收入。我发现特别有趣和有帮助的是,过去做了大量的人类工作,我们可以反过来利用这些工作来拯救或改善人类的生活。对我来说,这和商业赚钱一样重要。

(8.50)那么医疗保健领域就有这个方面。我认为医疗和金融在人工智能领域得到了大量的风险投资,部分原因是它只是一个巨大的信息量。但是在医疗保健方面,访问这些信息有很多问题。但我认为,这在一定程度上也源于一个崇高的目标,那就是如果能找到新的模式,那就是治疗癌症。这可能是人们所遭受的任何痛苦。

如果我们能找到治疗某种条件,这不就是一个高尚的事情本身?显然,能够找到新的会,和你们正在努力的一部分。我感兴趣的是如何一些这方面的作品。这是相当大量的信息在这里从各种临床试验和患者数据信息,过去的研究和任何其他地方。为了能够找到所有的重叠,空白和机会,为什么AI必要的,它在这一过程中的作用是什么?为什么是至关重要的采取,使之成为现实?

穆拉利·阿拉瓦穆丹:如果你看看谁是一般写论文在生物医学中的人相比,20年回数,说中期20世纪90年代到现在,这个数字已经字面上成倍增加。因此,在每一天,如果你看看说出来的新论文的数量,这个数量明显是比什么是一张纸,每天数百人。

所以,如果你去到不同的会议,在过去 - 20岁回来,有可能是由不同的医师科学家提出了一个百来200多篇论文。

现在,一个像美国临床肿瘤学协会或ASCO这样的会议,有35000个摘要。想想看:一个会议有35000个摘要,所以对人类来说,无论我们的思想多么伟大,都不可能掌握和使用这种数据。所以这就是人工智能发挥作用的原因。事实上,我们拥有大量的数据,机器能够找到特定的模式,并合成所有这些知识,这些知识更容易被人类大脑消耗掉。

(11.39)为了澄清这一点,因为我认为观众会对此感到疑惑,所以我把你们正在开发的这个应用程序看作是在看研究数据,也许是来自制药公司(我们过去曾报道过的许多公司)和梅奥诊所,以及病人信息。我也没想过要从学术文献中抽身。在某种程度上这是混合的一部分吗?

穆拉利·阿拉瓦穆丹:它其实不只是搭配 - 这是基本的组合。

(12.06)这很有意思,因为如果我们有所有关于病人的基因信息,真正的深部血液取样材料,以及其他的东西,然后我们有关于化学物质和药物的信息,如果我们知道我们要找的是什么,我可以从字面上看到数据本身的一些重叠。有了学术文献,我们现在正在研究自然语言处理,并试图找出单词、术语和化学物质之间的关系,这可能会创造一个值得研究的模式。

穆拉利·阿拉瓦穆丹:当然。你把它钉在头上了。接下来你会问一个关于一种疾病的问题,这个问题可以是“非小细胞肺癌”这样的短语,看起来有五种效果,对吧?但那是一句话。你会问,什么基因和药物与这个短语有关?你会问这些问题,对吧?

你会发现疾病与基因、疾病与药物以及生物学家称之为“系统发育类型”的各种其他疾病之间有着非常相似的有趣模式。这是一种我们称之为“语义信号”的信号。然后我们使用语义信号,看看语义信号是否有来自临床数据的支持,从遗传数据来看——这就是三角测量的工作原理。

(13.41),因此,这将是很好的,我们可以在概念上澄清这一点。它好像你有可能定义一个问题,也许定义可能与这些短语和任何看待学术文献标志相关条款。然后,我们又有何这个条件看起来无论喜欢一个人或在药物的化学痕迹的理解,看看我们对事物的药物内方和事物的患者侧匹配和集群。

And so in my mind, seeing a triangle of research papers, patient data and maybe more pharmacological data and once we have our terms defined, we can then start to see what the overall lapse are and if there’s any large gap that humans are doing, the thinking and the priming ahead of time. Am I on or off in terms of what’s being lined up and run here?

穆拉利·阿拉瓦穆丹:你是对的大部分过程。人类有启动进程。该机不会突然将感兴趣的治疗神经系统疾病称为“多发性硬化症”。所以我们要启动它。但是,一旦我们开始,会发生什么在这个过程中它往往是非常迭代。

这台机器会给你一些令人惊讶的见解,显示,就像在梅奥诊所的环境中,我们实际上与内科医生科学家分享了一些列出的事情,这些人通过添加新的术语来完善它,等等。所以我们试图在机器和人之间处理的是最后的过程,比如,“这是最后的4种药物,它们有能力治愈一种特定的疾病,具有一定的特征。

(16.05)当然。很多时候,当人们在销售其他公司必须使用的人工智能工具时,他们必须有意识地或潜意识地,以一种使其看起来非常,非常简单的方式来解释它。我认为幸运的是,在你的情况下,授权和与大型制药公司合作将更像是一场游戏,据我所知,你并不是在销售这样的软件,更多的是你们自己在做这项工作。

There’s initial hypothesis, tweaks and testing among these sets of data, additional adjusting between these sets of data, and what the machine does is to bring forth what you asked it to bring, and maybe find the overlaps and underlying connections and correlations between data that would be far too much for a human to manually label in a spreadsheet and to do that very quickly.

穆拉利·阿拉瓦穆丹:当然。事实上,你用了一个非常有趣的词。在过去几年里,我们之所以能够做到这一点,而不是以前,其中一个原因是我们使用了一种叫做“无监督培训”的技术。数百万的这些文档被没有标签的机器消耗掉。

我们这里没有标签,因此无监督的培训是使我们能够从数据中辨别出哪些是初始连接的原因。数据告诉我们什么?机器所能做的就是说出最初的指令,但随后人类就得帮忙了。

(18.41) What you’re talking about is instead of telling someone to go in and come up with some new manual human label for any patient data that needs a certain criteria, this is a system that can cluster things according to related pattern without a person tagging it. The machine knows what it’s looking for and be able to coax out and find those patterns itself without a person having to name and identify things.

我想谈谈的最后一件事,就是你最兴奋的对未来的承诺。我们今天讲了什么是可能的,显然这些都是新的。你是有这个记录的时间的安排,还有待做了很多,但很显然,这是非常令人兴奋的领域。你一定渴望未来。在大的方面,唾手可得的,在未来五年里提前或那么,什么是你最兴奋的这种技术?

穆拉利·阿拉瓦穆丹:所以他们说,“证据就在布丁里。”我们真的必须从强有力的假设到对人类有效的药物来进行这些洞察。令我兴奋的是,有可能将一些药物推广到临床,并以这种特殊的方式对人类真正有帮助。

There is an underlying notion of improving unsupervised training and that is a very hard problem so we have several five to 10 years of work to do in unsupervised training that when we do this iterated process, can we limit the human beings’ involvement as much as possible? So we are not there yet. Those are the kinds of improvements that we need to refine the technology for. It’s about can we really help bring more drugs to people who really need it.

(21:25)在这一天结束,这是低垂功利的好处,如果我们可以大胆地假设。而且它的业务至关重要。如果没有人在比赛结束这里受益,究竟发生了什么的呢?我们该如何保持齿轮转动?显然,固化挑战性疾病是非常重要的工作。展望未来的无监督学习,是药物或药品中有域,你更兴奋呢?是否有各种各样的条件,往往当人们尝试手动查找模式,你认为可能是比他人更容易,地方你已经看到了利益被挑战?或者是不是真的都是一样的白色帆布的权利吗?

穆拉利·阿拉瓦穆丹:我们可以做一些粗略的想法。肿瘤癌症是迄今为止我们拥有最多数据的地方,因为各种政府资助的努力,其中超过10000人的肿瘤已经被基因测序,等等。但我们要说的关键一点是,精确医学的概念是一种针对特定生殖群体的药物,不必局限于肿瘤学。

所以,我们认为在免疫系统中最多种病症的一个组成部分。许多免疫系统疾病的变成有,从肿瘤数据集出现的信号。

因此,我们很高兴能将这些免疫系统信号应用到精确的神经学或精确的眼科。我们可以想到各种这样的情况,所有这些都可以受益于精确医学,而不仅仅是肿瘤。

(23:43)从收集的数据的广度来看,似乎有一些政府的举措听起来确实能降低癌症的发病率,很明显,就美国和整个第一世界人民的死亡率而言,这些举措是正确的。听起来有人在努力添加它们并收集信息,特别是遗传信息,但我们所看到的与遗传足迹和免疫系统的联系和示踪剂可能是可以推断出来的,所以这些发现可能是为了癌症而被发掘出来的,但也有办法去拉扯,从这些信息中找出可能泄露到其他领域并创造一些好处的联系和意义。

穆拉利·阿拉瓦穆丹:完全正确。

头部图像信贷:冷静

艾曲线保持领先

发现未来商业中区分赢家和输家的关键人工智能趋势和应用程序。

注册“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
机器学习曲线保持领先

在Emerj,我们拥有最大的在线人工智能商业读者群——加入其他行业领袖,每周收到我们最新的人工智能研究、趋势分析和发送到您收件箱的采访。

感谢您订阅Emerj“AI Advantage”新闻稿,请查看您的电子邮件收件箱进行确认。