人工智能用于制药研发

尼科洛·梅希亚
《阿凡达》

Niccolo是Emerj的内容作者和初级分析师,开发web内容并帮助进行定量研究。他拥有艾默生学院的写作、文学和出版学士学位。

人工智能用于制药研发

研究与发展(R&d)的便利也许是最常见的情况在人工智能的应用医药行业。有从提取和组织研究数据多种解决方案临床试验说明和其他医疗文件。此外,还有一种软件据称可以在分子水平上分析来自药物化合物图像的数据。

AI也可以帮助制药公司制造新发现的药物更有效率。这是通过做预测时如何制造商试图把它变成一个药丸,药水,或外用药膏,如药物可发生反应。数据科学家可以找出一种药物有可能打破或者加工成这些类型的产品的制药公司实际上采取的是风险之前变得不那么有用。

在AI的用于药物研发d的可能性本概述,我们将介绍:

  • 药物发现的自然语言处理:通过非结构化数据的数据库搜索,如数字化过去临床试验报告。
  • 用于药物发现预测分析:预测某些分子如何与彼此反应以找出一个药物可能如何有效在治疗疾病。
  • AI用于盐和变形测试:用人工智能来测定药物化合物的溶解度。

我们开始我们的AI的概述制药R&d与可能性自然语言处理(NLP)软件,以及如何它有利于利用非结构化数据。

自然语言处理的药物发现

大多数软件供应商提供的药物研究和发现解决方案主旨是他们处理大数据分析或分子药物化合物的显微镜成像。相比之下,自然语言处理软件可以从非结构化数据源中提取信息,用于当前和未来的药物分子测试,从而丰富药物研究。

NLP应用程序可以从以前的研究文档中筛选出与制药公司的研究比最初发现时更相关的发现。这可能包括制药公司研发数据库中的数字实验室笔记和统计数据。

如果数据科学家使用NLP软件搜索他们正在测试的药物的化学反应,他们可能不再需要进行特定的实验。在这种情况下,科学家会发现他们已经研究了答案,并可以把这些信息考虑到以后的实验中。

制药公司通常会将他们的实验记录和临床试验数据保存到数据库中,以便跟踪他们使用某些药物、分子和化学药品的经验。这些笔记可能是该公司的一位科学家在实验期间或实验后不久写的,其中包括制药行业的术语以及一些口语用法。

NLP软件开发人员需要标记这些文档,并使用它们训练他们的机器学习模型来识别每种文档类型上的不同字段。

临床试验数据,连同医生的笔记,也可以揭示病人的药物不良反应的经验。因此,可以对临床试验报告和电子医疗记录(EMRs)中的数据进行NLP软件培训,以识别这些经验,并将任何相关药物或化合物标记为这些文件中发现的副作用的可能来源。

这就是说,制药公司通常不会访问医院的记录,除非他们有与医院或医疗保健公司某些类型的合作伙伴关系。诸如这样的合作关系可以帮助制药公司可以访问医院的数据并将其标记为培养他们的机器学习模型。这可能导致对更广泛的医学术语,主题和疾病的更深入的培训。

我们采访了阿米尔SaffariAI的高级副总裁BenevolentAI关于人工智能和药物研发的未来。当被问及他的公司是如何消耗所有涉及到新药开发研究的科学文献,Saffari提供关于使用从其他公司,或外部数据数据的以下认识:

一个领域我们公司的重点是机器读取的所有文献,专利和文档。还有的是每天能得到发表的研究大量的。通常,人们认为在科学领域的工作将只专注于一个领域,而不是阅读其他期刊。但有很多,可以在区域,一个人在研究决定通知其他期刊的相关数据。因此,我们的机器读取所有可用的文献和可从该文献中提取事实的数据库汇集在一起​​了。形成我们产生寻找治疗目标疾病的假设的基础。

NLP软件的功能之一是文本挖掘,它在制药领域有一个特别有用的用例。这是制药公司通过NLP引擎运行他们的研究数据库,在数据库中搜索主题、短语和术语的过程。然后,NLP引擎将尝试查找与用户主题相关的所有数据,并将它们作为搜索结果或显示在仪表板上。

制药研究人员可以使用文本挖掘来识别可能导致结果的化学物质或剂量。这可能包括患者在临床试验期间可能出现的任何不平衡,给每个患者的剂量大小,以及每一次给药的频率。

软件供应商为制药研究提供文本挖掘解决方案的一个例子是Linguamatics。公司拥有相当数量的具有该领域学术背景的敬业AI员工。此外,他们以案例研究的形式记录了客户的成功,这些案例研究详细说明了如何使用解决方案以及它们提供的投资回报率。

Linguamatics声称他们的软件I2E可以帮助制药公司搜索他们自己关于不同化合物和实验的研究数据。这使他们的客户能够更有效地获取有关类似项目的信息,以便在与另一种化学物质进行测试之前了解其可能的反应。

下面是来自Linguamatics的一个简短的7分钟视频,介绍了文本挖掘的功能。视频中显示的步骤如下:

  • 1:00:有效地使用搜索引擎和关键字进行文本挖掘
  • 3:23:用软件解释文本的意思
  • 5:10:自动提取相关数据的关键字使用
  • 5:33:比较这两种方法对用户的好处

一个Linguamatics的案例研究指出其I2E软件帮助罗氏制药研究和早期开发更有效地发现新的药物。他们允许罗氏医疗化学家通过内部和外部数据库关于某些化学物质和他们的目标疾病治疗之间的关系数据中进行搜索。

该案例研究还表明,Linguamatics能够帮助罗氏制药开发自己的人工智能平台。罗氏公司将这个平台命名为Artemis,这使得他们能够有效地搜索化学和药理术语。据称,罗氏制药(Roche Pharma)每次搜索节省了1万美元,相当于每年20万美元的全职成本。

用于药物发现预测分析

制药公司也可以使用预测分析来隔离特定的分子,并在治疗疾病和病症,他们正在努力对待测试其有效性。

的预测分析技术的能力,利用过去的药物,分子和研究资产可能已经从过去的药物发现方法中脱颖而出AI软件有一些以前的临床试验是一个很大的因素。AI和数据分析可以利用此以前建立的数据找到以前的化学测试更加深入和相关见解提高效率。

一些人工智能应用被宣传为处理大量药物数据,以识别药物分子的物理和化学特征,这可能有助于预测长期的成功。这些特征可能包括分子之间相互作用的方式,以及分子内的单个原子必须如何配合在一起。

制药公司可以使用预测分析软件来搜索这些关于化学物质和分子的数据点,以找到与被测试物质的相似之处。根据这些信息,他们可以将过去分子的成功或失败与当前分子的使用方式进行比较。这使他们对这种分子的潜在商业价值有了更敏锐的认识。

一家公司可能会使用预测分析来确定一种新发现的药物在临床试验中取得成功的可能性有多大。这将在临床试验之前进行,以便研究人员和商业领袖能够找到最安全的药物进行测试。这将有助于预防药物的副作用,并通过选择最有可能成功的药物来推动销售。

这将基于过去的临床试验记录,这些试验涉及的药物与正在测试的药物具有类似的化学组成,以及用于治疗相同疾病的药物。

预测分析也可以受益于从外部来源训练数据。这包括有关患者的免疫系统和肿瘤学的历史,特别是对癌症研究的企业信息。除了与医院或医疗保健公司建立合作关系,制药公司可以通过从他们的临床试验中收集它获得这种数据。此外,他们还可以购买获得了供应商的数据库,进一步丰富自己的训练数据。

我们采访默利·阿拉瓦马当的创始人兼首席执行官Qrativ生物技术,关于AI的药品的可能性以及如何进行外部数据流可以帮助药物发现。当被问及关于医疗领域的挑战或已经看到了相当多的嗡嗡声,阿拉瓦穆丹说:

所以我们认为免疫系统是很多疾病的一个组成部分。许多免疫系统疾病都有来自肿瘤数据集的信号。所以我们很兴奋能将这些免疫系统信号应用到精确的神经学或精确的眼科。我们可以想到各种各样的情况,它们都可以受益于精准医疗,而不仅仅是肿瘤学。

为了使预测分析在分子水平上对制药公司有用,可能需要其他技术来促进数据收集,从而训练机器学习算法来获得关于微观物质的数据。人工智能供应商Xtalpi试图通过结合预测分析和基于云的高流程计算来解决这个问题。据称,他们还利用量子物理和化学来帮助精确分析这些数据。

下面是来自Xtalpi的一个图表,它突出显示了他们的工作流程的各个阶段,以产生准确的预测。这些测试包括对被测分子的分析,对已知药物晶体结构的有针对性的搜索,根据有用性列出和排列这些可能性,以及测试分子在室温下的行为:

Xtalpi声称他们的软件可以帮助制药公司找到生产药物的最佳形式,比如药片或眼药水。该客户公司还声称,这有助于药物开发的后期,他们将决定如何大规模生产和包装的药物。

这种预测分析解决方案还可以提供这种信息驱动的临床试验成功的目的。它也可以帮助抵御制药公司分子上的专利挑战。

Xtalpi公司为制药公司提供的解决方案被称为“晶体结构预测”,因为据说它可以辨别药物在分子结合时形成某种类型结晶的可能性有多大。他们在自己的网站上列出了四种已经通过晶体结构预测进行测试的药物,每一种都有一个附带的案例研究来说明该软件的预测。

然而,这些案例研究没有提到任何制药客户的名字,而是关注于软件可能从一个潜在药物产品的单一样本中产生的大量数据。

每个案例研究包含H键受体,或原子的药物的数目在分子中或化合物与氢罐那个键。它们还显示该药物是如何容易形成使用所涉及的原子的化学反应和密度的所观察到的能量某种类型的晶体结构的。

AI用于盐和变形测试

药物研究和开发的一个重要步骤是确定药物化合物在水和其他液体中的溶解度、一旦变成固体的结晶形态以及一旦结合在一起的结构的稳定性。盐和变形测试或“筛选”是选择最佳物理形式来生产和分配药物的过程。这也有助于确定药物在过期前能维持多久。

制药公司可以使用机器学习和人工智能应用程序在多个层面上促进这一过程。预测分析应用程序可以找到关于药物分子晶体结构的任何现有数据,从而让用户了解药物在显微镜下以药丸的形式呈现时的样子。这将帮助他们确定一旦以这种方式结合,分子是否仍然有用,或者如果以不同的方式处理,活性成分是否会有更好的反应。

在药物研究设施的数据科学家可以能够预测盐或多晶型使用机器学习筛选的结果,从而能够开始前,以增加该药物。这使得科学家能够有效地“跳过”他们最初曾计划采取却发现答案已经他们的数据库中已有的研究步骤。

不过需要注意的是,这将是难以实现的,而不在数据科学或对不同类型的药品信息之间的关系的专家是非常重要的。这是因为,如果一种药物研究员不熟悉不够与机器学习技术的聚集,他的公司的数据,他们将不能以任何有用的方法来使用它。我们采访了格兰特韦尼克的首席执行官和联合创始人了解发动机关于这个问题。

在我们与他的采访, Wernick强调了在任何数据科学环境中主题专家的重要性。当被问及不熟悉人工智能软件的行业专业人士面临的挑战时,韦尼克说:

所以今天,我们一直生活在“把它放在某个地方,就放在某个地方,然后我们会找到答案”的世界里。“事实是我们把它储存在某个地方,我们将能够对它做些什么。”然后人们开始意识到,‘好吧,现在我们有了它,我们能用它做什么?这是一个巨大的人才缺口。在我工作过的每个组织中,都有一两个人是真正深入挖掘数据的人,团队中的每个人都想要访问这些数据。他们的想法。这些人通常是领域专家。我生活和呼吸在安全和IT,你有谁是可怕的安全,但他们并不总是有技术印章的各种不同的组织可能带来的产品。

Tessella是数据的科学顾问它提供AI和数据的科学解决方案,用于药物开发和制造。他们声称他们的软件可以帮助帮助他们的客户开发的机器学习模型,他们是专门研究更快地开发药物治疗。

根据一个案例研究在他们的网站上,Tessella声称他们帮助葛兰素史克(GSK)促进和改善他们的盐和多形态筛选新药物化合物。Tessella与GlaxoSmithKline合作建立了一个机器学习模型,自动化液体混合、固体分配、加热、冷却、摇动和样品运输。

用户可以在软件中输入有关筛选的详细信息,从而为每个实验制定总计多达400份的协议。这包括正确的溶剂类型,以混合药物,以及反离子,可能造成的过程中的风险。然后,该软件将根据用户确定的化学品的纯度和溶解度,确定要分发的正确剂量。

该系统收集的数据,例如拉曼光谱,X-射线粉末衍射(XRPD)图案,和筛选期间光学显微镜图像。GSK然后处理该数据,以找到这些化合物的多晶型形状。然后,该软件可以提出所有这些实验为一体的数据点的数组。这使用户能够可视化的趋势和各实验之间的比较结果。

该案例研究还指出,新的自动化筛选过程推动了一致性,以确保所有的测试方法和结果都可以被复制。这也减少了样品中的交叉污染。GSK的新工作流程还让他们看到了公司支出的减少,取消了手工记录,并集中了新的研究数据。

标题图片信用:药物Attourney

保持在AI曲线的前面

发现关键的AI趋势和应用,在企业的未来和输家独立的赢家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
机器学习曲线保持领先

在Emerj,我们拥有最大的关注人工智能的在线商务读者群体——加入其他行业领袖的行列,每周收到我们发送到您收件箱的最新人工智能研究、趋势分析和访谈。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。