人工智能的临床试验在制药-目前的应用

尼科洛·梅希亚
头像

尼科洛是一个内容的作家和初级分析师Emerj,既开发Web内容,并与定量研究帮助。他拥有学士学位的写作,文学,出版从爱默生学院的学位。

盖1280×640

AI应用在自动化流程临床试验是最突出的AI应用为中医药行业。AI厂商目前提供的软件,使制药公司能够充分利用其科学家的笔记关于他们的未来试验数据的科学项目。此外,有一些应用发现病人进行临床试验时帮助企业划分客户,为便于浏览群体。

在这篇文章中,我们将介绍最突出的AI软件厂商为制药公司开发,以帮助他们规划,实施和审查临床试验。我们记公司在其软件实际使用AI和讨论可能需要如何医药数据最有效的实施做好准备的可能性很高。我们涉足的应用程序如下:

  • 用于临床试验规划和设计的文本挖掘:应用寻找过去的审判信息,告知当前的试验设计。
  • 匹配患者临床试验:自然语言处理(NLP)的应用程序,用于提取患者数据和患者临床试验匹配。
  • 临床试验设计和优化:应用程序设计的临床试验,如遗传聚类预测分析。

我们将与探讨文本挖掘的临床试验中的应用开始:

文本挖掘的临床试验规划和设计

制药研究团队经常回顾过去的临床试验数据,以了解他们如何改进未来的临床试验设计。人工智能软件可以通过聚集所有数据并优化关键字搜索来帮助解决这个问题。此外,人工智能应用于临床试验设计可以创建可视化的趋势发现整个临床试验数据。

自然语言处理(NLP)的软件能够与该技术可能能够临床笔记中识别单词和短语的临床试验数据特别有用。这将使研究小组找到临床信息是更符合他们当前的项目比它首次被发现时。这些信息可能是数字实验室记录,统计,或从一家制药公司的临床试验数据的数据库剂量信息。

决定哪些药物测试和实验行为时,这种类型的解决方案具有节省时间的潜力。用NLP的解决找到与给定的药物相关可以实现他们并不需要进行实验的每个化学反应笔记的数据科学家。

这可能是因为他们在过去发现了重要的信息,可以用来指导进一步的实验。另一种选择是,如果没有其他顾虑,这种发现可能会促使该公司对给定的药物进行临床试验。

实验室笔记和临床试验数据通常被保存在一个特定的数据库用于跟踪的制药公司的实验与某些药物,分子和化学品。这是由该公司的科学家们,而他们正在做实验写的。他们通常还包括医疗保健和医药术语和一些口语。

为了确保一个NLP的软件解决方案可以识别这些类型的单词和信息,软件开发者必须标记每个组的实验笔记。然后,他们使用该标签的数据给机器学习模型火车背后的软件认识到每种类型的文档的单独的领域。

NLP软件也被训练上电子病历(电子病历)除临床试验报告,以找到患者对药物反应的信息。这种类型的软件可以识别笔记关于病人的经验,并标记可能已在响应中发挥了作用,任何相关的化学品。与临床试验数据一起利用电子病历的数据可以帮助制药企业认识到任何不良影响他们的药物可能有。

这就是说,制药公司通常没有从医院或医疗保健机构以外的他们可能有任何合作伙伴访问记录。这种类型的合作可以帮助制药公司进入医院的数据,并进行标记,使用他们的训练机器学习模型。这使得更多的医学术语和重要的主题,如疾病和药物的不良影响更广泛的培训。

我们采访了阿米尔SaffariAI的高级副总裁BenevolentAI,关于人工智能的未来药物发现我们问他的公司是如何将所有涉及到新药开发研究已发表的科学数据。Saffari强调他的公司的记录,整个研究团队之前的数据到他们的数据库已经读完它的过程:

一个领域我们公司的重点是机器读取的所有文献,专利和文档。还有的是每天能得到发表的研究大量的......所以我们的机器读取所有可用的文献和可从该文献中提取事实的数据库汇集在一起​​了。形成我们产生寻找治疗目标疾病的假设的基础。

在这里,Saffari显示了使用通过他们的机器学习平台上运行所有这些信息的。每天发布新的临床数据量太大,他的公司跟上,但他们的软件可以据称组织数据,因此它可能仍尽管不便加以利用。

当他的公司选择最好的病人来测试新的治疗方法时,他们将团队的知识与他们大量的汇总数据相结合。文本挖掘是NLP软件的一种功能,它对临床试验的规划有很大的帮助。文本挖掘是通过NLP软件运行数据库,在数据库中搜索单词、短语和一般主题的过程。

然后,NLP软件将找到与用户期望的主题的所有数据,并列出点作为搜索结果或通过用户的仪表板。研究人员可以使用文本挖掘软件发现可能的临床试验的结果,促成化学物质失衡或剂量的证据。这可能包括在每个患者的剂量和预先存在的化学物质失衡的频率。

Linguamatics是为制药公司提供文本挖掘解决方案的NLP软件开发人员的一个例子。他们的团队中有相当数量的AI工作人员,他们也有AI方面的背景。他们通过案例研究来记录客户的成功,展示他们的软件是如何使用的,以及软件带来的好处。

该公司声称,他们的文本矿工I2E帮助制药企业和组织通过过去的化合物和实验研究数据进行搜索。这将允许客户对类似项目的访问信息,以获得更好的的他们如何与另一个测试前的化学反应可以理解。

下面是从Linguamatics文本挖掘的一个简短的介绍视频。以下是在演示步骤列表:

  • 1:00:有效地使用搜索引擎和关键字与文本挖掘
  • 3:23:解释经文的意思
  • 5:10:有关使用的关键字提取数据
  • 5:33:比较这些方法

根据Ling​​uamatics之一实例探究他们的I2E软件帮助阿斯利康解释来自研究和临床试验的数据,以“找到高价值的信息”。这指的是案例研究中详细的两个例子。

第一种方法涉及识别为不是“盲”或“开放标签”临床试验的状态,当患者之间的不同剂量。这意味着,一些试验混淆这名患者接受该药物或剂量水平,和其他人没有。

第二个涉及后续临床试验,或延伸超过原来的实验窗口,并专注于少数特定的患者试验期间持续剂量的持续时间。查找这些信息可能是在预测长期暴露于有问题的药物治疗的效果有帮助。

案例研究指出阿斯利康公司的研究人员能够一次处理多达三个变量来搜索特定的查询。这是阿斯利康通过所有的临床资料的搜索,从它最有价值信息的能力至关重要,据称。然而,需要注意的是案例研究并没有提供任何数字统计指着阿斯利康有关I2E投资回报率是非常重要的。

匹配参与者临床试验

在制药企业领导人可能受益于人工智能软件来帮助他们满足患者根据医生的笔记和过去的试验临床试验。这种类型的自动化的有显著减少在获得药品市场摩擦的可能性。

NLP软件是目前针对此问题最常见的解决方案,因为该技术能够确定根据病史和病人档案试验最适合的病人。寻找合适的患者有它自己的挑战,但NLP的软件可以提高企业如何处理它们。

以下四个方面的挑战反映的问题类型这些应用程序可能可以解决:

  • 保持患者安全的个人信息,同时处理他们的病历
  • 认识到国际疾病分类(ICD-10),以确定哪些疾病在给定文档中所讨论
  • 识别与他们在过去已经尝试药物不良影响病人的经验
  • 利用非结构化数据,以寻找有关正确的见解患者

一些患者的个人信息可能受到法律或事先协议的保护,因此不能以将这些信息与个人联系起来的方式披露。很少有供应商将此作为其价值主张的一部分来提供解决方案,但是一些供应商声称能够混淆这些信息。

这将允许制药公司,同时还利用其临床和医疗信息隐藏任何身份信息。这是可能与可视化,如不详细个别患者,但建立相关的统计图表。

ICD-10编码是最重要的细节中确定病人如何可行的是临床试验时。每个标准化代码表示一个可能的疾病,疾病或损伤的患者可有或以前了。

需要对用于试验匹配的机器学习模型进行培训,以识别与每个患者相关的ICD-10编码,并确定它们与被测试药物的关系。这可能包括损伤或疾病是如何持续的,例如操作重型机械造成的损伤或长期暴露导致的肺部疾病。

确保正确的患者选择了一个临床试验作出的一个重要因素是他们与药物不良影响的历史。患者可能不太可能很好地回应,如果他们的病史表示从药物具有相似成分的不良副作用被测试的药物。成功可能性低的其他指标都被做了治疗同一疾病的药物被测试药物的不良反应。

为了从这种类型的文件格式中提取信息,该软件背后的机器学习模型将需要从这些文件医药数据训练。软件开发人员将需要标注每种类型的文档的每个单独的领域。然后,他们将通过与所有的ICD-10编码沿模型运行的临床试验报告数以万计。

这将逐步训练机器学习模型检测哪些字段包含哪些信息类型的能力。这包括文件中提到的任何疾病的分类。

Deep6 AI这家企业声称能够隐藏患者的敏感数据,同时它们匹配的临床试验。他们提供,据称检测与患者包括症状,诊断过去,基因组学,或测试结果相关联的个人特质NLP软件。

下图是Deep6人工智能网站的一张图表,列出了他们的解决方案的好处:

Deep6 AI的价值主张

他们还声称他们的软件可以帮助客户找到更可行的患者每个临床试验比他们通常会。这是由他们的证明案例分析报道他们与Cedars-Sinai研究所的项目。案例研究表明,他们帮助Cedars-Sinai心脏研究所改进了一种名为乌地那非的药物的临床试验匹配过程。该药物是为患有罕见先天心脏缺陷的患者而研制的,而且Cedars-Sinai很难找到两个以上的患者来进行这项研究。

西奈据称使用Deep6 AI群体构建工具。这是用于组织和从数据库中识别患者简档的应用的类型。案例研究指出客户公司能够确认的19名新发现病人16资格乌地那非审判。Deep6 AI理赔过程用了不到一个小时。但是,目前还不清楚,如果这是表明大多数客户体验。

临床试验设计和优化

在临床试验中的另一个用例AI是的惯例,程序,测试方法,并在每个试验测试变量的设计和优化。AI解决方案可能能够分析病人概况和病史,以确定哪些患者将不得不对药物的最佳反应被测试。试图匹配患者的试验和扩大试验,以便更可行的患者时,这可能会节省医药企业一些时间。

预测分析应用程序可以与遗传聚类实现这一点。这是过程,通过该AI软件段客户基础成反映反应良好药物的每位患者的机会更小的组。

制药公司还可以将试验参与者的病史纳入基因群。这是因为也有一些解决方案可以让制药公司在试验期间发现某些药物可能存在的副作用。

例如,患者可以具有与已知具有与所述一个被测试的易失性反应的药物的历史。同样,另一种,患者会增加他们对药物产生负面回应的机会过敏。

预测分析解决方案也可用于确定和建立临床试验的最佳实践。这是基于在过去试验中采取的步骤,因为它们在公司过去试验数据的数据库中有所体现。这些文件包括有关临床试验操作、程序以及公司是否认为试验成功的信息。

然后另一个AI应用程序可以通过这些数据的运行与成功的不同水平的试验中发现的类似试验或情况的实例。这使得企业领导来比较他们的新计划与可能不是成功的为同类型药物的一个操作的审判。

一个企业领导人还可能会发现一种新的方法,以临床试验,他们可能希望采纳。一些预测分析解决方案将确定过去和当前用户试验之间的相似之处。其他人可能会允许用户创建,可以说明他们清楚的预测模型。

也许最重要的是临床试验是找到信任的指标,显示该药物将履行在发展中处理的市场需求。制药公司可能希望使用数据分析软件,以了解市场的需求和医生如何可能被规定他们的药物。这可以用EMR数据,医生的笔记数据和销售数据来完成。

以下是从AI厂商Dataiku一个示范视频。这表明他们DSS平台如何帮助数据科学家预测医生的处方。我们发现这一过程,他们在这里列表中最重要的部分:

  • 0:00 -为他们想要创建的预测寻找必要的数据集。
  • 2:30 - 这个分析实验,结合数据的目的找到任何矛盾或incongruencies。
  • 6:30 - 用户如何联合数据集和“清理”他们之间的任何incongruencies。这项工作需要的用户,以确保所有的医生ID号的出现准确或找出为什么特定的一些可能会丢失。
  • 8:25 - 用户填充所有相关数据到一个表。在这里,他们可以找到可以合并成一个单一的一个较少的颗粒分类行。
  • 在9:58 - 把所有的清洁和组织的数据,利用其产生的预测模型。

正如视频所解释的,重要的是,制药公司了解如何准备和清理自己的数据,机器学习模型。为了按预期的AI应用到工作中,机器学习模型背后必须在被正确标记,编辑有较少的冗余或不一致之处,并组织了该项目的相应的分组数据进行训练。

我们采访了Madhusudan协噶尔的首席布道者亚马逊网络服务,关于确定公司的最佳AI应用领域。当我们问他关于他如何强调自己的客户数据清洗和组织的重要性,解释协噶尔,

当业务在数据组织方面面临挑战时,我们开始查看数据湖,以确定什么是干净的数据,什么是不干净的数据。一旦数据被清除,业务现在就有能力处理它。将数据放在单个空间中,并在开始构建和报告时定义模式。

机器学习,所有它是著名的凉意,第一个是关于数据的。在机器学习工作的百分之八十获取数据组织,层次分明,值得信赖。因为现在的机器会为你做决定。

是协噶尔在他的声明中,大部分的工作来获取一个AI应用程序的运行直接进来准备,清洗,并利用数据来训练机器学习模型。这是因为一旦训练完成后,AI应用程序可以在自己的工作,将不再需要从雇员恒定的输入。

当我们搜索出一家医药公司的任何类型的数据分析软件,用于临床试验的成功案例我们的研究没有取得任何结果。有些人可能会认为这是一个标志使用情况相对新生的比别人本文中介绍。但是,我们有信心提供这样的解决方案的公司有些可能会真正使用AI。

标题图片来源:中国营销

subscribe-image
机器学习曲线保持领先

在Emerj,我们有AI-集中的商业读者最多的观众在线 - 加入其他行业领导者和接收我们的最新人工智能研究,趋势分析,并将其发送到您的收件箱周刊的采访。

感谢您订阅的Emerj“AI优势”的通讯,检查你的电子邮件收件箱进行确认。