自然语言处理中药房 - 当前的应用程序

尼科洛·梅希亚
头像

尼科洛是一个内容的作家和初级分析师Emerj,既开发Web内容,并与定量研究帮助。他拥有学士学位的写作,文学,出版从爱默生学院的学位。

自然语言处理中药房 - 当前的应用程序

自然语言处理(NLP)似乎看到制药较少使用比AI作为这样的方法机器视觉预测分析,但仍然有在制药NLP几个应用程序。业内人士大多涉及与结构化数据,但在某些业务领域,非结构化数据是常态。在这篇文章中,我们将讨论语言是如何处理自然可以帮助制药公司使他们的非结构化数据的意义,并用它来做出决定。

制药公司很可能自己的类型化,因为在确定参加临床试验的患者的合格有用的各种数字格式的非结构化数据。最常见的格式如下:

  • 医生手记
  • 病理报告
  • 操作说明
  • 电子病历(EMR)数据

我们详细介绍了NLP可以帮助制药公司的研发团队进行梳理的方法临床试验文件和电子病历,以及完善加快临床试验的周转时间与更好的病人匹配。我们还展示了如何用NLP挖掘非结构化数据可以帮助医药营销团队富有吸引力的活动。我们讲解每个用例,并通过大型制药公司与AI厂商的经验,探索它。

在本文中涉及医药行业的NLP的可能性如下:

  • 发现新的药物化合物
  • 匹配参与者临床试验
  • 销售药品

有关Emerj在医疗卫生和农业有关AI的讨论参与的更多信息,请阅读我们的内容导致的在经验镍钛Aayog-ORF AI的所有会议。我们在医药行业的NLP软件的可能性概述开始药物发现:

NLP发现新的药物化合物

药物发现是一个许多软件供应商提供解决方案的业务领域,但他们中的大多数声称涵盖大数据分析或药物化合物的分子成像。然而,NLP解决方案并不与该领域的其他应用程序共享许多用例。

相反,该技术更适合于在非结构化数据中检测信息,从而促进药物发现过程。这可能包括从以前的研究文件中提取信息,以找到过去化学实验的笔记和结果。

例如,一家制药公司的科学家可以使用NLP工具查找以前发现的化学反应,找到他们并不需要,因为结果是已知的进行给定的实验。然后,科学家可能会重新评估进一步的实验与所有相关的知识因素。

过去公司测试某些药物或分子的经验被保存为实验室记录数据或临床试验数据。这些文档通常是由一个人使用公共语言编写的,其中包含了制药术语。开发人员需要在这些文档的标记版本上训练机器学习模型,以便能够“学习”识别单个表单中不同字段之间的差异。

我们采访阿米尔Saffari, AI at的高级副总裁BenevolentAI, 关于AI会如何影响在不久的将来药物研发。当被问及从大量的科学文献,怎么他的公司发现这么多的信息,Saffari说,

在自然语言处理,数据的两个流都可以使用。一种是结构化数据,其中数据库用于特定用途的情况下创建和人类谁扫描文献,进行实验和填充这些数据库策划。你可以把所有这些在一起并在形式,是可以解决的,并易消化人类提取相似类型的信息。也有对这些数据的顶部的机器学习算法,以已在扫描文献或数据源已发现的网络的那些关系的整体建模。这些模型可以开始产生假设或进行推论,我们可以采取的实验室和测试。

一个单一的模型可以在多种类型的形式以及作为信息来自每场或形式的类型进行训练。

药物不良反应在临床试验中,并在定期看医生通常报道。由此可见,机器学习模型将需要以从中识别信息,临床试验报告和EMR数据进行培训。任何不利的影响可能会被标记为这样,以指示哪个药物很可能的副作用。

化学和剂量信息可与NLP软件通过一个名为文本挖掘过程中被发现。研究信息数据库是通过一定的主题,短语和为其选择的搜索词NLP引擎运行。该软件将尝试找到与用户所需的主题所有的数据点和它们作为搜索结果或可能通过分析仪表板。

下面的短,7分钟的视频,从AI厂商Linguamatics提供文本挖掘和其功能的介绍说明。是的Linguamatics’解释的部分如下:

  • 1:00:搜索引擎和关键词
  • 3:23:解释经文的意思
  • 5:10:自动提取相关事实
  • 5:33:比较两种方法

人工智能供应商Linguamatics其中一家公司提供了一种名为I2E的NLP文本挖掘解决方案,他们声称可以帮助制药和生命科学公司搜索关于不同化合物的信息。这有助于制药科学家快速检索有关类似分子化合物的信息,以便在对它们进行测试之前了解它们可能如何反应。

根据一项案例分析通过Linguamatics,该公司能够帮助罗氏制药的研究和早期发展,加快他们的药物发现过程。他们让医疗化学家罗氏通过“内部和外部数据库”来搜索信息,这样做关于化学物质和疾病之间的关系,他们打算药物治疗。该软件允许罗氏科学家与一个,两个或三个这些类别汇总其相关化学信息的输入查询。

Linguamatics帮助罗氏公司开发自己的AI平台使用I2E称为耳忒弥斯,这使得制药公司能够更容易地搜索化学和药理学方面。该解决方案据称保存罗氏每次搜索$ 10,000根据每年$ 200,000全时当量成本。

将参与者与临床试验相匹配的NLP

临床试验匹配是NLP在制药行业的另一个用例。从医生的笔记和过去的试验中找到合适的临床试验患者是很耗时的,但可以通过针对这类文件的人工智能软件来实现自动化。来自人工智能供应商的常见解决方案是NLP程序,它可以从患者文件的扩展列表或数据库中识别出最适合给定试验的患者。

除了它需要临床医生团队完成了多久,匹配患者适当的临床试验造成了一些关键问题,以制药企业。每一个列表如下:

  • 检测和识别疾病和伤害的国际疾病分类(ICD-10)代码
  • 从各种非结构化数据源提取重要数据点
  • 利用病人的数据,同时保持他们的隐私和隐藏受保护的信息

ICD-10代码是必要确定用于临床试验的患者的存活率。这些代码规范几乎每一个可能的疾病,疾病或损伤的患者可从患有或从过去所遭受的。临床试验了匹配的机器学习模型将需要通过训练来识别与患者相关联的ICD-10代码及确定其是否密切相关的药物被测试。

从这些格式中识别信息将需要一个机器学习模型来训练在相同类型的文档中发现的药物数据。开发人员需要在每种类型的文档中标记每个特定的字段,并通过模型运行成千上万的报告,此外还需要运行每个ICD-10代码。

这将允许得到的软件能够检测哪些字段持有哪些类型的信息,以及任何疾病,该文件可参考分类。

有些患者数据可通过法律或协议的保护,不能在将链接的信息反馈给个人的方式,不得泄露。并不像很多供应商提供可以专门处理这样的情况下的解决方案,但一些声称能够混淆了信息的保密条款,同时还提供了有益的启示。这可能是可能的不详细,具体患者或医生,但包含相关统计图表或其他可视化。

一个声称能够在将患者与临床试验进行匹配时保护患者数据安全的供应商是Deep6.ai。该公司提供NLP软件,据称可以检测与个别患者相关的特定特征,如症状、过去的诊断、基因组学或测试结果。他们声称,该软件可以帮助客户在更短的时间内为每个临床试验找到更多的患者。

下面是Deep6.ai的网站,详细说明实施其解决方案的好处提出的图形:

深6 AI的价值主张
深6 AI的价值主张

在一个视频从Deep6.ai,克莱夫Svendson,主任,行长再生医学研究所的董事会在西奈雪松谈到实施NLP软件后,他的公司提高效率。至于Deep6.ai的解决方案,Svendson说,

Deep6的进入电子病历中,选择信息几乎是瞬间,并放在一起千术的列表,然后钻下来到30或40的审判能力将在这里节省医生的大量时间。这就是为什么对我们这么精彩。

Deep6.ai出版了案例分析在他们声称已经帮助了雪松 - 西奈心脏研究所提高了查找符合条件的患者对一种叫做乌地那非药物研究的过程。该药物是用于治疗那些天生具有特定心脏缺陷的化学抑制剂,和西奈已经只有Deep6.ai工作之前发现两名患者为研究对象。

根据该案例研究,西奈使用Deep6.ai的“队列制作工具”或应用程序的组织,并从数据库中识别患者。该公司是据称能够识别19例患者,然后对其进行验证的16资格乌地那非审判。Deep6.ai声称这个过程用了不到一个小时,虽然它是不明的,如果是的平均时间,这将需要企业的领导者在类似领域的精确表示。

用于药品营销的NLP

我们已经报道了AI应用程序医药营销和销售详细过去,但我们的研究已取得的NLP应用的显着较小的量这一业务领域。尽管如此,还是有很多的营销和销售机会非结构化客户数据中找到。由此可见,NLP仍然是解决对医药产品的营销或销售问题的可能性。

最常见的业务问题,这些问题的NLP软件解决方案可以解决在医药营销或销售团队有:

  • 评估周边产品的社会化媒体的嗡嗡声,并确定个别职位的情绪
  • 利用客户或病人的资料来发现个人或人口统计中的机会价值
  • 从销售电话记录中分析呼叫中心的数据

分析社交媒体上的帖子,了解它们的情绪,以及它们与某一特定药品的关联,这需要训练机器学习模型,在与该产品相关的时候,将各种单词、短语,甚至可能是网络俚语贴上正面或负面的标签。一些句子片段也可以标记,以便对上下文进行更具体的解释。

这将允许该公司将社交媒体对广告或产品的反应聚合为单个数据点,这些数据点可以用来评估营销活动的表现。

客户和病人信息可以包括从CRM数据,根据他们以往的购买匿名电子病历(EMR)数据,或交易数据。一个NLP的软件可以检测患者或客户的历史与广告,药品或其他产品,并聚集与那些在其人口的其他方面的经验。这可以通过显示哪些领域可能需要在未来更好的策略的客户团队积极地影响营销活动。

销售呼叫中心的数据可能被存储为销售电话的音频记录,可以通过语音识别软件进行处理和识别。NLP的这个应用程序在创建EMRs和其他数字转录的医疗文档方面有很多用途,但是在这里它可以用来识别客户的参与和销售代表对销售协议的遵守。

AI语音识别软件需要尽可能多的不同声音,尽可能使用各种语调和不同水平的背景噪声的培训上。这样的模式可以更容易地辨别电话说如果有任何干扰,而销售代表与客户的话。

对于药品营销和销售解决方案将需要比其他行业更全面的数据标签和准备过程,是需要特别重视。这是因为制药需要机器学习模型对个别医药短语和代码不拿出其他行业的培训。

我们采访Gunjan巴德瓦杰关于的挑战生命科学公司面临在AI的年龄数据和人才方面。在谈到他对制药数据无需成为情境感知AI见解声明,巴德瓦杰说,

在生命科学和制药,这不是英语的数据说话。这不是法国人是不是德国这不是西班牙语。这是医疗或医药的英语。有域,我们所说的metaontology的语言。涵盖这个世界的心脏除颤器,基因本体,途径中,生物标志物metaontology。所有的生物医药概念及其关系定义。除非系统讲该域的语言,你可以不理解上下文[中]东西说。

Eularis就是这样一个公司,提供NLP软件,医药行业销售的目的。他们列出默克,诺和诺德和Shire制药为过去的客户,并要求大数据的软件也可以解析店。他们的NLP的解决方案据称可以以多种格式处理各种非结构化数据。

该公司声称,他们的软件也可以分析社交媒体数据,虽然这个应用程序是否使用情绪分析没有明确说明。

下面是一个形象,凸显了拥护使用Eularis’软件的好处:

Eularis的价值主张
Eularis’的价值主张

根据一项案例分析在Eularis’的网站,该公司帮助一家医药公司预测多少自己的品牌正在共享围绕社会媒体和观众反应到新的广告。Eularis据称用于情绪分析作为其NLP溶液以评估至客户端的广告肯定或否定响应的一部分。

Eularis帮助该公司利用其社交媒体数据来衡量他们的市场份额和销售,以及哪些变量是对顾客选择他们的品牌影响最大的未来。本据称可以计算出有多少品牌收入收集数字营销的结果。

客户公司的案例研究指出,能够看到他们的社交媒体营销活动如何影响销售和品牌声誉在每个国家他们的产品在哪里销售/他们还发现更多的信息关于影响客户选择他们的品牌和他们如何可以改变他们的营销行为来提高品牌的选择。

然后,客户公司都无法自圆其说增加他们的数字营销预算,因为他们发现提高了在这一方面是为改善品牌结果的直接原因。

标题图片来源:谈话

艾曲线保持领先

发现关键的AI趋势和应用,在企业的未来和输家独立的赢家。

订阅“AI优势”简报:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
机器学习曲线保持领先

在Emerj,我们有AI-集中的商业读者最多的观众在线 - 加入其他行业领导者和接收我们的最新人工智能研究,趋势分析,并将其发送到您的收件箱周刊的采访。

感谢您订阅的Emerj“AI优势”的通讯,检查你的电子邮件收件箱进行确认。