文档搜索和发现中的AI功能范围

丹尼尔Faggella.
《阿凡达》

Daniel Faggella是Emerj的研究主管。在联合国、世界银行、国际刑警组织和领先企业的呼吁下,Daniel是一位全球广受欢迎的专家,研究人工智能对商业和政府领导人的竞争战略影响。

文档搜索和发现中的AI功能范围
这篇Emerj Plus的文章已经在有限的时间内公开。
解锁我们的完整图书馆使用案例和AI策略最佳实践,访问Emerj +

过去的三年AI机会景观研究,我们已经在AI生态系统中检查了许多广泛的能力,从计算机愿景到对话界面到异常检测和超越。我们最早的客户研究工作中的一些专注于后台自动化 - 主要是金融服务和医疗保健 - 它与一系列供应商,用例和应用AI用于文件搜索和发现的机会带来了面对面。

在本文中,我们将分解我们最近分析金融服务业的文件搜索和发现供应商之一的一些课程 - 并探索其一些能力。最后,我们将研究一些关键因素,以便在这些应用程序提供业务价值。

为企业领导人对AI使用情况有兴趣,本文将突出显示AI可能为白领工作流添加价值的一些唯一区域 - 以及供应商选择的帮助。

对于AI供应商和服务提供商,本文将重点介绍在交付客户价值方面的一些最重要的因素,并且应该用于为搜索和发现应用程序确定产品路线图思想的优先级。

我们将首先对文档搜索和发现中包含的功能的细分。

文档搜索和发现用例

启用AI的文档搜索和发现可能是最好定义为基于AI的应用程序,允许企业用户查找正在寻找的文档或数据。这是非常开放的,可以应用于无限数量的潜在用例或工作流程。“搜索”和“发现”具有不同的含义,但驱动相同的一般目标:

  • 搜索-寻找具体的东西,找到它。例如,如果是银行客户服务代理正在寻找有关金融产品的特定信息,需要快速查找该产品的所有可用信息,AI可能用于搜索产品名称或详细信息,并提出对客户特别相关的模块或细节。
  • 发现-寻找模式、联系或“类型”。例如,采购专业可能培养一个人工智能的解决方案与数以百计的不同的采购合同内条款的例子,然后火车AI系统手动标签公司的整个语料库成千上万的合同——标签基于哪种条款包含在每一个。语料库的这种丰富程度将使采购专业人员能够“发现”哪些合同具有特定的条款类型——或者公司认为是危险的条款的可能组合。

这些种类的应用可以帮助公司削减完成特定工作流程所需的人数,它们可能会提高客户满意度(通过寻找所需的信息更快,不必将客户放在持有人身上),或者他们可能有助于降低法律风险(与上述采购合同示例一样)。

感兴趣的读者也可以通过浏览我们的行业和特定于这个主题的用例文章获益:

在以下两个子部分中,我们将探讨文档搜索和发现横跨文档的功能范围,以及解锁值中涉及的关键元素,并在业务环境中使这些应用程序中的大多数应用程序:

文档搜索和发现供应商的功能和差异化

一些能力比其他功能更具挑战性,以建立,维护和交付企业。下面,我们列出了一些基于AI的搜索和发现供应商采用的功能,由其相对差异级别的估算值:

能力类型1:OCR.(例如,将物理发票和全部非文本文件转换为具有含义的数字文本)

  • 分化水平:高的
  • 原因:光学字符识别(OCR)非常努力。多年来未来,将有纸质文件,PDF,图像文件和其他流入银行的完整非结构化文件 - 文件中,银行没有控制的文件,以及处理这些用例的系统将处于强烈需求。

能力类型2:平台内部搜索(例如,用户通过您的平台加载他们的新数字文档)

  • 分化水平:中高档
  • 原因:作为客户公司的“门”的数据集成,是强大的定位,并使使用使用。这允许公司不仅仅是一个搜索工具,而是公司依赖于理解和审计/协调其数据的东西。

能力类型3:内部搜索(例如,用户不会通过你的界面加载新文档,而是使用你的界面搜索)

  • 分化水平:中低点
  • 原因:对于已经完全的数字数据,启用了AI的搜索程度较低。访问此数据比公开数据更难,因此只有获得访问该内部数据的公司,只能找到具有内部搜索应用程序的价值,这是一个具有竞争力的护城河。

能力类型4:外部搜索(例如,从Web刮擦/提取财务数据)

  • 分化水平:低的
  • 原因:搜索次要或公开的数据(请参阅:AI用于媒体监测)很容易,任何筹集资金的初创公司都可以获得这些数据,并能够应用最先进的算法从中获得价值。

应该注意的是,上述“差异”的梯度也是难度的梯度。更差异化(即可防止的)商业模式或定位也难以构建。这并不是说企业买家如果不需要它应该寻找OCR - 但从供应商生态系统的角度来看,OCR与文档搜索和发现是罕见的,非常具有挑战性。

搜索的绝对最简单的信息是在公共数据中刮擦和查找模式(我们所说的是什么外部搜索),虽然是ICR门户网站,即银行内所有数据的网关和存储系统是巨大的难以实现的,但它也是一个大量强大的位置到达。我们将探讨这些见解在下面的建议部分中的应用。

文档搜索和发现的价值驱动程序

文档搜索和发现应用程序的价值不在代码中,也不是在实现的技术细微差别中,而是使用前期思考设计数据标签和本体,这些标签和本体中服务的特定用例将推动业务价值。例如:

  • 内部法律顾问可能与数据科学家和最终用户的法律员工合作,思考他们最常寻找的法律条款和文件的类型和类别。从那里,团队可以确定将以最少量的技术复杂性提供最重要的业务价值的搜索或工作流程。即使它只创建了一组新的类别和标签,这种前期工作也会有价值。AI应用程序仅提供价值,因为它在对人类具有意义的标签和类别上培训,并且可以轻松地融入人类工作流程。

我们的研究表明,与客户开启这些更深层次的工作流对话的关键是信任。具体来说,要有足够的信任来访问数据,并应用主题专业知识来真正找到重要的工作流程(AI可以用来释放价值的关键点)。下面我们将供应商优势的要素(即他们为客户提供价值的能力)从高到低进行了排序。

竞争优势1:与数据访问的客户关系(存储,分析等)

  • 客户值级别:高的
  • 原因:对数据的现有访问意味着(a)将搜索产品作为值添加到现有产品的值,以及信任的现有工作关系,(b)学习,并从现有数据中迭代以定义有用的客户端价值。

竞争优势2:没有数据访问的客户关系(相信)

  • 客户值级别:中高档
  • 原因:与现有客户的信任和工作关系允许供应商通过弗兰克和清晰的对话,并允许供应商利用现有的信任赢得初始搜索申请飞行员的可能性。

竞争优势三:对主题的知识(数据类型)

  • 客户值级别:中间
  • 原因:了解客户需求至关重要的业务价值。了解与特定部门或公司相关的优先事项,限制和经济杠杆,允许供应商解决痛苦。

竞争优势4:系统和工作流程知识(流程,IT系统)

  • 客户值级别:中间
  • 原因:系统和工作流程的知识允许供应商将其流程和系统集成到客户端的那些,找到添加值的最无缝的过程。

竞争优势5:数据科学人才(适用AI的经验,迭代模型的能力)

  • 客户值级别:中低点
  • 原因:申请必须提供价值。访问客户端数据(通过信任和能力),要求必要的技能不仅可以导航数据本身,而是提出正确的问题。也就是说,这些技能比对工作流程的丰富了解,这些技能不那么重要。

应该指出的是,数据科学仍然非常重要。上面的表格说明了一个事实,交付价值更多的是集成到工作流程和帮助解决业务问题,这更多地依赖于对工作流程的理解和对客户和客户数据的访问,而不是拥有斯坦福大学的AI博士团队。同样,我们将在下面的建议部分探讨这些见解的相关性。

保持领先于AI曲线

发现关键的人工智能趋势和应用,区分赢家和输家在未来的商业。

注册“AI优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅镜像
保持领先于机器学习曲线

加入超过20,000名以上的可调性的商业领袖,并收到每周提供的最新的AI研究和趋势。

感谢订阅Emerj的“AI优势”通讯,检查您的电子邮件收件箱确认。