AI用于企业合同分析

丹尼尔Faggella
《阿凡达》

丹尼尔是Emerj的研究主管。在联合国、世界银行(World Bank)、国际刑警组织(INTERPOL)和许多全球企业的呼吁下,丹尼尔成为了一名颇受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

AI用于企业合同分析

集简介:近一年以前,我们曾在这里接受记者采访时对AI的产业与播客杰里米·巴恩斯人工智能的元素。我们参观了他们在北京的总部蒙特利尔,我们还采访了他Yoshua Bengio在那之前的几年。

杰里米长大一点在面试,我真的很喜欢这转移进入谈话,那就是企业应该不仅考虑被更高效的人工智能,但地方他们可以做一个真正的底线剃掉一些储蓄以外的公司。

在这周的课程中,我们将关注法规遵循和分析合同。起初,人们可能会想到在节约成本方面这样的应用。我们与希夫Vaithyanathan,IBM的研究员,沃森的首席架构师比较和遵守,大概有以下发言:

  • 什么是可能的AI,当涉及到分析的合同,以及最重要的
  • 人工智能的商业优势在哪里,因为它与合同分析有关。我们如何分析合同,不仅是为了省钱,还能让我们优化我们的交易,获得收入,提高交易成功的可能性?更远的远景是什么?

订阅我们的AI在工业播客你最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
stitcher-podcast

客人:Shivakumar Vaithyanathan,IBM院士和首席架构师沃森比较和遵守 -IBM

专业知识:跨行业的合同管理和法规遵循,Hadoop,机器学习

短暂的识别:Vaithyanathan拥有运筹学博士学位。他在IBM工作了19年,担任文本分析的首席科学家和大规模分析的高级经理。

访谈要点

(03:00)我们能用对合同有用的人工智能做什么?

Shiv Vaithyanathan:所以大体上有两个领域我将谈到人工智能技术在合同中的应用。一是对合同本身的实际解读,并对合同中的个别条款进行分类,确定个别当事人的义务、除外责任和免责声明。

今天,很大一部分的我告诉你什么是由人类的键控在单独的元数据从一个合同,当事人是谁:当党的生效日期,结束日期的合同时,合同的结束日期是什么时候?所有这些单独的信息,都是手动输入的。

除此之外,还有每一个单独的句子。在大多数情况下,在法律术语中,它被称为一个元素。每个元素都需要被标识为它是否是义务、免责声明、定义,以及……它必须是与哪一方相关的标识。

我给你一个大概的估计。我们采访了一位这样做的企业律师。我们已经这样做了15年了。大约14到15页的合同。他花了一个多小时才学会了每句话,而现在他可以用人工智能软件在几分钟内完成。

所以,在我看来,这些应用是直接的。这不是什么更遥远的事情。第二部分是我们通常收到的原始合同,它通常是PDF文档的扫描件。

扫描的PDF文档是这样的,你甚至不能打开它们在你的浏览器和剪切和粘贴,如果你想把它放入一个IEP软件或其他软件的数字处理。

因此,只要能够获取这些图像,OCR图像,。tif图像,和其他页面,并从中提取数字文本,并能够将它们转换成数字格式,然后就可以进行我们需要的处理。这两件事都可以在今天完成,而且可以非常有效地完成。

每一个被使用的元素术语,都是一个法律信息学术语。我们识别的这些元素被分成几个类别,另一方面,义务,免责声明等等,这些被称为性质。我们必须确定它的性质是什么,我们必须对它进行分类,并确定它是为哪一方服务的。

这些都是相对复杂的句子,由于法律语言本身的书写方式,理解这些语言结构是我们在自然语言处理作为一个整体,能够进入并识别这些东西。

如果我退一步一秒,而NLP是AI,法律语言处理的更广泛的领域,认为它是自然语言处理的一个略小的子集。这一法律语言处理稍微更有条理,可以用非常高的精度在我看来,今天完成。

(09:30)怎样才能把它们分解呢?它是非常细的吗?这是一种高水平的游戏吗?还是说客户之间的差异很大?这些元素是如何工作的?

SV:以契约为例,契约的高级结构元素大致可分为以下几部分:有部分、有子部分、子子部分,等等。我们理解。其中有段落,段落中有句子。此外,合同中还有两个非常重要的结构性因素。

一种是项目符号列表,通常,在项目符号列表中,我们首先写下实际的首句,然后每一个单独的项目符号从那个特定的句子开始。因此,在英语中,完整的句子是由开头的句子和每个空格组成的。这些项目符号列表是非常重要的结构结构。

最后,表。表格包含合同中存在的重要内容。举个例子,如果我们讨论软件权利,当A公司从B公司买了一个软件,它就有资格得到某些东西。他们的权利是哪个软件,哪个版本,权利的有效期是多长?所有这些都放到表中你需要从表中提取它们。

这些主要是结构结构。在结构构造中,可能存在差异,这取决于具体是哪种类型的契约。有些是单个句子的层次,这就是我所说的元素,在某些情况下,实际的元素可能是两个或三个句子在一起,可能构成一个段落的一部分。有一定程度的方差,但不是疯狂的方差。

我们在NLP之外所做的真正飞跃,以及将人工智能的其他技术结合在一起,是能够打破这些东西。从一个合同到另一个合同在某种程度上是准确的。

(13:00)当你展望未来五年企业的法制化方向时,人工智能的能力是什么?某人搜索文档或探索您认为将被解锁的文档的能力是什么?

SV:下一步,即将到来的是比较的概念。基本上,能够将一个模板契约与一个契约的实际实例结合起来,并且能够从语义上识别,“嘿,这两个契约的各个部分有什么不同?”哪些部分是相同的?那些在语言上偏离我通常预期的东西在哪里?”

这是什么样的理解,并能够认识到什么是跨越东西不同的是开始有从合同谈判的方式,这是在双方经过来回全部显著的影响,常常走了很长一段时间之前they’re able to converge, all the way up to minimizing exposure for a company.

最大限度地减少风险敞口不仅仅是遵守监管方的要求,还要最大限度地减少风险敞口,即使是在SLA这样的大合同上,或者是在收入确认方面的罚款上。几乎在大企业的每一个领域,所有依赖合同的领域都会受到影响。

截至今天,几乎所有的人都要靠人做这件事。虽然人类会做的,还有是疲倦,有将是不一致的,有将是缺乏正确性。还有就是为什么当我们开始明白在这个级别有,并能够认识到,事情正在发生变化的事实,不仅将调查事实是有用的,但风险最小化的理由万千。这就是真正的熔岩开始流动的地方。

所以,如果我有所有的控制,我就会按照这样的顺序来做。今天,我希望企业律师们立即开始使用软件。

随着我们走得更远,公司会有更大的运作,不管是合并和收购,还是与别人进行其他交易。有无数的合同需要审查。

我希望软件进化到一个点,其中一组的公司律师将刚刚交出的文件或合约显著数到这个软件。它会回来与分析,并分析将包含所有的方式,从“这里有这么多的义务”,以“这里是所有偏差,我们看到。这里是什么样的东西,我们需要看看我们之前前进的下一个步骤。”

我希望它能走得更远一点。从这批合同中得到的信息可以被输入到一个模型中,这些模型开始给你一些甚至是量化的列表。

这一系列的事情上演,甚至在得到书面合同之前,这种模拟完成,和它开始给公司,特别是律师,和合并和收购,其他重大决策,在公司开始他们觉得什么是风险甚至进入这样一笔交易。

显然,人类会参与尽职调查和可能的输出来了,毫无疑问,但是现在,很多是基于一群人坐下来,也许经历一些文档,但是想象一下,基本上,增加两个数量级,并且知道你的正确性是由另一个50岁的80%。因为所有的数据都是可用的。这可能会产生相当大的影响。

大公司,IBM是其中之一有这些大的服务合同,他们放在一起。这些服务合约不是这样,他们可以得到舒适的,每一个季度的事情会得到支付。因为有一些条款,违反得到的客户回来,说:“对不起,我不会支付这些条款,因为这些东西没有得到完成。”

今天,这种标签数据在这些大型企业中是可用的。想象一下,如果这些信息可以被提取出来,输入到一个模型中,一个经过训练的模型会告诉你,“好吧,你知道吗?当你在写这个特别的合同时,它更接近于你之前写的那个没有带来它应该带来的钱的合同。你可能需要重新措辞。”

(19:30)我们正在为观众描绘未来,但是,你在哪里看到这些机会呢?在这些机会中,这不仅仅是一个节省时间的方法,也许它可以转变成一些真正驱动价值的东西。

SV:所以,总的来说,有两个领域会受到影响。一个是生产力。第二步是最小化曝光。在最小化曝光部分,它是全面的。我最近接触过的一家医疗保健公司基本上都说他们有超过20年的商业合作协议。这告诉他们可以使用什么数据,如何使用队列实体的数据,以及可以和不可以使用这些数据做什么。

不幸的是,有很多隐藏在。他们不碰任何东西,主要是因为这一事实,他们不知道他们甚至不允许做的,他们只是没有人去走过了20年。所以,这里是实际损失的机会,因为没有人不厌其烦地理解这20年的业务相关的协议。

类似地,在服务端,将契约放在一起,通常只是从以前的模板复制。事实是,那些以前的模板已经产生了问题,并已导致潜在的数亿。这样的外包合同可能价值数十亿美元。潜在的数亿美元损失已经发生,而且在他们实际着手减记法律(合同)的时候没有被考虑在内。我给你一个大概的数字。在大多数发生在大型外包合同中的大型服务中,1/3的收入没有产生的原因通常是因为服务合同没有被恰当地书写。大约1/3。这是一个相当可观的数字。

订阅我们的AI在工业播客你最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
stitcher-podcast

标题图像来源:反平方

保持在AI曲线的前面

发现关键的人工智能趋势和应用程序,在未来的业务中区分赢家和输家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
机器学习曲线保持领先

在Emerj,我们拥有最大的关注人工智能的在线商务读者群体——加入其他行业领袖的行列,每周收到我们发送到您收件箱的最新人工智能研究、趋势分析和访谈。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。