合规、合同和人力资源AI搜索应用

丹尼尔Faggella.
头像

Daniel Faggella是Emerj研究的首脑。丹尼尔呼吁由联合国,世界银行,国际刑警组织和龙头企业,丹尼尔是AI对商业和政府领导者竞争战略影响的全球追捧。

合规、合同和人力资源AI搜索应用

企业搜索有一个完整的人工智能生态系统。其中大部分是在纯数字世界。大多数供应商通过一层支持人工智能的搜索来帮助用户理解术语或短语,并能够返回用户输入的结果或问题的答案。但当涉及到搜索物理世界时,问题就变得复杂了。

大的银行可能需要查找财务记录例如,回顾40年前处理一桩诉讼,他们可能不仅要调查数字文件,还要调查在不同地点不同存储设施中的缩微胶片和印刷纸张。

这是一个具有挑战性的问题,但对于那些不想花两周时间把他们的律师关在一个房间里,让他们去解决一些法律问题或在过去的合同中寻找某些条款的公司来说,这是一个重要的问题。银行希望能够搜索它们,无论它们是实体的还是数字的,并更快地找到他们想要的东西。

这就是本周的主题AI在工业中.我们的客人是铁山产品管理总监Anke Conzelmann。铁山是一家位于波士顿地区的四十亿美元的物理存储公司。

他们处理的一些最大的记录金融卫生保健,零售品牌周围的世界。Conzelmann与我们谈到人工智能搜索的企业内未来的潜力,而不仅仅是数字文件,但跨格式。

对于人工智能搜索应用的更深入的分析银行,下载铁山 - emerj共同品牌白皮书在这个话题。

订阅我们的人工智能产业播客您最喜欢的播客服务:

itunes-podcast
soundloud播客
google-podcast
Stitcher-Podcast.

客人:Anke Conzelmann,产品管理总监 -铁山

专业知识:企业采用基于人工智能的搜索应用

短暂的识别:Anke自2003年起担任Iron Mountain的产品管理总监。在此之前,她曾担任Dragon Systems的产品经理,后来被Nuance Communications收购。

采访中强调了

(2:3)您在哪里看到基于AI的法律搜索的大多数机会?

交流:它实际上是一个伟大的使用情况下,合同。每家公司都有他们的,我们都希望我们有很多很多。

拥有更多客户合同是好的,但它也意味着我们已经有一个非常分布式的来源集。[它]可以通过产品...按地区......真的很难回答真正简单的问题,就像“这个特殊客户的所有合同在哪里?“当您考虑回答问题时,它变得更加困难,”这些客户中的哪一个有非标准付款条款?“一般来说,现在你开始阅读合同。当然,这没有规模。

另一个问题是,你不一定是一定要抓住他们。因此,每家公司都有这个问题,每家公司真的可以使用一些机器学习和人工智能驱动的分类和元数据富集,以使这类问题很容易回答中受益。

(4:30)还有什么其他有趣的用例是不需要人力的,但是搜索那些合同却可以用机器来实现的?

交流:另一个真正的好人实际上是人力资源......每个客户都有人力资源部门。每个客户持有员工数据。因此,随着在欧洲颁布的隐私法,在加利福尼亚州来了......明年巴西,这实际上即将成为一个普遍的要求。除非您实际上可以以规模执行这些事情,否则要求很难见面。

个人信息在哪里?我在哪里有员工信息,我可以找到它吗?我可以在员工请求时产生它吗?我可以在我需要删除它时删除它吗?

这些隐私法所改变的一点是,“我为每一个用户留存政策保留所有内容”已经不再可行了。哦,顺便说一下,遵守这些隐私规定:如果你做不到,他们会处以巨额罚款。你可以从GDPR中获得2%至4%的收益,或者1000万至2000万欧元。顺便说一下,是两者中较高的,而不是较低的,所以会有很大的罚款。

因此,能够识别个人信息在文档中的位置,无论是物理的还是数字的。例如,我在铁山待了很长时间。当我刚来的时候,需要填写的是纸。这些还在某处,但也有我上个月写评论时收集的数字信息。那么我该如何跨越这些不同的实体和数字信息存储库呢?有些可能是Office文档,有些可能是图像,有些可能是谁知道的东西。

所以不同种类的内容,真正跨越这些内容并且能够回答每一个源文件的问题。比如,“个人信息在哪里?”能够说,“好吧,给我这个员工的个人信息,在我从不同的存储库中获取的所有信息。”找到可靠的方法,从安全和访问控制的角度,以适当的方式保存它,并应用保留策略,这样,如果我明天辞职,七年之后这些文档的保留率可能会上升,当公司没有业务需要保留这些信息时,就有义务删除这些信息。

人力资源文档中的隐私绝对是另一个用例,你不能仅仅与人打交道。

(8:00)公司需要做些什么,其中一家在其中一个较大的搜索和挖掘纸张,数字,图像,整个九个码?

交流:甚至是针对现有员工的。作为一名员工,或者作为一名客户,你有权询问你的雇主或者与你有业务往来的公司,他们掌握了关于你的哪些信息。首先,你需要能够及时回答这个问题。

第二件事是,作为一名员工,我现在有权利纠正。意思是,我应该可以告诉你,“嘿,这是错误的。你需要纠正它。”然后我还需要得到这些东西。对我来说,“好的,安可,给你。这是我们拥有的包含你个人信息的所有文件。”你需要能够生成所有这些信息。

最后,是被遗忘的权利,这就是所谓的权利。一旦没有业务,你收集信息的原始商业目的就不再相关……(一名员工)不再为公司工作,现在我实际上必须销毁这些信息。我必须证明我是按照政策做的。

我需要证明,我从解雇那个员工的角度开始了我的工作。他们是辞职了,还是被解雇了,都不重要。然后把时间用完,对我来说有一个标准的过程,我现在正在浏览并销毁这些信息。无论是物理的还是数字的。我需要在我保存信息的地方始终如一地这样做。

这就是,再一次,把所有这些都整合到一个端到端的平台上,我不仅可以把物理信息数字化现在可能摆脱物理,以便我不必处理那条线。I can take all of the information that’s coming out of digital repositories, could be file shares, could be SharePoint sites, HR shared drives, and pulling that all into a common repository so that I can then very easily comply with what I need to do from a policy perspective.

这是找到所有这些东西的另一个好处,能够消化所有这些东西,能够丰富它,提取关键信息,比如,“这份文件是给什么员工的?”这是什么文件?里面有个人信息吗?”现在我可以用需要应用到它的政策来适当地对待它。

(12:00)还有其他你觉得值得指出的用例吗?

交流:绝对的。有一些非常简单的。当你开始谈论合同时,你会想到合法,但它实际上不仅仅是在一家感兴趣的公司内合法。你有一个非常简单的问题,也许一个销售人员刚刚被分配了一个新账户,他可以说,“好的,给我看这个账户的所有合同。”这是一个。

然后在法律领域,假设你经历了一次收购,现在你有一大堆来自那次收购的联系人,坦白地说,你真的不知道里面有什么条款以及它们与你的条款有什么不同。这是另一个用例:能够将一些东西与你的标准进行比较并且能够找到那些子句与你的标准有很大不同的地方,能够瞄准它。换句话说,让律师接触到那些可能存在问题或最重要的问题。

另一个是责任限制。这个很受欢迎。GC走过一个初级律师,问他:“嘿,对于最近的收购,在这些客户合同中,我们的数据泄露责任限额会暴露多少?”你今天如何回答这个问题?你把一群律师关在一个房间里看合同可能几天,可能几周。你可以提取这些信息,然后在视觉搜索界面上点击几下就能找到那些责任高于标准条款的合同或者那些责任与我们有关的具体条款,比如数据泄露责任限制。

它不会去跨越。这真是思考的问题是通过什么问题,你很乐意回答,然后用丰富的机器学习和人工智能为了能够回答这些问题的信息。

现实是,有时我们会谈判不同的条件。有时我们使用客户的纸张,因为这就是最终发生的事情。有时候,来自利润和收购的东西看起来完全不同。

真的,机器学习和人工智能的力量在于你可以做到这一点,即使你在处理看起来非常不一致的内容,所以能够找到我想要看的正确的条款。是的,它确实需要培训,但能够在一个平台上做到这一点,我们将其作为一个预先培训的模型,针对特定的客户进行优化,而不是客户自己做。

(16:00)铁山在金融服务、银行、保险,能源.什么是一些有趣的方法,其中在这些垂直例子搜索和发现AI千篇一律?

交流:事实上,能量就是一个很好的例子。再一次,我认为它说明了我们讨论过的事情的不同部分。在能源领域的一个用例是,你的地球科学家正在寻找公司所有的不同资产,以驱动决策,“我应该在哪里钻探?”或者,给定井的值是多少?

该种东西,你要处理的可能是巨大的地图是纸,所以数字化的,并能够利用这些。他们在磁带上的地震数据。有磁带上的地震数据的vasts量,所以能够破解这些开放的,收录的内容,并使其可用于地学家,以及所有的这是可用的原生数字信息。所以vasts的信息排列,这些地球物理学家一个需要能够利用。

的方式,他们需要借助它是基于“告诉我关于地图上某点的一切。”所以困难,他们正面临是他们正在与实际分析的信息在所有不同的仓库去,坦率地说,不被肯定时,才发现他们都花时间搜索的一半。

有些数据的生成是非常非常昂贵的,所以你真的想要确保你正在使用你已经拥有的数据,而不是可能找不到它而不得不再次生成它。从输入的角度来看,物理和数字的各种来源都很重要。

然后,从处理的角度来看,它是所有关于添加正确的元数据,丰富了以正确的方式的信息。对于这种特殊的使用情况下,你要找的地理位置。您正在寻找确定地球这个特殊的地图是什么区域,这个地震是,这种测井是。您正在寻找提取信息,这样,现在的地球科学家实际上可通过位置访问它。他们基本上可以指向地图上的一个点,说:“给我所有的资产,这点在地图上,这样我可以决定我们应该钻,或者我能确定的值好。”

这里重要的另一部分是已经提供的元数据。如果是物质资产,我们的客户正在保留许多关于他们与我们存储的资产的元数据。能够与数字或数字化内容结婚很重要,以便您不会丢失您对这些资产以及潜在的外部来源的任何信息。石油和天然气,也许是IHF数据库等。

能够从机器学习AI透视中获取我们生成的内容,就净新的富集元数据而言,与现有的元数据一起,并且能够在所有这些元数据之间创建这些关系,并且在所有这些资产中都是真正的电力非常迅速地实现那些地球科学家找到合适的东西,并花费大部分时间分析,而且很少试图挑选它们所需的所有信息。

对于石油和天然气来说,还有一件非常重要的事情,那就是找到类似的图像……也许是地质侵入,这是发现石油的一个很好的迹象。你希望能够找到任何其他类似的图像,这样你就可以在地图上确定可能的好地点,在那里你可能想要钻探。这将是石油和天然气的一个很好的例子,在这种情况下,对于地下记录。

很明显,更快的分析,更好的决策是你想要的结果。我认为,很明显,许多这样的用例仍然需要清除,因为这对石油和天然气行业来说是多么的新鲜。以任何方式利用图像资产,而不是缓慢地从数字文件或物理文件中提取元数据,然后手动查看它们,这将是新的。

但很明显,如果我们有这种可视化数据在我们进行钻探的一大堆物理位置中,也许我们就会知道我们的高收益领域可能在哪里,我们就能以更有效的方式分配资金。

(21:00)元数据是什么意思,是来自内部还是外部?

交流:它可以是从内;它可以从外面。这可能是因为你有已经是一个存储库的元数据;这可能是因为在市场上的报价提供了元数据,也可能是某些属性的公开资料。有大量的公共信息。真的,关键是要能够创造出所有这些不同的点点滴滴,并使其成为附加到的资产的元数据的一部分之间的关​​系。

所以现在我知道这张地图属于地球上的一个特定地点,我也知道井的测井数据来自同一个地点,我还知道IHS的数据可以用于那个地点。这正是增加元数据并创建这种关系的力量,这样你就可以跨越不同的资产类型并以一种有助于快速找到正确信息的方式进行搜索,以帮助你做出决定或回答你需要回答的问题。

It’s really thinking through what the questions are you’d love to be able to answer, and then backing into, “what kind of information do I need to pull out of the different documents as part of the processing that we do with the machine learning in order to have that?” Or, “where is that information today that I already have? How do I now marry that up with these assets?”

而是从头开始,从“我希望能够回答什么问题?”我希望能够解决哪些问题?在这个过程中,我有哪些手动步骤会减慢这个过程?”然后倒推到,“我需要做什么才能加快速度,才能提供这些信息并回答这些问题?”

(23:30)在银行或保险领域有哪些具体的用例?

交流:很多银行都有微缩胶片,几十年的微缩胶片可能是账户报表的图像。他们把所有的账目记录,都放到了缩微胶片上。对那些不知道的人来说,这就像一个索引卡大小的fiche有几百张图片,像针头大小的图片。

那你为什么要拿这些东西?因为,很明显,这不是去年的报表或上个月的报表。

这可能是一笔财产回到银行说,嘿,我们认为你欠我们X万美元的财产并且必须能够返回并生成,例如,几年的报表。仔细想想,找一张合适的缩微胶片,放在合适的盒子里,把它放在你的缩微胶片阅读器上,在缩微胶片上找到合适的方块,把它数字化,然后再做一次。那是第一个月。希望你只有一页的语句因为如果它有两页,你在那个月做了两次。所以做24个月需要很长时间。

顺便说一下,你并没有增加任何价值。您所做的一切都是响应客户的请求。能够提取所有的信息,在这种情况下,它实际上是非常具有说明性的,它是非常简单的,用例。我希望能够在一堆不同年份的数据中搜索一个账号,并找到一个日期范围的所有相关报表。这是一个非常简单的问题,但用物理缩微胶片很难做到。这在金融服务业非常普遍。

另一个例子是抵押贷款。作为一个客户,现在很多东西都是数字化的,所以我们可能会认为真的不再需要太多的纸了。然而,有时当你在这个过程的最后,你仍然会得到一堆文件。哦,顺便说一下,后端过程通常仍然包括打印那些东西和让物理纸张四处移动。

首先,这个过程需要很长时间。花费的时间比预期的要长,部分原因是有很多人工干预。说真的,你到底想干什么?在这个过程的前端,你试图弄清楚你是否拥有所有的信息,这些信息是决定是否向某人提供贷款所必需的。

这很好地说明了我们如何进行分类和提取?分类回答了第一个问题,也就是“我是否拥有贷款文件中应该包含的所有文件?”

一旦我的答案是“是”或“不是”,我就会进入下一个步骤,也就是,“这些填写得完整且准确吗?”我有签名吗,还是我想要签名?我的名字和社保号是否都是这个文件里的?我是否有相同的APR,或者是否有任何文件有不同的名字,或者拼错了名字,或者拼错了社保号,等等?”

在文件中找到信息,即提取。我正在拿出这个名字。我正在拉出社会安全号码。我正在拉出4月。我正在拔出所有这些相关的位和碎片,以便能够回答第二个问题,即它完全准确地填写?你在这里看的是一周到不到一天的过程。在客户体验方面非常强大,所以据推测,我将更快地获得贷款,我的批准更快,也是从实际供应商的明显流程效率的角度来看,在这种情况下。

另一件事是,既然我已经做了所有这些工作,我就有了非常丰富的信息,可以作为次要用途。例如,我是否遵守了公平借贷法?我现在也能回答这个问题了。在改进我的过程的基础上,我现在有能力考虑我可以支持的其他次要用例,这样我就可以回答诸如“我是否符合公平借贷法?”

是的。所有这一切似乎绑到你周围的能量,我们真的需要问自己提到的大了点,什么是我们需要问的问题吗?什么是我们要启用的进程?因为当你谈到贷款,以建立那种东西,当然,我们会想知道我们在哪里存储所有这些某些类型的文件,或者是某些类型的,我们正在寻找条款的。要构建的是将得到的东西,会像你说的,也许需要一个星期下来,每天的过程中,我们需要做的时间的战略思想进取,建立制度,使搜索可以在那里工作。

(28:30)一家公司需要什么样的战略思维来整合人工智能搜索应用?

交流:你要有正确的人围着桌子和多个感兴趣的潜在早期围着桌子,这样您就可以确保,当你处理所有这些信息,你实际上添加合适的元数据,这样您就可以回答大家的问题。

现在,话虽如此,你当然可以从最紧迫的开始,或者最紧急的,然后随着时间的推移增加。所以这不是一个“我必须一次考虑所有事情”的问题。在我们的示例中,我们可能会意识到,一旦我们完成了抵押贷款流程,我们实际上也希望能够回答这个合规问题。

我们可以从处理的角度提炼我们正在做的事情再处理我们已经吸收的资产来添加我们现在正在寻找的额外元数据。所以你完全可以一点一点地来做,先解决最紧迫的问题,政策也是如此。

也许一开始你是在自动化一个过程。你并没有考虑应用留存策略,但你可能想要这么做。现在我知道我有什么了,我可以计算出我应该保存它多长时间,当我不需要保存它的时候,我可以处理它以便销毁它,所以我们开始着手处理这一大堆非结构化数据。另外,从“我应该继续保留它吗?”的角度来看。

如果你想要做的更广泛,你应该尽早考虑的部分是,“从我需要的工具的角度来说,这意味着什么?”如果我需要跨越物理和数字信息,这意味着什么?如果我需要跨越视频、图像和Office文档,这意味着什么?”

所以不要把自己逼到一个角落里,“好吧。好吧,我们有一件事想要解决,所以让我们有这种非常有针对性的解决方案。”然后,你转过身,说:“好吧,我也想解决下一个问题。”

而现在,坦白地说,你已经把自己画在了一个角落里,就像“好吧,我们不能在同一个平台上处理视频。”

现在我们推出了第二个,第三个,第四个。所以考虑一下你想要做什么是很重要的,但你不一定要一下子把所有的事情都做完。你应该把它作为第一、第二、第三点来考虑,但确实要确保你明白你最终可能想要去哪里,这样,当你决定提出解决方案时,你就不会缩小你的选择范围。

订阅我们的人工智能产业播客您最喜欢的播客服务:

itunes-podcast
soundloud播客
google-podcast
Stitcher-Podcast.

本文由Iron Mountain赞助,并根据我们的透明度进行编写、编辑和发布Emerj赞助的内容指南.在我们的网站上了解更多关于达到我们专注于人工智能的执行用户的信息Emerj广告页面

标题图片来源:微博

保持在AI曲线的前面

发现区分未来商业赢家和输家的关键人工智能趋势和应用。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

加入超过20,000名以上的可调性的商业领袖,并收到每周提供的最新的AI研究和趋势。

感谢您订阅Emerj“AI优势”时事通讯,请查看您的电子邮箱确认。