石油和天然气的数据搜索和发现-能力的回顾

拉哈夫巴拉德瓦
《阿凡达》

Raghav是Emerj的分析师,负责报道主要行业更新的人工智能趋势,并进行定性和定量研究。他曾在Frost & Sullivan和英菲尼迪研究公司(Infiniti Research)工作。

石油和天然气的数据搜索和发现-能力的回顾

这篇文章最初写成由铁山赞助的深入AI报告的一部分,并撰写,编辑和出版对准我们的透明Emerj赞助内容指南。了解更多关于我们的思想领导和内容创建服务于我们的思想领袖服务网页

日益增长的需求因为能源、石油和天然气给这些行业的企业带来了提高生产和业务流程效率的压力。的一种方法石油和天然气公司可能能够做到这一点,组织他们的内部数据的方式,使员工很容易搜索和发现模式,可以优化他们的业务流程。

能源类股可能是成熟的人工智能应用由于大量的历史数据记录的可用性和大型跨国公司与资源的存在,以实现复杂的AI项目。这些公司所收集的数据来自多种渠道,以不同的格式,和AI搜索,并在空间探索项目需要几个初始步骤来组织和管理数据。

Radim Rehurek,谁从马萨里克大学布尔诺获得了计算机科学博士学位,并成立RARE技术,指出:

理论上有很多应用是可能的AI在搜索和发现,但在实践中(在现实世界的商业环境)的数据是非常混乱和企业需要了解什么是可能的,由于其数据的约束。

在最新进展机器学习自然语言处理数据搜索应用程序已经能够从自由文本中提取结构化信息,比如在井或油藏报告和日志中发现的信息。然而,将这些技术应用于石油和天然气行业的非结构化数据所面临的最大挑战似乎是无法获得标记的训练集,这些训练集可以帮助人工智能模型理解行业特定的术语和术语。

在一年内生产或由特定工厂总销售的桶数是相对简单的衡量和跟踪。关于井或细致入微的和复杂的传感器数据从性能的特定报告重型设备统一起来可能更具挑战性,特别是在不同工厂或不同地区有不同的公司数据收集和管理规范的情况下。改变公司文化可能比协调数据的技术障碍更难。

在能源、石油和天然气领域,在安全与访问、隐私、法规与合规、知识产权保护以及物理和数字障碍等方面,数据也面临着其他挑战。大型石油和天然气公司可能需要考虑如何在世界各地的不同地点收集数据,哪些法规可能影响从某个物理位置获取数据,或者哪些数字防火墙可能限制对数据的访问。

即使正在取得访问所有的数据,企业会发现可能仍然需要数据进行洗涤,以除去任何不正确,不完整,格式不正确,复制或异常数据。

企业也发现,在某些情况下,条例可能授权的数据共享当事人或数据之间的协议可能需要移动到它可以分析位置的签署。由于数据是高度庞大,精确地移动所述数据可以被证明是由本身就是一个挑战。

有几个大帐篷商业产品使用NLP,和机器学习进行数据搜索和发现。这里一个显着的发展是谷歌推出了谷歌云搜索企业工具,该公司声称可以让组织更有效地搜索和访问他们的内部信息。

例如,在企业员工可以在问题,例如,键入“哪里是由玛丽·布朗共享的文档”,或者“谁是布鲁斯的经理吗?”和云搜索可能与相关信息返回答题卡。

贾科莫Domeniconi他是IBM Watson TJ研究中心的博士后研究员,也是纽约大学“高性能机器学习”课程的兼职教授,他阐述了人工智能在数据搜索和发现方面的一些可能性:

在过去的两三年中,我看到的一个更大的改进是利用非结构化数据来获得真知灼见。无监督机器学习技术可以帮助企业在不需要大量标记数据集的情况下理解其非结构化数据

图像识别现在可能会转移到视频中,在视频中可能会教算法理解视频中执行的动作或动作。

也正在申请的新闻或社交媒体情绪分析NLP。

技术,如语义搜索可以帮助从分析非结构化内容识别和提取的事实,属性,概念和事件。例如,石油和天然气公司可能能够深入了解,可以帮助通过NLP和机器学习的历史供应链文件,招标,并从原材料供应商的投标数据发现降低采购成本。

石油和天然气公司可能会将人工智能应用于专利分析、来自呼叫中心说明的客户情绪分析、调查反馈和在线论坛,或来自供应链合同和其他投标文件的采购分析等应用。

为了战胜竞争对手,石油和天然气公司可能需要跟踪政府报告、地质研究或社交媒体的趋势。NLP可以帮助自动化和聚合新闻和信息。

这样的AI应用程序来与技术挑战和数据方面的考虑。例如,能源,石油和天然气文献通常含有特定行业的术语,如井深或类型的烃的。在该领域的主题专家可能会需要一起工作的科学家的数据建立一个有用的AI系统。

搜索和发现人工智能也可能对油气公司非常有价值,因为它可以确保油气公司的法律和监管合规流程得到优化,从而降低成本,避免受到处罚。能源和油气公司的合规团队可能需要梳理数千份文件,以跟踪现有和新的监管规定。

AI搜索和发现操作可以用来获取民主化根据法律和法规遵从性信息理查德原本他拥有爱荷华大学电子和计算机工程博士学位,是Loblaw Digital的数据科学主任。他建议,石油和天然气公司也可以使用NLP和机器学习来生成可查询的监管数据库,让员工更容易获取信息。原本状态:

像谷歌这样的搜索引擎已经表明,通过研究用户输入的查询、输入的单词和之前的搜索历史之间的关系,可以创建上下文感知的搜索。

这可以在更小的范围内应用于特定领域的法律环境,以创建可搜索的数据库,从而增强人类合规官员的能力。例如。如果用户输入“显而易见”,人工智能搜索可能会强调与该词在特定法律子领域(如专利法)的含义相关的结果。

在某些应用程序中,可能需要一个人工辅助训练组件,其中NLP软件通过人工审查“学习”。操作员可能:

  • 创建或清洁输入数据
  • 测量输出的准确性
  • 创建额外的培训或元数据

在大型系统中,这些评审过程可能是重复的,并且使用人工评审可能是不可行的。在这种情况下,企业可以:

  • 创建一个接口,以加快审核流程
  • 使用像CrowdFlower这样的众包解决方案来提供大规模的数据标签服务
  • 更新现有的业务流程系统,在数据发送到算法之前的某个阶段包括人工审查

我们看一些的用例,其中正在申报数据AI搜索和数据发现在能源,石油和天然气行业的下方。

石油和天然气钻井数据的自然语言处理技术

石油和天然气行业通常分为三个主要业务部门:上游,中游和下游。上游涉及石油和天然气的勘探和生产。中游通常指运输和储存阶段。下游包括炼油和销售石油的各种过程。

在上游,可以存在用于应用AI动态优化钻机的操作条件的机会,从而导致生产成本降低,并且最大限度地减少机械的停机时间。亚历杭德罗·贝当古,谁拥有技术的埃因霍温大学和导线的分析团队在哥伦比亚的石油和天然气公司哥伦比亚石油公司在互动和认知环境的博士学位,表明石油和天然气公司可以通过使用自然语言处理可能改善其提高石油采收率(EOR)的价格,计算机视觉和机器学习的钻探和勘探数据。

根据贝当古的说法,油气行业多年来一直在收集数据,这些数据可能是由人类专家整理和分析的,这为人工智能系统提供了充足的数据。这个数据可能包括勘探生产和油藏数据日志,如地震勘探、测井、常规和特殊岩心分析、流体分析、静态和流动压力测量,压力瞬变测试,周期以及生产测试,记录每月产生的流体(油、气、水),并记录三次采油每月注射量的液体(水、气、二氧化碳、蒸汽、化学)。

石油和天然气公司可能会从上述数据来源中获得灵感,比如在不同的工作条件下,每口井的理想作业条件。经过一段时间,人工智能软件可能会摄取整理过的数据记录,并从数据源(如上面提到的数据源)中压缩信息,这些数据源可能是结构化文档、pdf文件、手写笔记、音频或视频文件。这种类型的软件可以让石油和天然气公司从他们所有的数据中搜索和发现信息,而不考虑渠道或类型,从而获得最准确的搜索结果。贝当古补充道:

由于数据的数量和复杂性,石油技术数据库(如测井资料)很难导航和搜索。我看到了智能石油技术数据库的未来,它可以帮助地质学家通过使用一些直观的命令很容易地找到特定井/储层的数据。此外,这些智能数据库可能也非常有能力分析这些数据

在那里一些证据用于将自然语言处理和机器学习应用于高级数据搜索应用。从非结构化的自由文本文档中提取结构化信息(比如手写的维护记录或钻井报告)可能会用到NLP。

例如,来自四位研究人员的报告包括来自美国斯坦福大学和得克萨斯州A与M大学博士,我们发现NLP的证据被使用来提取信息,从石油和天然气公司的钻探报告。研究人员声称已经测试了他们的方法,从303口井在油田钻井9670个报告。

该报告提供了一种方法,使用NLP来自动分类来自石油和天然气公司的旧钻井报告中的句子,并识别石油和天然气公司的操作行为模式。石油和天然气钻探报告通常是非结构化的文件,可能包含有关油井状况、正在进行的钻探类型或石油和天然气产量的信息。随着时间的推移,看到这些信息的显示可能有助于公司确定与效率或无效率相关的清晰模式。

该报告称,研究人员开发的工具可以被一家能源公司离线使用,该公司可能希望从历史钻探报告中获得深刻见解,以识别积极的操作模式。此外,他们声称这个用例可能演变成一个实时的决策支持系统,在这个系统中,石油和天然气公司可能能够减少与故障或系统停机相关的钻井成本。

研究人员使用有关设备的检查,这是由运营商以及创建信息每日报告。他们的算法能据称从目前正在运行的是有设备故障井和油井中提取信息。下面是中生成的报告类型的样品。生产时间(PT)的孔是那些操作,和非生产时间(NPT)的孔是那些经历停机时间:

PT和NPT报告的示例
PT和NPT报告的示例

NLP模型可以将钻井报告中出现的句子分类为事件、症状或动作(见下图)。石油和天然气公司可以利用这些数据来确定最佳做法,以减少停机时间,从而提高生产效率。

这个用例可能为石油和天然气公司带来的核心业务价值在于通过识别最成功的操作实践的钻井报告中的模式来降低成本和减少事故。这将使公司避免不那么理想的做法。

石油和天然气公司也可以使用这个用例来查找从钻井报告中提取的文本与其他井数据(如岩石样本或井日志)之间的模式,从而为每口井创建可比较的技术报告。

石油和天然气的数据搜索和分析

以记录和信息快速访问可能是大型石油和天然气公司,跨越多个国家的多个位置的操作进行的关键。在许多情况下,这些可能包括与数字记录管理沿着旧的物理记录。这使得信息的获取对于大公司一个具有挑战性的问题,因为如丢失或不完整的记录,在几个不同的格式记录,或没有索引的记录问题。

人工智能搜索和发现工具可以帮助石油和天然气公司数字化记录,并根据地理位置、国家或项目对信息进行分割。这些数据的可视化表示可能会导致问题的识别,比如管道腐蚀或设备使用量的增加。

例如,石油和天然气公司可以数字化所有的地震记录和其他勘探和生产(E&P)数据,以创建可搜索的数据库。AI软件可以帮助识别指示数据模式,如果油井资产可能对经济风险公司。

在石油和天然气工业中,诸如地震或地下图表等数据通常采用图像文件的形式。除了需要地质学家花很长时间来研究,这些文件可能被存储在不同的场所,云存储,甚至微缩胶片。人工智能搜索和发现工具可以帮助在一个地方找到并访问这些图像文件中的信息,从而使石油和天然气公司能够参与分析项目。

道达尔石油公司最近宣布与谷歌云的协议联合开发一个人工智能系统来分析地下数据,以改善勘探和生产过程。根据声明,这次合作可能会导致人工智能系统的发展,该系统可以使用计算机视觉来解释地震研究中的地下图像,并使用NLP来自动分析技术文件。驱动该应用程序的业务价值将是增强公司的地质学家和油藏工程师的能力,使他们能够更有效地工作。下面的图像显示了一个典型的地下数据采集可能看起来像一个石油和天然气勘探应用:

分析杂志的地下数据采集礼貌
地下数据采集由分析杂志

据报道,该项目将把来自Total的地质学家和来自谷歌云的机器学习专家聚集在谷歌位于加州的高级解决方案实验室。该项目的长期目标似乎是在Total为地球科学家开发一个人工智能助手,它可以帮助进行信息搜索,甚至有可能帮助进行信息搜索推荐建议以提高在各种石油和天然气工艺的操作效率。

总声称有应用机器学习勘探和生产活动,包括历史预见性维护涡轮泵。和压缩机在其工业设施生产剖面预测,自动分析卫星图像,并分析岩石样品图像。

采购中的搜索和发现

据埃森哲在美国,石油和天然气公司对不同商品和原材料成本的分类通常不是很有条理。传统上,公司使用人工或基于规则的软件来分类公司的总开支。

这两种方法是劳动密集型的。平均而言,一组典型的从石油和天然气公司的年度支出数据可能包含共80万至120万行项目20万〜40万未分类行项目。

在石油和天然气行业,每两到四年收集一次支出数据是很常见的,因为这是一项劳动密集型的工作,这意味着公司的支出更少数据。

许多全球能源和石油和天然气公司可能会发现,这个问题是由事实加剧,他们的业务单位(包括油井和企业办公室)在不同的位置可能输入的支出数据,如供应商名称或商品描述,在不同的格式。

NLP和机器学习可能使石油和天然气公司能够很容易地从非结构化报告中搜索和跟踪支出数据。类似于SAS的算法可能能够在年度支出报告中自动对未分类的行项目进行分类。

此应用程序的核心业务价值似乎在于将宝贵的人力时间和资源从劳动密集型的分类任务中解放出来。

减少非计划维护 - 油腐蚀风险分析

在油气行业的下游作业中,原油的腐蚀是设备失效的巨大风险。根据原油的化学成分或储存环境,经验丰富的腐蚀工程师可以设计出避免设备停机的方法。

通过人工智能,将这些知识数字化,并向新工程师提供维护建议,现在可能成为可能。为了检测石油腐蚀风险,公司可以使用NLP和机器学习技术,从炼油厂事故报告和不同类型原油的物理特性等数据中开发一个可搜索的维护信息数据库。这些数据可以是结构化的,或者在大多数情况下,以word文档或pdf的形式是非结构化的。

例如,NLP系统可以解析维护数据,以聚合来自经验丰富的腐蚀工程师的知识。工程师们可以使用基于nlp的搜索系统,通过与仪表盘接口,找到关于如何避免不同类型原油腐蚀的信息。

检查、维修和保养是石油和天然气公司收集大量数据的领域,其中大多数数据通常是非结构化的,甚至是手写的。NLP和文本挖掘可用于提取、分类和关联工程师多年来获得的大量知识。

这一点在石油和天然气行业尤为重要,因为工作人员的巨大变化,这一现象指的是石油和天然气劳动力的巨大年龄差距,其中大多数工程师和地球科学家要么超过55岁,要么不到35岁。这意味着,资深工程师的经验并不总是完全转移到下一代工程师身上,而人工智能数据搜索和发现可能非常适合解决这个问题。

什么商业领袖在石油和天然气应该知道

人工智能增强的数据搜索和发现可能很快就会应用于石油和天然气行业,应用于许多业务功能,如实际生产和维护、前端销售和客户服务。正如贝当古所说:

人工智能将为油气公司带来最大的商业价值,包括生产优化、停机时间最小化、油藏理解和建模,以及结合内部和外部数据源的商业支持。

在成功地将数据分析应用于石油和天然气领域,特别是在减少设备停机时间、延迟生产和提高系统的整体效率方面,有大量可测量的业务结果。还有两个关键的kpi是公司可以跟踪的,即处理时间和分析时间,几个人工智能应用程序将针对这两个领域。

我们采访的专家似乎提醒企业高管,尽管人工智能在石油和天然气行业有巨大的机会,但由于分析的技术复杂性和所需的计算资源,对该领域的许多公司来说,这是一个具有挑战性的领域。

提高生产效率或从钻井数据中获取运营信息,很可能是人工智能在能源、石油和天然气行业的“唾手可得的成果”。从石油、天然气或能源行业商业领袖的角度来看,人工智能将真正推动商业价值的应用,将是那些有助于提高销售或与现有客户达成更好交易的应用。油气行业的企业部门可能最终成为人工智能最大的终端用户,原因很简单,就是销售业绩的改善带来了直接的价值。

标题图片来源:NPR

保持在AI曲线的前面

发现关键的人工智能趋势和应用程序,在未来的业务中区分赢家和输家。

订阅“AI优势”简报:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
机器学习曲线保持领先

在Emerj,我们有AI-集中的商业读者最多的观众在线 - 加入其他行业领导者和接收我们的最新人工智能研究,趋势分析,并将其发送到您的收件箱周刊的采访。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。