在企业克服在基于语音的自然语言处理(NLP)的挑战

拉巴拉
头像

拉哈夫是作为分析师Emerj,涵盖各主要行业动态AI的发展趋势,并进行定性和定量研究。他曾任职于Frost&Sullivan公司和英菲尼迪研究。

克服说话的声音挑战基于自然语言处理(NLP)用于商业用途1

情节概要:在这一集里的AI行业,我们与迈克尔·约翰逊,研究和创新的主任说话互动有限责任公司在马萨诸塞州波士顿。迈克尔探索入境(人机)和出站(人机互动)基于语音的应用自然语言处理(NLP),也约个时间车架安装到多快的中小型企业(SME)会谈将有机会获得这技术在经济上合理的方式。

虽然NLP通常与聊天或文本接口相关联,但语音对于呼叫中心、移动电话、智能家居设备等应用程序非常重要。此外,Michael解释说,语音包含了文本不需要处理的独特挑战——包括背景噪音和口音,这些都需要克服才能提供良好的用户体验。

订阅我们人工智能产业播客用你喜欢的播客服务:

iTunes的播客
soundloud播客
谷歌,播客
订书机,播客

客人:迈克尔约翰斯顿,研究和创新主任互动LLC

专长:语言学、自然语言处理,自然语言理解,语义标记,语音和多模态对话系统,虚拟助手,人机交互

简介识别:去之前就与互动的工作,迈克尔收购了来自加州大学圣克鲁斯分校语言学博士学位。迈克尔继续与AT&T工作作为1999年至2014年的主要发明的科学家,他是负责AT&T的交互式多模态虚拟助理的研发计划。

当前所属机构:迈克尔是研究和创新互动LLC的董事。他还作为W3C的多模式扩展多式联运注释组主席自2003年以来。

这次访谈是一个为期一个月的自然语言处理系列播客的一部分,由msports万博体育官网细微的通信。了解更多关于我们的产品和促销服务我们的合作伙伴页面

大创意

迈克尔探讨一些商业化的业务使用情况,并深入探讨了基于面向任何企业希望申请说话声音的挑战客户服务方面的NLP或面向客户的任务。首先,我们看目前商业化应用,探索一个NLP业务用例,确定呼入和呼出语音基于自然语言处理的挑战,最后转移到我们可以在不久的将来,技术混乱方面的期望。

公司希望申请基于语音的NLP需要考虑到他们的应用程序的数据密集性。在存在大规模的一整套完善的结构化数据的情况下,自然语言处理系统可以经常做的语感表现良好。没有一定的量和均匀性数据,它往往是具有挑战性让这些系统运行良好。

当前的应用程序

一个基于语音NLP的主要应用目前在电话为企业应用。在家庭和移动设置基于语音的NLP的使用类似的增长也推动这项技术的发展成为一种主流的AI通信应用。在电信业,金融业和酒店业是基于语音NLP的应用中最先采用中 - 如路由电话呼入。

当前业务用例(电话用例)中的NLP平台的一个这样的例子是全球酒店集团的交互解决方案凯悦这是由以下步骤完成方式:

  • 凯悦确定其员工办理了“低挂的果实”常见的问题和情况,包括简单,常见任务,如建立一个保留或发现有关的奖励积分信息。
  • 人工智能解决方案为蓝本基于关闭这些基本的问题类型,建立广泛和代表性的一组相关的这套核心的简单任务的语音请求的例子。
  • 该系统已经就位并接受了培训,能够理解简单的命令,并将呼叫直接发送给能够处理这些请求的人员。

在未来10年,我们还可以预计,无法获得大量数据的小型企业,将获得预先培训过的人工智能平台的许可,并对它们进行调整,以满足它们的需求。例如,如果一家NLP公司与数十家连锁酒店合作,可以确定所有这些酒店的通用模式,那么这些“模式”可以用于启动呼叫路由技术,帮助缺乏数据来训练自己算法的小型公司。

在语音(而不是文本)基金NLP挑战

基于语音的NLP天生就在两个方面带来了挑战,入站方(听觉用户)和出站方(向用户“说”回)。在输入端,语音输入由于口音、背景噪音、同时说话等因素而变得更加复杂,同时还需要以观众熟悉的方式进行交流。

相比于基于文本NLP中基于语音NLP说话声音输出的附加层,产生出站侧挑战;例如,讲述了用正确的语调,正确地传达情感的话,等等。克服这些挑战,将涉及的基于语音的NLPs训练的附加层;一个方法来配置语音NLP代理将人力援助添加到基于数据的训练过程。这将使平台与准确度比数据集中饲养纯属培训的工作人员高得多的水平开始。

看看未来会发生什么

在社会因素方面,交谈家庭设备(如Amazon回声或谷歌主页)的主流接受正在讲话和基于语音通信更常见。然而,同时,这也导致我们这有利于与多模式功能的设备,如家用设备和可穿戴电子产品未来的环境,让观众互动通过多种渠道(如触摸屏用/手势识别集成语音识别)输入。等技术集成本质上是目前的挑战,但提高处理能力,我们能指望他们取得成果在不久的将来

采访中强调了

以下是迈克尔在面试中回答的最重要的问题。听众可以使用嵌入式播客播放器(在这篇文章的顶部)跳转到他们可能感兴趣的部分:

  • (2.57),而像销售支持和客户服务应用程序提示机器人接口相当常见,你能告诉我们一个共同的业务用例的语音基于语音NLP应用程序,以及如何的实施将是什么样子?
  • (4.01)什么是企业希望部署基于语音的自然语言处理平台的语音专用的挑战?(相对于基于文本的NLP)
  • (8.01)在培训方面,NLP平台准确响应的输入数据量有多重要?在缺乏足够数据的情况下,(请阅读sme)需要在语音NL过程中添加什么来解决这个问题?
  • (13.53),我们可以预计在不久的将来基于语音NLP空间颠覆性的技术变革方面是什么?您能不能给我们各种各样的技术路线?

订阅我们人工智能产业播客用你喜欢的播客服务:

iTunes的播客
soundloud播客
谷歌,播客
订书机,播客

标题图片来源:TheUnlockr

subscribe-image
保持在机器学习曲线的前面

在Emerj,我们有AI-集中的商业读者最多的观众在线 - 加入其他行业领导者和接收我们的最新人工智能研究,趋势分析,并将其发送到您的收件箱周刊的采访。

感谢您订阅的Emerj“AI优势”的通讯,检查你的电子邮件收件箱进行确认。