技术提供商:自动化的见解是一个自然语言生成平台Wordsmith的提供商,将大数据转换成人类可以理解的叙述或摘要
用户企业:美联社是一家跨国公司,不以营利为目的的新闻合作。
行业:媒体
应用:商业智能和分析,过程自动化
问题
美联社(AP)记者花了很多时间和精力显著量由上市公司在美国发行的季度财务报告手动搜集的见解。这涉及提取和分析相关的财务数据,如利润,收入增长,所得税费用等,并将其转换为财务重述(新闻叙事散文或摘要)。
由于有限的时间和资源手册,美联社记者只生产了300每个季度,留下了数千所发布其季度公司盈利潜力的公司这样的文章。
所采取的行动
美联社使用了自动化洞察力的自然语言生成(NLG)平台Wordsmith来自动总结季度财务报告。这个NLG平台被配置为根据美联社的编辑标准进行编写。配置过程包括将美联社的编辑规则和相关财务数据输入到平台中,并对系统进行调整,以随时间调整预期的输出摘要。
自动化观察的发言人劳拉·普雷斯曼表示,美联社Wordsmith的初始配置需要一些艰苦的工作。扎克斯投资研究与AP的合作所提供的财务数据,它作为输入数据文件要被馈送到语言大师。自动洞察然后根据其标准化模板和指导方针,这是基于规则的指令语言大师使用召唤输出自动摘要转化这个数据文件。这些准则也包括AP风格指南。
下面的GIF显示了到Wordsmith的AP输入数据的结构和预期的输出摘要。
下面是说基于规则的指令,语言大师用来产生输出自动摘要一些样本截图:
根据Laura的说法,Wordsmith的配置周期约为两个月,在此期间,美联社记者与自动化洞察力团队协同工作,监视Wordsmith产生的错误,并不断调整系统,以最小化错误并提高整体性能。自动化见解声称,美联社的输出现在是完全自动化的,尽管美联社作者可以添加引用、上下文和观点。
下面的GIF演示了Wordsmith的功能,包括为叙述提供所需的数据、根据某些规则和输入数据生成自动摘要以及显示输出的预览。
摘要输出可导出为CSV或JSON文件和作为预置数据存储,或者它可以经由API输出到云,如谷歌驱动器。
应该注意的是,在这个实现的时候,自动化的洞察力只有他们管理的解决方案。该公司现在提供了这个解决方案的自助版本,大概不会涉及我们在这个案例研究中看到的那种实现和手动操作。
结果
自动化分析公司(Automated Insights)的数据显示,美联社公布的财务报告数量从每个季度300份增至4400份,增长了12倍。该公司声称,虽然其NLG平台还没有取代任何记者,但它解放了整个美联社相当于三名全职员工的时间。该公司还报告称,员工花在手工制作财务汇报上的20%的时间已经“解放”了。
国家公共广播电台的文章相比美联社记者和Wordsmith的写作风格是根据美联社的指导原则配置的,以及它们生成摘要文章所花费的时间。这篇文章声称美联社记者在7分钟内完成了摘要,而Wordsmith只用了2分钟就完成了输出。
下面是根据NPR文章输出(故事#1是从语言大师;故事#2是从AP记者):
虽然美国国家公共电台的文章提到Wordsmith在这个场景中花费了大约两分钟的时间来生成输出,但是Laura声称Wordsmith实际编写这篇文章所花费的时间更少。据报道,这两分钟的大部分内容涉及Wordsmith生成输出所需的数据输入。
根据劳拉的说法,Wordsmith据说可以处理大量的数据来生成任意数量的文章在几秒钟内,一旦系统已经配置。
转换思路
而新闻自动化是一个很独特的AI使用的情况下,也有一些从这个AI的实现,可以成为商业领袖的重要经验教训。
一个任务要被AI自动化,任务的边界必须是可定义的。撰写关于复杂国际事务主题的独特政治评论,不太可能是人工智能在不久的将来能够完成的任务。这种写作的必要背景包括对历史事件的了解,对全球领导人的心理评估,以及将不同事件和行动联系起来形成新思想的能力。这种工作对机器来说是具有挑战性的。
在美联社的情况下,他们的一些写作的参与远不如上下文。具有均匀的类型的数据,和规定的一种“输出”(在这种情况下,制品)的,任务治-能够通过机器。
同样重要的是要注意让运行这些系统所需的投资时间。这几乎是不可能为人类足够的结构和规则由AI系统立即成立始终如一的产品所需的结果。
以AP为例,该公司在最初的两个月里与自动化洞察力(Automated Insights)合作,发现并解决机器输出中的错误,逐步调整过程,以获得一致的高质量结果。任何打算用人工智能实现流程自动化的企业,都应该期待某种程度的类似培训和调整。