国防部门的数据挑战

丹尼尔Faggella
头像

丹尼尔是Emerj的研究主管。在联合国、世界银行(World Bank)、国际刑警组织(INTERPOL)和许多全球企业的呼吁下,丹尼尔成为了一名颇受欢迎的专家,研究人工智能对企业和政府领导人的竞争战略影响。

国防部门的数据挑战

情节概要:本周,我们将讨论国防部门。我们采访了Kyndi的首席执行官Ryan Welsh,这是一家致力于可解释人工智能的公司。我们特别关注国防工业独特的数据挑战,以及人工智能在国防领域的广泛应用。国防部门必须处理的许多挑战转移到其他空间和部门。处理极端脱节的文本信息(有时被称为“暗数据”)和各种语言或不同方言的信息的企业领导人,将能够与本节中讨论的一些独特挑战产生共鸣,甚至可能获得一些如何处理这些信息的见解。

订阅我们的人工智能产业播客用你喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
订书机,播客

客人:瑞安威尔士,创始人兼首席执行官- - - - - -Kyndi

专业知识:经济学

介绍识别:Welsh拥有Rutgers大学应用数学-经济学硕士学位,以及圣母大学(University of Notre Dame)工商管理硕士学位。

采访中强调了

(03:00)在引入人工智能方面,防御有什么独特之处?

RW:我想说防御中最具挑战性的事情是你正在处理的数据。它通常是非常脏的数据,文本的片段。不幸的是,在你从别人那里得到它之前,他们不会给你贴上标签。这也是一个挑战。所以我认为防御中最重要的是你所做的操作的实际数据。

当然,当你申请AI和机器学习技术,它确实归结为“你必须标签数据?是数据干净吗?”最终,那将导致您使用了系统的价值。因此,最大的挑战是数据的肮脏。

(04:00)是什么让数据额外的挑战?

RW:通常,你会在战场上收集数据。举个例子,如果你去一个小镇,你会去收集硬盘,收集收据,收集所有的东西。你会想要对此进行分析。你想把它交给分析师,看看他们在做什么。我是说,这不是什么新鲜事。历史上他们一直在做军事。它正在收集其他军事战斗人员的信息。

所以,当你收集这些片段时,它们可能都被撕碎了,因为他在那里扔了一枚手榴弹。这是非常肮脏的数据和非常干净的数据是大学毕业生自己写的。

我们不是在指挥。我们要把它从这个世界上撕成各种可怕的形式。所以它可能在,你知道,在阿拉伯语里,储存在某个地堡里。现在我们必须弄清楚这里是否有一个计划与攻击这两个堡垒有关,我们认为可能会有一些,你知道,先发制人的打击或类似的事情发生?

我认为处理它的最好办法就是要下去的话中的人物等级。所以实际上踏踏实实地人物,喜欢到单词中的字母。If you’re building a knowledge graph type network where you’re doing so reasoning over it and things like that, you may just be chunking words, but you actually need to go down a level of granularity down to the individual characters and start to draw connections between all the different characters to words. Words to sentences. Sentences to other sentences. And specifically local dialects as well and that really becomes a challenge. Like if you take an NLP parser from Stanford NLP for Arabic, that’s going to be trained on your standard Arabic versus local dialect. So it’ll fall over.

你必须在野外进行。所以我提出这个问题的原因是人工智能之所以能在今天发挥作用背后的一个重要论点就是你在数学计算资源中所拥有的数据量。那么,在边界上你能输出多少计算资源呢?所以你现在需要高效的算法,在有限的资源下,在脏数据上工作。这些都是在防御中使用人工智能和其他机器学习技术所带来的挑战。

(11:00)谁在乎这个?是古怪的创新部门吗?还是有其他的防御元素开始觉醒并说“我们可以使用这个吗?”

RW:是啊,我想大多数人想念国防和情报的是,他们在政府部门将其捆绑。他们认为这是繁琐,缓慢的官僚机构。坦率地,在国防和情报的人是非常挑剔的,分析客户。他们一直在做它永远。这是他们的工作得到了情报数据。那么,谁感兴趣AI国防部门?每一个部门,他们已经很长一段时间。这不是什么新东西给他们。他们一直有数据,他们一直都有的计算资源,使这些技术有效。所以他们非常挑剔的客户。

我们需要开始把人工智能当作一种功能,而不是产品,对吧?很多人认为它是产品。它只是一个为客户提供价值的产品的特性。因此,我们需要改变思维方式,不要再说“我卖给你人工智能”,而要说“我卖给你一个解决问题的方案”。

采取一些简单的企业搜索。很多人都在使用弹性搜索。而且它是一个方面惊人的搜索引擎。然后你需要像你看到正在对斯坦福问答数据集发表什么的基于人工智能的搜索,没有人会混淆这一种先进的问答系统基于弹性字词的搜索。

我认为我们需要移动一些像那样简单的东西,然后说“嘿,我现在在我的企业搜索能力中有了人工智能。我现在可以给你更好的信息比你可以用一个基于术语的搜索快得多。像这样简单的事情,你可以走进任何一位高管,说:“我有一个企业搜索能力。”AI是其中的一部分。正因为如此,你们的人每天可以节省两个小时。”

It’s something so simple that I feel like with AI, people kind of go towards this kind of bigger picture automating the way, you know, giant groups of people, as opposed to hey, no just make an enterprise search better, and save an hour of everyone’s day.

(16:00)在前沿创新方面,我们期待就像真正出血边缘采用的无论是搜索,视觉,传感器,名堂,在某种意义上是那种发生在国防部内,还是防守种内的公共意义?

RW:所以,从我的经验,更大的系统集成商都在采取已被证明的工作一类的问题的技术,然后以规模做他们真的很不错。和公司喜欢我的那种推什么是可能与AI的限制。而且有国防工业内的都愿意直接与我们合作,要进行测试组。然后,我们要么规模。

以Palantir这样的公司为例,他们能够根据合同的规模进行扩张。像我们这样的人,我们还在研究。我们是否有一个完成合作伙伴?比如更大的SI?还是像Palantir那样引入或构建服务组件?

有一件事政府做得很好,我想可能是从Palantir开始的,我想Palantir是在2005年成立的,政府做了一件了不起的工作,现在直接与创业公司打交道。他们做了一件了不起的工作,直接与硅谷的人见面。

我的意思是,每当我需要有人在华盛顿参加某个会议或其他活动时,他们通常会说:“我将在未来30天内到达硅谷。”所以我们应该在你的办公室见面。“我认为政府自2005年以来取得了非凡的成就。

他们有这样的武器对于这一点,太,对不对?DIU一样,这曾经是DIUX就出在这里,他们在奥斯汀有一个。我认为波士顿的一个。所以,是的,我听说有一个国防科技大学是有这个企图基本上与时并进。我认为他们意识到,它不会是你想要的东西来链接涓涓细流。就像我们必须跳,因为其他国家都在跳。所以,它听起来像有实际上是启动世界与政府之间的接口,也许比呢?

嗯,他们已经采用或适应了,因为如果你想想创新的历史,可能在90年代之前,所有的创新都来自于大型机构,无论是贝尔实验室,美国国防部高级研究计划局,这些大型机构。然后突然间,他们开始看到扩散就像小的创业公司可以建立非凡的东西因为写代码很便宜,对吧?

他们必须适应这一点。他们不能再仅仅和5个组织对话,并获得美国所有的创新。他们现在不得不与5000人对话。我认为这对他们来说是一个挑战可能从80年代中期到90年代早期一直到2005年,但是之后他们认识到了这一点并且从2005年到现在变化非常快。

(21:00)在未来的人工智能规范中,我们认为什么是比其他事情更容易实现的目标呢?

RW:是的,所有建立在经典企业数据之上的东西,经典的结构化企业数据,都将包含机器学习。将过去25年的每个应用程序都加入ML。现在您就有了预测能力,对吧?我的意思是,这就是实际情况。但真正能显著改变一切的是人工智能对非结构化数据、文本数据和人类通信的影响。这是一个很难解决的问题。

有些人已经开始地址,像我们专注于非结构化的文本数据。这就是要去,我认为,从根本上改变。所以,我认为有三条腿的凳子企业。你经典的结构化数据。你有你的机器生成的数据,让你像物联网平台和其他的东西。然后,你有这样的非结构化的文本数据。而且他们那种三条腿的凳子。

我们已经解决了物联网数据和结构化数据的存储分析,但我们还没有解决存储问题,最终解决的是对非结构化文本数据的分析。那是因为机器不能很好地理解语言。

订阅我们的人工智能产业播客用你喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
订书机,播客

标题图片来源:世界杂志

艾曲线保持领先

发现关键的AI趋势和应用,在企业的未来和输家独立的赢家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

在Emerj,我们有AI-集中的商业读者最多的观众在线 - 加入其他行业领导者和接收我们的最新人工智能研究,趋势分析,并将其发送到您的收件箱周刊的采访。

感谢您订阅的Emerj“AI优势”的通讯,检查你的电子邮件收件箱进行确认。