品味和艺术中的人工智能-理解偏好的机器学习的现状

丹尼尔Faggella.
头像

丹尼尔Faggella是Emerj研究部主管。在联合国叫,世界银行,国际刑警组织,龙头企业,丹尼尔是一个全球抢手的对企业和政府领导人AI的竞争战略意义的专家。

品味和艺术中的人工智能-理解偏好的机器学习的现状

人工智能和机器学习推动了技术创新营销,电子商务,以及其他几个行业。许多人都体验过人工智能和ML系统的好处甚至不知道它每次他们在谷歌上搜索或在Spotify上点击一首歌。

人工智能可以帮助推荐电影和音乐——是什么让这些系统无法识别葡萄酒或美术(如油画或雕塑)的品味?

在机器中培养艺术或烹饪“品味”的挑战,在某些方面与推荐电影或音乐的挑战有很大的不同。

在人工智能系统中构建艺术或烹饪“品味”的挑战

最近,搜索和推荐引擎似乎已经变得相当擅长理解用户的意图。特别是,在很多情况下,推荐引擎可以在首次出现在网站上并点击产品列表几分钟后就向网站用户推荐产品。这就好像推荐引擎能够弄清楚用户对音乐或服装的喜好一样。

该方法Netflix的建议电影或亚马逊推荐的产品 - 从人类是如何建议的事情彼此非常不同。机器是作为然而不能运用我们所说的“品位”和偏好​​人类理解的方式 - 他们只能通过在数据量寻找模式实现的理解味道的代理。在某些情况下(如电影或音乐的建议),这些代理可以在较人的喜好是非常有效和可扩展性。

有人可能会说,机器最终可能有能力鉴赏好的波尔多葡萄酒,但在目前的情况下,它根本无法做到这一点;机器无法从人类的角度“欣赏”任何东西,因此在没有人类用户反馈的情况下,它们无法判断葡萄酒的“好”或“坏”、味道的“好”或“坏”。机器只能根据人类输入的数据来判断味道的好坏。

此外,如果不能获得大量量化的、可重复的数据,机器还无法以任何合理的准确性确定这些质量。这种类型的数据并不总是可用的。当一种情况需要对一种难以量化(换句话说,味觉)的特定刺激进行主观评估时,机器将没有做出这种评估的基础。

然而,人工智能模型可以经过假设训练,在特定条件下准确预测口味偏好。在某些情况下,这些口味的代理决定因素是很容易得到的。在另一些情况下,它需要人类付出大量的努力来产生必要的数据,机器学习模型可以根据这些数据来理解味觉。

下面是一些人工智能和机器学习模型如何判断用户口味的例子:

音乐 - Spotify如何确定用户偏好

人工智能准确预测人类品味的一个具体例子是音乐。2016年,美国音乐产业的销售额超过70亿美元,其中68%来自Spotify等订阅流媒体音乐平台。这些音乐平台使用机器学习来通知他们推荐引擎。这些推荐引擎提供Spotify的听众提供理由,提供有关自己的口味他们建议认购。反过来,听众可能更愿意购买的音乐文件本身。

究其原因平台如Spotify的是销售音乐是他们的个性化预测如此成功。他们能够找出它们类型的音乐可能吸引到基于用户自己的历史和数以千计的其他用户用相似的外形和人口的参与特定用户。

Spotify拥有数百万用户的大量数据点,可以用来向某个特定用户做出相关推荐。它有关于听特定歌曲和倾向于听其他歌曲的人的量化数据,人工智能将这些数据解读为“喜欢”或“品味”。推荐引擎会记录特定类型的用户听一首歌或一段音乐的时间,他们暂停或重播某段音乐的频率,以及他们将这首歌纳入播放列表的频率。

2017年,在巴塞罗那的DataEngConf大会上,Spotify数据/后端工程经理甘道夫·埃尔南德斯(Gandalf Hernandez)分享了Spotify决定推荐音乐以及从音频中学习的一些过程:

Spotify的 - 通过各种手段 - 使用此数据作为代理“喜欢”,当它积累足够的数据(歌曲播放,歌曲评级,添加歌曲到播放列表等),也能准确地预测用户是听特定的歌曲将要相应听到旁边,并提出建议。也Spotify的笔记当一个特定的用户拒绝,以完善未来建议特定的建议。

例如,Spotify的首次用户可能会选择收听两首歌曲,这些歌曲都是古典音乐作曲家Sergei Rachmaninoff的碎片。这不会给出关于用户的AI资料,以提出良好的建议。但是,推荐引擎后面的AI有大量来自其他用户的数据,这些用户也听了拉赫玛尼诺夫的这两篇文章,所以它会查看其他用户接下来点击了什么,为这个新用户提供一些建议。

例如,“来自(某个国家)的其他用户下载了Spotify并立即收听拉赫玛尼诺夫通常最终喜欢[X]等歌曲。我们建议[X]等歌曲作为唾手可得的搞这个用户。”

当新用户点击下一首歌曲时,AI将使用此附加数据点来为此特定用户提供未来的建议。随着时间的推移,推荐引擎背后的AI将变得更好地“了解”这个用户在音乐中的味道或者至少更好地推荐他们的音乐。

这种所谓的“理解”的关键是,可以将大量数据输入推荐引擎背后的机器学习模型。AI并不是真正地推断或假设音乐类型可能符合用户的口味;它使用用户提供的基于响应、反应和行为的数据来进行判断。它的“理解”方法是关于概率和评估来自数百万用户的“喜欢”音乐的各种代理。

为弥补机器学习模型来处理这些数据的算法的能力起着模型进行预测和建议的能力的重要作用。这些算法往往会不断发生变化,因为数十个数据科学家经常对他们的工作,在任何给定的时间。

然而,即使是最好的算法是不通过它可以运行数据无用。幸运的是,音乐产业,这些数据是通过流媒体音乐服务的方式一应俱全。我们的听觉转化比较顺利进入数字世界。这不是我们的一些其他的感觉和与它们相关的味道等方面的情况。

葡萄酒——感官味觉与人工智能

人们可以争辩说,如果一台机器可以训练为“了解”或至少推荐产品,或者在谈到音乐方面的味道时,应该可以训练它在葡萄酒中做同样的事情。假设,是,机器学会如何识别用户在音乐中的味道时所展示的相同过程适用于用户在葡萄酒中的味道。然而,采样音乐与采样葡萄酒不同。它们涉及两种不同的感官,物理味道不会赋予数字化。

当用户点击一个音频文件,他或她可以在一个纯粹的数字环境中体验和日志的反应通过听音乐的,重演,选择一个相似的音乐,或者放弃mid-play甚至跳过的东西完全不同。所有这些数据点都是数字化的,这些数据点可以立即被机器学习模型处理。

或量化人们如何决定他们是否喜欢一个特别的葡萄酒不是不那么容易,因为预测一个特定的用户会喜欢的音乐类型。舌头本身不适合于数字化以同样的方式的耳朵做。收集数据的葡萄酒所需的接触发生在现实世界中,这是没有立即在数字空间完全存在机器学习模型。

如果想确定一个用户在酒的味道在其上的机器学习模型可以被训练的代理,他们将需要收集大量的数据在物理世界中,机器学习模型可发现模式。

此外,葡萄酒的味道是臭名昭着的主观。机器学习模型没有味蕾,所以它永远无法理解人类可以的方式信息信息。因此,确定用户的偏好是更困难的,或者味道,葡萄酒。它只能根据其化学成分和每种特征的感知值分配给葡萄酒的特定属性的值,使其成为人类投入定义的“好”葡萄酒。对于机器学习模型来说,准确预测对人们可能吸引什么类型的葡萄酒,建立模型的数据科学家需要以某种方式收集与葡萄酒偏好相关的可量化数据。由于这种数据需要在物理世界中收集,因此可能不是不可能的,但它可能是非常困难的。

量化因素可能包括:

  • 葡萄酒中的化合物
  • 葡萄酒中各种化合物的相对量(毫毫升)
  • 葡萄酒的颜色
  • 胜利的粘度
  • 葡萄酒种类(波尔多、仙粉黛等)

更有挑战性的是在人类感知中提炼人类“口味”的实际标签,例如:

  • “顺利”
  • “橡木”
  • “水果”
  • “酸味,但结尾平滑”
  • 等等……

为了真正将这些主观体验提炼成质量,从而可靠地用于推荐葡萄酒,需要进行大量的控制性品尝测试,测试对象是各种口味偏好的人,以及葡萄酒中可量化的因素(它的化学成分、颜色、等等)必须可靠地“绘制”在这些来自数千(或数万)人的主观经验报告之上。

还有其他挑战。人类在一天中听取100首歌是完全合理的。用100杯酒做同样的意思是急诊室的旅行。事情进一步复杂于食物的存在 - 因为可以用相同的葡萄酒训练,但是用相同的葡萄酒训练的可靠系统 - 但有数十种不同的食物菜肴(从奶酪蛋白质到鱼叉,更多)。

这可能需要在不同的地点,大量的参与者,和一些品酒会高度仪表,控制环境。这些参与者将被要求品尝随机选取几个葡萄酒。每个这些葡萄酒的将被预先分析,以获得它们的化学组成和所选属性将被分配一个编码质量。

然后每个参与者将被要求评价基于这些优势,如pH,花束,和甜味每个酒。根据收视率,与会者将在判断一个到10李克特量表酒。规模将量化参与者的判断,从理论上说,机器学习模型可以利用这些判断,以确定哪些可能构成‘好’与‘坏’的葡萄酒。

这种数据收集方法需要大量的时间、金钱和精力。训练机器做出合理准确的葡萄酒推荐所需的数据量需要几个月的时间。Spotify只需要30分钟就能收集到同样数量的数据。

也就是说,李克特规模判断是主观的,通常是异想天开的。同一个人可能会判断一天的葡萄酒是一天的“5”,另一个取决于他们的心情。另一种方法可以涉及更多客观的措施。例如,亚马逊将历史重大购买历史,以其推荐引擎。如果参与者为了评价葡萄酒,但在品酒时购买3瓶,那么机器学习模式可以将购买作为“喜欢”的代理,而不是参与者的判断。购买3瓶特定葡萄酒的人可能会认为葡萄酒是以某种方式的“善”。

由于这些挑战,如今的葡萄酒推荐更有可能来自购买数据,而不是任何对葡萄酒化学成分的稳健评估,或将这种化学成分“映射”到人类主观术语(如“顺滑”或“果香”)上。购买数据很容易。味蕾数据坚硬。

当所有的一切都说了并做了之后,在线购物者可能能够查看一瓶葡萄酒的产品页面,并被推荐其他葡萄酒。页面上的推荐引擎背后的机器学习模型可能能够确定,品酒会的参与者对购物者正在观看的葡萄酒评价很高,也可能对另一款葡萄酒评价很高。然后,推荐引擎将向购物者显示其他葡萄酒。

视觉艺术 - AI模型如何理解图片

最近,谷歌宣布与AI实验他们试图拍摄一张图片并对其进行编辑,使其更能取悦观众。根据谷歌AI的说法,机器学习“模仿专业摄影师的工作流程,从谷歌街景中漫游景观全景,并寻找最佳构图,然后进行各种后处理操作,创建一个美观的图像。”

然而,需要注意的是,“审美愉悦”是一个高度主观的概念。有些人喜欢的东西,有些人未必喜欢。这一切都归结于上下文。人工智能或许能够模仿专业摄影师的质量和工作,用于特定用途,比如为滑雪胜地做广告,但人们不希望在博物馆看到这样的广告。一张特定图片所处的环境会影响人们是否喜欢它。

从艺术的角度来看,视觉媒体就像葡萄酒一样难以判断。为了教会人工智能学会对视觉艺术的品味,有必要将其分解为机器能够“理解”的可量化代理。这可以通过给颜色、形状、手势和其他视觉元素的组合赋值,让人们在李克特量表上再次对这些组合存在的图像进行评分来实现。

幸运的是,收集视觉数据比收集感觉品味的数据更容易,因为视线转化为数字世界。Google Images,Facebook和其他Visual Media平台将图像上的数百万个数据点降至这些图像中的特定像素中的特定颜色。

机器学习模型可以消耗这些数据点并使用它们来对特定用户如何响应人脑解释为图像的这种像素数据 - 像素数据来进行预测。例如,机器学习模型可以确定加利福尼亚特定县中的人们更有可能回应主要涉及来自美国其他地区的人的颜色蓝色的图像。此确定可以向推荐推荐产品推荐给该国家的人的推荐引擎。它也可以通知营销活动针对人在该国与视觉广告。

人工智能并没有真正理解那个县的人喜欢蓝色图像,但它根据数据、数字和统计数据预测他们对这些图像的可能反应。

理解味觉的人工智能的现状

机器没有知觉。因此,他们到现在为止都不能拥有自己的喜好和口味,并不能真正理解使用它们的人的喜好和口味。他们非常好也许能做到这一点在未来,但这是一个比较遥远的前景。

目前,他们依靠数据进行预测和确定可能性,模仿人们“理解”彼此的偏好的方式,但没有真正掌握人类大脑能够理解的全部广度。随着时间的推移,这些统计机器学习方法可能会扩展到化学感官(味觉和嗅觉),但这样做存在内在的挑战,这是我们在本文中试图强调的。

图片来源:华盛顿共和国

保持领先于AI曲线

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

订阅“AI优势”简报:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
qwfwef

wwefwef

wefwefwef