计算机视觉应用 - 购物,驾驶和更多

艾茵·德·耶稣
《阿凡达》

艾因作为AI分析师Emerj - 覆盖各行业的人工智能使用情况和趋势。此前,她曾在埃森哲担任各种角色。

计算机视觉应用的950×540

计算机视觉,人工智能技术这使得计算机能够理解和标记图像,现在被用于便利店、无人驾驶汽车测试、日常医疗诊断,以及监测农作物和牲畜的健康。

从我们的研究中,我们已经看到,电脑是在识别图像精通。如今,顶尖的技术公司如亚马逊,谷歌,微软Facebook的正投资数十亿美元的计算机视觉研究和产品开发。

考虑到这一点,我们决定找出如何在全球顶级的技术公司正在利用计算机视觉和探索什么样的新技术和新媒体可以在未来几年内出现过。

从我们的研究,我们发现,很多计算机视觉分为以下集群的使用情况:

  • 零售及零售保安
  • 汽车
  • 医疗保健
  • 农业
  • 银行业
  • 产业

在为您提供本行业的应用报告中,我们的目标是让企业领导者在市场上可用的应用程序的鸟瞰图,并帮助他们确定AI是为他们的业务的解决方案。

零售及零售保安

亚马逊

亚马逊最近向公众开放的亚马逊去存储在那里的购物者不必排队在收银台等待支付购买。位于华盛顿州西雅图市,围棋店配有专业从事计算机视觉相机。它最初只允许亚马逊员工的购物者,但在2018年初欢迎公众开始。

这背后转到存储耗尽该技术被称为刚往外走。如在该一分钟的视频所示,购物者进入商店的栅极之前激活IOS或Android移动电话应用。

由于在视频中也看到,摄像头被放置在上面的过道和货架上的天花板上,利用计算机视觉技术,该公司的网站索赔这些相机必须确定当对象从架子上取,谁把它拿走的能力。如果某项返回到架子上,该系统还能够从客户的虚拟库移除该项目。摄像机的网络允许应用程序在任何时候都能跟踪店里的人,确保其账单正确的项目,以正确的顾客,当他们走出去,而不必使用面部识别。

正如它的名字所暗示的那样,顾客一旦有了他们的产品,就可以自由地走出商店。然后,该应用程序将向他们发送在线收据,并将产品的成本计入他们的亚马逊账户。

虽然商店已经取消了收银员,纽约时报报道说,店里的员工仍然可用来检查商店的酒精区分ID,进货上架,并与寻找产品或过道协助客户。亚马逊代表也证实重新编码人类名员工在进入商店屏风后工作,帮助训练算法和纠正他们,如果他们错误地检测项目被撤下货架。

亚马逊没有透露对围棋店在长期的计划,但该公司已注册商标围棋在英国。

虽然亚马逊在2017年购买的全食,吉安娜Puerini,副总裁,亚马逊围棋,说过该公司没有计划落实刚刚走出技术在连锁超市。

在零售时装,亚马逊已经申请了专利用于虚拟反射镜。在专利,该公司表示,“出于娱乐的目的,独特的视觉显示器可以提高用户的经验。”

虚拟镜像技术,勾勒下面的专利图像中,被描述为一个混合现实显示这使购物者的图像转换成的增强场景,并提出个体在虚拟衣服。

亚马逊的虚拟镜像的专利图片
从美国专利局图片

根据该专利,虚拟反射镜将使用增强的面部检测,计算机视觉,其算法将定位眼睛的子集。捕获用户的眼睛的位置将让系统知道什么对象的用户在镜子里。然后,算法将使用这些数据来控制投影机。

亚马逊还没有就这一开发做出任何声明,虚拟镜像也没有部署,但是草图由专利局显示用户如何能看到反射镜与从所述显示装置发送来创建场景的图像组合的照物体释放。

例如,根据专利说明,所传送的图像可以显示一个场景,说山间小路,软件就会把购物者进入现场,并有可能叠加虚拟的衣服到他身上的反映。脸部追踪传感器和软件将显示从各个角度形象逼真。购物者将能够在几个服装尝试,而无需把他们。

亚马逊虚拟镜像过程中的专利图像
这从亚马逊的专利形象进一步描述背后所提出的虚拟镜像是如何工作的步骤。

还有亚马逊的虚拟镜像没有可用的demo,但是这里有一个2分钟视频sample of how Kinect’s on-the-market Windows virtual mirror works, showing a shopper “trying on” outfits, superimposing it on the image of her body in the mirror, following her movements, and even changing the color of items at her voice command:

亚马逊此前发布回声看,语音激活的相机,可拍摄照片和个人衣橱的六秒钟的视频,并建议服装的组合。

这篇两分钟的应用评论展示了它是如何使用亚马逊的虚拟助手Alexa来帮助用户编辑衣服的图片,甚至可以推荐个人穿哪件衣服更好看。

由于视频节目,用户可以发言的小工具,并指示它采取全身照片或六秒钟的视频。内容被整理来创建用户的衣橱清单,根据亚马逊。Alexa的比较两张照片在不同的衣服用户,并建议看起来更好。

据亚马逊,回声外观配备了深度感应摄像机和计算机基于视觉的背景虚化,重点用户的图像上。该公司的家庭自动化产品线的一部分,它旨在为消费者和售价为$ 200。如果任何零售企业都用它目前尚不清楚。

StopLift

在零售安全的具体杂货,位于马萨诸塞州的StopLift声称已经开发出一种计算机视觉系统,可以在连锁店减少盗窃和其他损失。本公司的产品,被称为ScanItAll,是一个系统检测检出错误或收银员谁避免扫描,也被称为“求爱的时候了。”求爱是勾结在结账时扫描产品,谁可能是朋友,家人或同事雇员顾客假的收银员的行为。

ScanItAll的计算机视觉技术的工作原理与杂货店现有的天花板安装的摄像机和点的销售终端(POS)系统。通过摄像头,软件的“手表”收银员扫描所有的产品在收银台。未在POS扫描的任何产品被标记为“丢失”的软件。被通知该损失后,该公司说,它是由管理层采取下一步搭话的工作人员,并采取措施防止类似事件再次发生。

使用的算法,Stoplift声称ScanItAll可以识别求爱的行为,如覆盖条形码,在彼此的顶部堆放物品,跳过扫描并直接装袋的商品。

下面这段三分钟的视频展示了ScanItAll如何检测在结账时跳过的物品的多种方式,比如分发、随意体重滥用、掩盖等等,以及杂货店老板如何可能制止这种行为。

在一个StopLift案例研究Piggly威格利,StopLift索赔由于计算机视觉系统,在它的两个杂货商店的求爱发生率已经减少部署。从损失的总金额为每月$ 10,000因涉嫌未能在结账扫描物品,损失已经降到每月$ 1,000。这些损失大多认定为错误,而不是可疑行为,根据StopLift。Piggly Wiggly的代表说该收银员和工作人员告知,该系统已经实施,但目前还不清楚是否是影响最终结果。

根据新闻报道,该公司声称已经安装在一些超市在技术罗得岛州,马萨诸塞澳大利亚虽然任何情况下,研究已经正式发布。

CEO马来昆都拥有科学的电气工程和计算机科学技术的麻省理工学院硕士学位。在此之前,他领导确定机场恐怖分子招牌RECO协会(许可人的面部识别公司Viisage)的实时面部识别系统的发展,并不断交付了第一个这样的系统的美国陆军研究实验室。

汽车

按照世界卫生组织,超过125万人每年死于交通事故的结果。世卫组织还说,这一趋势预计到2030年,如果不采取持续的行动,成为死亡的第七大原因。近一半的路途伤亡都是“弱势道路使用者:”行人,骑自行车和摩托车。根据这项研究,有一个明确的主题绝大多数这些事件:人为错误和疏忽。

Waymo

一家公司声称可以使驾驶更安全ISWaymo。原名谷歌自动驾驶汽车项目,Waymo正在努力提高人们的交通,建立在自驾车和传感器技术在谷歌实验室开发。

公司网站报告通过这种方式,mo汽车配备了传感器和软件,可以探测到三个足球场以外的行人、骑自行车的人、车辆、道路施工和其他物体的360度移动。该公司还表示,该软件已经在700万英里的公共道路上进行了测试,以训练其车辆在日常交通中安全行驶。

下面给出了3分钟的视频招摇过市Waymo车可前往[如何自主。

根据视频,它能够按照它的方式交通流量和法规,检测障碍物。例如,当一个骑自行车的人伸出他的左手,软件会检测手势,并预测如果骑车者移动到另一条车道。该软件还可以指示车辆不得不放慢速度让骑车人安全通过。

该公司声称使用深层网络进行预测,规划,测绘和模拟通过不同的情况,比如建筑工地训练车辆机动,让位给应急车辆,腾出空间来车是停车场,并停止为过街行人。

“雨滴和雪花可以自驾车创建传感器数据的很大的噪音。机器学习可以帮助我们过滤掉噪音和正确识别行人,车辆多,”在写德米特里·多尔戈夫,Waymo的首席技术官兼工程副总裁的博客。他拥有物理和技术莫斯科学院和密歇根大学的计算机科学博士学位的物理和数学科学硕士学位。

有报道称,一个Waymo面包车在事故中涉及在亚利桑那州,同时用方向盘后面的司机,但警方说,自动驾驶仪软件不认为是有过错。

在它的网站该公司表示,它打算将这项技术应用到从叫车和物流到公共交通和个人车辆等各种交通工具上。根据Waymo发布的消息,该公司已经与之合作克莱斯勒和捷豹在自动驾驶汽车技术。

特斯拉

这要求它已经开发自动驾驶汽车的另一家公司是特斯拉,它声称它的所有三个自动驾驶仪车型都配备了完整的自我驱动能力。

每辆车,网站报道,配有八台摄像机对汽车周围360度的知名度与大约250米的观看距离。十二个超声波传感器使汽车检测软硬兼施对象。该公司声称,一个朝前雷达使车重过雨,雾,灰尘,连车提前看。

它的摄像系统,称为特斯拉愿景,可与该公司声称是建立一个深层神经网络,并能够领会的环境,让汽车导航道路复杂的视觉处理工具。

这3分钟视频表演节目有他的手离开方向盘,脚离开踏板驱动程序,因为他们通过高峰时段的交通移动在特斯拉汽车自动驾驶仪。

去年2018年3月,特斯拉自驾车参与了一个致命的事故而自动驾驶仪订婚了。该报告称,司机并没有把他的手轮,尽管平台的警告,告诉他这样做。在六个秒手没有在方向盘上,他的SUV撞混凝土护栏,杀死司机。后来发现,司机也没有车在撞车前激活刹车。

介绍了特斯拉汽车最新的软件改进,包括更多的警告司机,以保持他们的手在方向盘上。经过三年的警告,该软件会阻止运行,直至驾驶员重新启动汽车,据该公司。

医疗保健

在医疗保健,计算机视觉技术正在帮助医护人员准确分类状况或疾病这可能潜在地挽救病人的生命通过减少或消除不准确的诊断和治疗不正确。

高斯手术

高斯手术已经开发出血液监视期间医疗情况的描述,以估计在实时失血解决方案。该解决方案,该网站报道,最大限度地提高输血和识别出血比人眼更好。

血液监测解决方案的高斯手术的海卫线包括海卫或者使用一个基于iPad的应用程序内对手术海绵和吸罐的血液采集图像。这些图像由基于云的计算机视觉和机器学习算法来估计失血处理。该公司表示,该应用目前使用的是在外科手术或分娩剖腹产在医院手术室的医疗专业人员。

这段6分钟的视频向Triton展示了如何捕捉在医疗过程中吸收血液的海绵或布的图像,作为实时扫描仪,并评估患者失血的可能性。高斯外科首席执行官Siddharth Satish解释了该解决方案如何使用计算机视觉技术来预测出血的发生。

海卫或APP进行临床研究,在分娩时设置验证准确度和精密度,并且是清除2017年由美国食品和药物管理局批准。

高斯在2017年手术进行的剖宫产术中血量测定的准确性在圣克拉拉谷医疗中心的研究。通过计算机视觉(比色图像分析),应用确定外科海绵和在期间剖宫产分娩从50名患者收集的抽吸罐的血液量。

当应用程序的估计是与产科医生的视觉概算相比,人们发现应用程序的估计是更准确,呈现医院有可能改善临床结果的机会。

Kevin Miller是高级算法科学家。他拥有斯坦福大学计算机科学硕士学位。

DeepLens和DermLens

亚马逊网络服务(AWS)也开发DeepLens,可编程深启用学习摄像头,可以在任何一个行业的开源软件集成。在这视频,DeepLens被描述为一个套件,来自不同行业的程序员可以用它来开发自己的计算机视觉应用。

使用该DeepLens相机是一个医疗应用DermLens它是由一家独立的初创公司开发的。DermLens旨在帮助患者监测和管理一种叫做银屑病的皮肤状况。DermLens是由一家名为Well的数字健康创业公司开发的,该公司的Terje Norderhaug拥有奥斯陆大学(University of Oslo)的系统设计硕士学位。DermLens应用程序旨在为医生和护理团队提供持续的护理服务,其中报告的数据可供他们使用。

这段4分钟的视频指导开发人员如何使用DeepLens工具包创建和部署一个对象检测项目。

根据视频中,开发人员需要用自己的用户名和密码进入亚马逊网络服务(AWS)管理控制台。

在控制台中,开发人员必须选择预填充的对象检测项目模板,然后在适当的字段中输入项目描述和其他值。控制台有一个方法,在这个方法中,项目将部署到开发人员的目标设备上,并使开发人员能够从自己的屏幕上查看输出。

对于DermLens,这个短片解释了应用程序的算法是如何培训,认识牛皮癣,通过与皮肤45倍的图像,通常表现出红色和鳞片段喂养它。组中的每个图像附带表示异常皮肤的掩模。计算机视觉装置然后将数据发送到应用程序,而这又呈现与银屑病的严重程度的估计用户。

该DermLens队也创造了额外的症状,如瘙痒和疲劳自我报告移动应用..

在一个案例分析发表在Journal of美国皮肤病学,已经在92名患者,其中72%的人使用DermLens相机与使用智能手机相比优选测试DermLens权利要求。该研究还发现,接受调查的患者中有98%表示,他们将使用该设备将图像发送到卫生保健提供者,如果该设备可用。

目前,搜索公司网站和网页不会显示任何客户端。

农业

一些养殖场开始采用计算机视觉技术,以提高他们的业务。我们的研究表明,这些技术旨在帮助农民采用更有效的生长方法,增加产量,并最终增加利润。我们已经覆盖农业人工智能应用在与该地区更广泛的兴趣的读者非常深入。

Slantrange

Slantrange提供计算机视觉装备无人机的权利要求连接到该公司所谓的“智能系统”由传感器,处理器,存储设备,网络,人工智能分析软件和其他用户界面的测量和监测作物长势。在120米以上的地电平,所述相机具有4.8厘米/像素的分辨率。然而,其网站上指出,飞下提供更好的分辨率。

该公司声称,该领域的无人机捕获图像显示较健康的作物的不同的签名“强调”作物。这些压力包括虫害,营养不足和脱水;和指标,估计收获潜在的收益率,等等。这些签名传递到SlantView分析系统,解释数据,最终帮助农民进行有关治疗应激条件决定。

这5分钟视频提供了关于如何使用SlantView应用程序的基本功能,从用户如何可以使用溶液通过雄蜂拍摄图像,以确定应力区域的教程。

根据案例分析On Target Imaging的老板亚历克斯·彼得森(Alex Petersen)认为,将他们的农业方式从模拟农业转变为数字农业,可以用更少的投入获得更多的作物,并转化为更高效的农业。

使用Slantrange 3P传感器雄蜂,该球队飞到和映射所述第一250英亩玉米田的,以确定从上述作物应力的区域。这让他们收集与土壤中的高硝酸盐水平,这将甜菜作物产生负面影响区域的数据。

研究小组随后处理了SlantView Analytics(分析),其算法进行了培训,以确定工厂是准确计数作物或杂草中的数据。Slantange声称其无人驾驶飞机仅需要17分钟的飞行时间,以覆盖40英亩字段,相当于约8分钟的数据处理。亚历克斯报告它耗时约3小时结合飞行和数据处理,以产生应力所覆盖的区域的映射。

将得到的数据使团队使用15%至氮肥少20%的500英亩,其翻译成约30-40磅每英亩或$ 9至$ 13%英亩积蓄来决定。他们还预计玉米健康和估计每英亩约10蒲式耳作物产量的增加。合并的储蓄,较高的产量和增加利润已让球队挽回实施精准农业的投资,根据博客。

在Slantrange首席执行官Michael里特尔,先后从美国加州大学圣地亚哥分校和和MBA乔治敦大学的机械工程学士学位。自1996年以来,迈克尔一直在开发机载情报系统在地球科学,国防和农学领域的应用。在此之前Slantrange,他是光电系统和任务系统的经理在通用原子航空系统的主任,负责监管情报有效载荷的发展为一些无人驾驶军用飞机。

Cainthus

动物面部识别是都柏林的一个特色Cainthus宣称提供。Cainthus使用预测成像分析监视的健康和农作物和牲畜的健康。Cainthus使用预测成像分析监视的健康和农作物和牲畜的健康。

下面这段两分钟的视频展示了该软件如何利用成像技术在几秒钟内根据隐藏模式和面部识别识别出奶牛个体,并跟踪关键数据,如食物和水的摄入量、热量检测和行为模式。这些信息由人工智能算法获取,并向决定牛奶生产、繁殖管理和整体动物健康状况的农民发送健康警报。

Cainthus还声称,它能提供诸如作物生长速度、一般植物健康状况、压力源识别、果实成熟和作物成熟等方面的全天候作物分析。

嘉吉(Cargill)是一家农产品生产商和分销商,产品包括糖、成品油、棉花、巧克力和盐。该公司最近与Cainthus合作,将面部识别技术引入全球奶牛场。这笔交易包括嘉吉(Cargill)的少数股权投资,不过交易条款没有披露。

据2018年2月的新闻报道,嘉吉和Cainthus正在使用猪的试验,并致力于在今年年底推出商业应用。此外,还计划扩大应用到家禽和水产养殖。

Victor Gehman是Cainthus公司的科学主任,也是华盛顿大学的物理学博士,他负责图像处理、数据分析、计算机建模、机器学习/特征检测、计算机视觉、光学、机械原型和现象学分析。他的经验洞察数据科学作为四年多一个老乡让他积累的技能和专业的网络转型,从学术界到数据科学行业。

银行业

而我们之前的大部分报道人工智能在银行业有参与欺诈检测和自然语言处理,一些计算机视觉技术还找到了进入银行业也是如此。

Mitek的系统

Mitek的系统提供使用机器学习对护照、身份证、驾照和支票等文档进行分类、提取数据和身份验证的图像识别应用程序。

通过使客户的应用工作采取ID的照片或使用他们的移动设备发送到用户的银行纸质支票,其中对银行的侧面验证真伪的电脑视觉软件。一旦核实,并通过用户的银行接受,应用程序或检查处理。对于存款,基金通常会变成可用的工作日内的客户,根据Mitek的公司网站。

下面给出了两分钟的演示在手机上Mitek的软件工程如何捕获检查的图像存入一笔账:

要启动的过程中,用户输入自己的手机号码到银行的申请表。一条短信将发送到他的手机与一个链接,用户可以通过单击打开图像捕捉体验。客户可以从一个驾驶证,身份证或护照选择。Mitek的的技术识别数以千计的身份证件来自世界各地。前部和ID或文件的影像是必需的。

用户一旦提交的图像,应用程序将实时反馈,以确保高品质的图像被捕获。该公司声称,它的算法纠正图像;dewarp,抗扭斜,失真和较差照明条件。

移动检测验证该用户在他的桌面上开始了自己的会话,因此一旦完成处理,它会自动提供提取到在这种情况下选择用户的频道,桌面数据。

一个客户,密歇根州的商业银行,希望通过提供零售银行客户提供数字化服务,以扩大其零售银行投资组合及相关核心存款。该银行选择了Mitek的的应用程序调用移动存款,使客户存款使用他们的智能手机摄像头检查。

Mitek称,仅仅用了30多天就实现了这个应用程序。根据这项研究,在四个月内,该银行20%的网上银行用户开始使用移动银行。

在同一时期,由于移动银行的使用从平板扫描仪解决方案转向移动银行,银行消费者存款捕获项目的月注册人数增加了400%。

该公司首席技术官斯蒂芬•里特(Stephen Ritter)负责Mitek实验室和工程。在Mitek之前,Ritter负责Emotient技术,这是一家被苹果收购的面部分析初创公司。他还在Websense(现在的Forcepoint)和McAfee担任技术领导职务。他拥有圣地亚哥加利福尼亚大学认知科学、计算机科学、经济学学士学位。

产业

鱼鹰情报

在工业领域,计算机视觉等应用鱼鹰情报被用来监控关键的基础设施,如远程井,工业设施,工作活动和网站的安全状态。在其网站上,该公司列出了壳牌和雪佛龙作为其之中客户

在一个案例分析该公司的一位客户声称,Osprey公司针对远程油井的在线视觉监控系统,帮助该公司减少了网站访问量和相应的成本。在大宗商品价格低迷的情况下,该客户正在寻求提高石油生产效率的方法。该研究指出,它转向Osprey,在几个设施部署虚拟监控系统,用于业务监控和安全,并确定新的应用程序,以提高生产率。

鱼鹰Reach计算机视觉系统被部署到客户的高优先级井场,提供特定井区的15分钟延时图像,并可选择按需图像和实时视频。“鱼鹰”还被部署在一个远程坦克电池上,使操作人员能够读取坦克液位并查看控制区域。

根据该案例研究中,客户能够通过50%,自部署鱼鹰的解决方案,以减少日常实地考察。对于在人以及现场检查的平均费用也从$降低20到$ 1。

下面示出了如何鱼鹰覆盖率溶液权利要求,以允许操作员远程监视油井,进出图像的缩放,以确保有在周边区域没有泄漏3分钟的视频。按需视频也显示出抽油机在一个正常的节奏运行。

据该公司介绍网站,那可能会使用计算机视觉工业设施的清单包括石油和天然气平台,化工厂,炼油厂,甚至是核电厂。通过传感器和照相机收集的信息被传递给它提醒维修部门采取安全措施,甚至在通过应用程序检测丝毫压力AI软件。

总结思考

计算机视觉应用已经出现在更多的行业中,尽管有些行业比其他行业更快地采用了这项技术。无论存在何种计算机视觉技术,它都继续依赖于人的因素来监视、分析、解释、控制、决定和采取行动。

在汽车行业,谷歌和特斯拉(Tesla)等全球公司正在改进配备了计算机视觉摄像头的自动驾驶汽车。然而,随着致命事故的报道,很明显,这些汽车还没有完全准备好投入市场,也不能完全自动驾驶。

在像Amazon Go这样的零售商店中,人类员工继续在客户服务部门工作,并在屏幕后面培训算法,确认机器学习能力已步入正轨。在零售安全方面,该技术可以帮助捕获盗窃事件的视频,但人力资源必须介入来纠正员工的错误。

在农业计算机视觉的应用一直很缓慢起飞。但企业如Cainthus纷纷进入这个市场,旨在采取与其他行业的技术,并将其应用到农业。这些应用程序声称能提供农民有机会进行精耕细作,提高产量以降低成本。Cainthus和嘉吉公司的合作可能打开其他形式的人工智能行业的其余部分。

标题图片:TechTheLead

艾曲线保持领先

发现关键的AI趋势和应用,在企业的未来和输家独立的赢家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
机器学习曲线保持领先

在Emerj,我们拥有最大的关注人工智能的在线商务读者群体——加入其他行业领袖的行列,每周收到我们发送到您收件箱的最新人工智能研究、趋势分析和访谈。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。