手势界面中的人工智能 - 可能的近期应用

Ayn de耶稣
头像

Ayn在Emerj担任人工智能分析师,涵盖各行业的人工智能用例和趋势。她曾在埃森哲担任多个职位。

手势界面中的人工智能-可能的近期应用

基于手势的界面是允许用户用手和身体其他部位控制设备的应用程序。如今,它们被应用于家庭自动化、购物、消费电子、虚拟现实和增强现实游戏、导航和驾驶等设备中。

一项研究报告说零售市场中的全球手势识别预计将从2018年到2023年增长27.54%。迄今为止,一些顶级产品生产商包括英特尔苹果微软, 和谷歌

根据一项名为基于计算机视觉的手势识别在美国,手势识别有两种方式:数据手套传感器设备将手和手指的动作转换成数字数据,以及使用摄像头的计算机视觉。第二种方法可能会让人类与机器更自然地互动,因为它让双手自由活动。计算机视觉将是本研究的重点,特别是它涉及:

  • 家庭自动化
  • 卫生保健
  • 汽车
  • 虚拟现实

技术如何工作?手势识别包括三个层面:检测、跟踪和识别:

  • 检测提取由手或身体运动产生的视觉数据在摄像机的视图。
  • 跟踪逐帧监控数据,确保每个动作都被捕获,使数据分析和解释更加准确。
  • 识别对提取的数据进行分组以找到模式。根据算法的训练,它可以找到匹配,并确定刚才执行的手势的类型。一旦识别出手势,系统就会执行预期的动作。

通过这项研究,我们希望能够对正在研究识别手术识别工具实施的商业领袖来了解。

卫生保健

GestureTek公司

GestureTek公司提供配备有手和车身跟踪软件,运动传感显示表面和使用计算机视觉的虚拟技术的应用。该公司声称,其触摸和无意识的手势识别应用可以嵌入到多种电子硬件,例如玩具,游戏或电子设备。

以下是Gesturetek如何使用其Irex软件进行健康的视频,以帮助恢复身体医学患者重新获得它们的运动范围:

如上所述,患者由头像引导,以进行运动,从低范围开始,增加到高度的运动。演示表明,运动后来应用于类似的游戏场景,以增加对活动的参与。

艾伯塔省儿​​童医院需要一个系统,可以帮助其治疗师康复和疾病管理的年轻患者。

GestureTek表示,他们提供了IREX(交互式康复和锻炼系统),该系统使用绿屏技术让患者沉浸在虚拟的运动或游戏环境中,如登山和滑雪,如下面的视频所示:

互动活动是由艾伯塔省卫生服务部门的物理或职业治疗师规定的,目的是建立平衡、活动和耐力。该公司声称,该系统可以跟踪患者在治疗和治疗过程中的活动,让健康专业人士看到哪些改进。

根据案例研究,定制游戏使医疗机构能够使用20多个虚拟环境为每位患者创建独特的程序。例如,通过编程,该软件可以在创伤性脑损伤后使用拇指或整个身体。

在一个相关报告该医院最初表示,7岁以下的患者在接受放疗期间通常需要镇静或观看电影或卡通。放疗可能持续30分钟。

在使用IREX的一年内,医院声称它已经消除了八个孩子的五分之一到四到七岁之间的镇静。一个家庭报告说,治疗时间已经减少,更方便地安排为家庭。

该公司还声称服务于大西洋康复研究所、贝斯·亚伯拉罕健康服务中心、肯尼儿童康复项目、海法大学圣约翰北岸医院的职业治疗部门。

除了医疗保健之外,该公司提供其应用程序零售,广播和餐馆等行业以及索尼,微软,高通公司,迪士尼和思科等索赔客户。

我们无法在公司团队中找到任何带AI经验的C级高管,但该公司已在三轮资金中筹集了2930万美元,并由Telefonica Ventures支持。

家庭自动化

视力移动技术

视力技术为家庭自动化设备开发业务和消费者计算机视觉软件,使

该公司声称这些应用程序都是被动和主动感测。当计算机视觉检测到用户存在时触发被动感测,同时通过无触摸手势激活激活,以控制智能家居设备。

在手势识别方面,该公司声称其无触控软件能够进行手指跟踪、手部跟踪和识别通用手势(挥手、嘘等)以及手部滑动。计算机视觉应用程序还能够进行人脸检测、人脸识别、人脸计数、性别检测、年龄估计和存在检测。

家庭自动化例如,当她走进房间时,个人触发了计算机愿景,导致系统打开灯,调整室温。据该公司称,应用的面部分析算法地图根据行为历史来解决特定家庭成员的面部特征,激活每个家庭成员喜欢的某些经验。

例如,如果这个家庭成员过去曾把房间温度调到某个水平,那么当那个人进入房间时,系统就会调整恒温器。

下面的2分钟视频显示了视力的手势识别软件如何与联想计算机一起使用:

除了家庭自动化,该公司还为汽车、查看器分析和电子客户开发基于手势的软件。

该公司未提供案例研究,但是一个新闻语句2018年3月,它与Sony Mobile合作,以装备交互式投影仪Xperia触摸,用于触摸和无触控相互作用。

视力公司声称,用户将能够通过手势直接控制设备从远处投射的内容,该软件将嵌入设备现有的内置摄像头中。

其他列出的客户是三星座位jabil.sol.该公司被Frost&Sullivan认可为其嵌入式的创新汽车视觉解决方案以解决无分心驾驶的需求。

我们找不到证据表明团队中有任何c级高管拥有丰富的人工智能经验,但Tamir Anavi从2009年开始担任视力技术公司的核心技术和创新总监。在视力之前,他是应用材料的算法开发人员和Ruppin学术中心的材料实验室讲师。他毕业时获得了电子工程学士学位,主修计算机视觉。

公司筹集到了30.9美元在资金中,由Mac GP,三井全球投资,CEVA和Kuang-Chi科学支持。

Gestoos

Gestoos为家庭自动化中使用的消费电子产品,零售数字标牌和汽车用例提供手动跟踪和手势识别应用。还收集了从用户行为和内容等交互收集的数据,以继续培训应用程序的基础计算机视觉算法。

对于外部开发人员,该公司提供了一种软件开发套件,它声称可以为Windows,Mac,Linux,Android和Linux Arm设备创建自定义格式应用程序。SDK提供的常见功能包括手和身体手势识别和手动跟踪。

Gestoos声称它的应用程序与最深度的相机可在市场上提供,但该公司网站指定了Orbbec,枕骨结构,华硕和PMD品牌。

在网站上,公司报告其家庭自动化应用程序的手势识别技术具有控制家庭照明系统的能力,调整音量或静音音频系统的声音,并在播放列表中更改曲目。

可以创建手势并将其分配给用户的连接平板电脑或智能手机,其中应用程序所在,每个移动等效于命令。该公司还声称,一个手势可用于控制多个设备。

该公司没有针对家庭自动化的视频演示,尽管有一个视频演示了Gestoos应用程序是如何工作的数字标牌.该系统可以通过定制的手势进行编程,如指向、挥手、滑动、拿起和放下,每一个手势都转换成一个特定的命令。

当用户做出手势时,配备计算机视觉的摄像头收集手势数据,并通过算法进行分析和解释,识别并执行相应的命令。

正如下面2分钟的视频所示,该应用的面部识别算法还可以识别性别和估计年龄,以便将产品呈现给正确的人群。

Marcel Alcoverro是Gestoos的首席技术官。他在加泰罗尼亚理工大学(Universitat de Politecnica de Catalunya)获得电信工程博士学位。在加入Gestoos之前,他创立了自己的公司,Fezoo实验室,它专注于计算机视觉,手势识别和机器学习。

格斯托斯提出了关于330万美元在资金中,但尚未列出任何案例研究或Marquis客户。

汽车控制与安全

索尼DepthSensing解决方案

索尼DepthSensing解决方案,最初是Softkinetic,直到索尼于2016年收购,为汽车行业提供手势识别申请。

索尼声称该技术具有特色飞行时间,它测量手势数据从光源传输到物体的时间,在这种情况下,是由红外传感器传输到物体的时间。这使得计算机视觉技术能够更快地识别司机或其他汽车乘员的意图,并迅速触发行动。

在下面4分钟的视频中,该公司称,该应用程序通过手控传感器和手势识别,让司机控制车内信息娱乐系统,该系统结合了娱乐和信息设备,如音频或视频播放器、车内电话和空调:

索尼表示,该申请使司机和乘客能够使用手势与车载信息娱乐系统进行互动,以调整音频系统的音量,拒绝或接受通过车载电话的呼叫,以及调节温度汽车空调系统。

该公司进一步索赔算法是训练有素的识别主要手势,并且能够忽视诸如汽车振动等相互作用区域中的其他不必要的姿势噪音。该公司表示,它还具有在任何照明条件下运营的能力。如视频中所见,系统以指向,滑动和圆圈手势操作,但也可以编程其他定制的运动。

外部该公司称,该系统还能检测到行人、附近的汽车、自行车和其他危险因素的存在和运动。

索尼的深度感应技术适用于所有设备2017 BMW 5和BMW 7系列车辆,一个很好vrvana.耳机和克森虽然公司尚未发布案例研究。

Daniel Van Nieuwenhove,索尼深度传感解决方案总裁,2009年联合创立SoftKinetic Sensors。他持有布鲁塞尔自由大学(Vrije Universiteit brussels)微电子学博士学位和应用科学与工程、电子和IT工程硕士学位。在职业生涯早期,他曾担任Optrima的CTO。

作为Vrije的研究助理,他合作互补金属氧化物半导体用于3D飞行时间成像仪的(互补金属-氧化物-半导体)电路和器件。

虚拟现实

马诺运动

马诺运动已开发出一种计算机视觉应用程序,可使用Android和iOS智能手机相机跟踪和识别3D中的手势。公司声称可以使用应用程序用于游戏、物联网设备、消费电子产品、机器人和车辆系统的增强现实和混合现实环境。

下面的1分钟视频演示了嵌入在智能手机上的应用程序如何识别手指和手动移动以执行命令以在屏幕上移动虚拟对象:

据该公司介绍,该软件可以精确到1厘米的深度,目前可以实时识别滑动、点击、抓取等200万个手势。

该公司还为其他希望将应用程序集成到其产品的公司提供软件开发套件。

该公司未提供任何案例研究。在一个新闻语句然而,2018年4月的Manom​​otion宣布将其手势分析应用程序集成到PMD Pico Flexx虚拟现实(VR)纸板耳机中。通过这种集成,公司声称其软件可以使用任何VR或增强现实硬件。

2018年,这家总部位于瑞典的公司计划在帕洛阿尔托、香港和上海设立办事处,负责销售和营销活动。它还打算从斯坦福大学招募人才。到2018年底,该公司预计将招聘约30人。

Shahrouz Yousefi是manmotion的联合创始人和首席技术官。他拥有媒体技术博士学位、机器人与控制硕士学位和媒体信号处理学士学位。在加入manmotion之前,他曾在Linnaeus University和KTH Royal Institute of Technology担任研究员。他还在于默奥大学生物医学工程中心从事3D运动分析和交互设计工作。

商业领袖的外卖

在我们的研究中,我们注意到,除了全球领先的公司,许多计算机视觉和手势识别公司是在过去三年才成立的。此外,我们注意到许多公司提供不同的美国以外的来源:manmotion在瑞典,Gestoos在西班牙,视力移动技术在以色列,Softkinetic(现在的索尼深度传感解决方案)在比利时。

这些历史悠久的公司为包括零售、医疗保健、国防和机器人等多个行业提供技术。这些初创公司专注于特定的用例,如用于家庭自动化、汽车和混合现实的消费电子产品。由于这些公司相对年轻,很少有案例研究。此外,拥有丰富经验的人工智能专家在c级高管中并不明显。

在功能方面,手势界面让用户与机器有更自然的交互。特别是在家庭自动化方面,手势界面的使用为业主提供了方便和无缝流程,因为设备可以预测他们的需求。面部识别——也是计算机视觉的一个子集——增加了一个安全层在家里。

在汽车中,手势界面允许司机在路上保持注意力。添加外部传感能力使汽车占用者和周围人的人能够更好地安全。

一般来说,公司介绍了这些应用程序是可编程的,手势是用户更舒适的表现。

然而,目前尚不清楚这些应用程序是否能同时识别多个人的手势。这是公司面临的一个挑战:从多个人那里识别同步手势,这是一些研究工作的主题微软电气和电子工程师学会.索尼深度沉积,声称已经找到了一种方法来从交互区域中删除“噪声”的算法。但是,如果这与来自多个人的同步手势相同,则不清楚。

值得注意的是,Microsoft Kinect手势识别配备的相机,其第一和第二代被停产,收到了兴趣医疗保健设备例如监测、筛查和康复。

它的第三代深度感知能力现在出现在HoloLens虚拟现实耳机中。对于第四代Kinect版本,微软和英特尔合作,通过英特尔的RealSense深度摄像头使Kinect技术可用。

在未来,手势界面可以潜在变化消费者不仅仅与电视机相互作用,还与其他技术相互作用。

为LG和罗技提供动作传感技术的Hillcrest Labs首席执行官丹尼尔·辛普金斯表示,说胎面应用让消费者更适应科技,因为“它让人们从一个只需要按遥控器按钮的世界中走出来,变得更加熟悉。”

标题图像信用:商业韩国

保持在AI曲线的前面

发现在业务未来将赢家分开获奖者的关键AI趋势和应用程序。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

加入超过2万名专注于人工智能的商业领袖,并接收我们每周发布的最新人工智能研究和趋势。

感谢您订阅EMERJ“AI Advantage”时事通讯,请检查您的电子邮件收件箱进行确认。