现有的企业应该如何为AI组织他们的数据资产

艾茵·德·耶稣
《阿凡达》

艾恩是Emerj的人工智能分析师,负责报道人工智能的用例和各个行业的趋势。她曾在埃森哲担任多个职位。

现有的企业应该如何为AI 1组织他们的数据资产

集简介:拥有大量数据可供使用的公司可能会问自己,如何才能以有意义的方式利用这些数据。一般来说,一组干净的数据是人工智能应用程序的基础,但企业所有者可能不知道如何准确地组织他们的数据,以使他们能够最好地利用人工智能。从拥有可能有用的数据到拥有能够提供准确、有用的机器学习工具的数据(实际上能够帮助解决业务问题的工具)的业务转换究竟是如何进行的?

在本期播客中,我们将采访data公司的联合创始人兼首席技术官Bryon Jacob。world是一家提供帮助企业管理数据的产品和服务的公司。在我们的对话中,Bryon向我们介绍了公司在创建和组织数据集时犯的常见错误,以及这些公司如何过渡到更有组织和更有意义的数据管理系统。

这次采访的细节应该会让商业领袖们更好地理解一些启动人工智能计划的过程,以及如何在公司中雇佣数据科学相关的角色。


订阅我们的人工智能产业播客你最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
stitcher-podcast

客人:雅各布布来安的联合创始人兼首席技术官Data.World

专业知识:数据协作、数据科学、分析、数据分发、团队协作和开放数据

短暂的识别:Bryon 20年的学术和专业经验包括在凯斯西储大学(Case Western Reserve University)的人工智能研究、在Trilogy开发企业配置软件、在亚马逊(Amazon)开发消费者网络体验、以及监管在线度假租赁市场HomeAway.com的平台开发和整合。目前,他也是位于奥斯汀的创业公司Capital Factory的导师。他拥有凯斯西储大学的计算机科学学士学位和硕士学位。

伟大的想法

公司经常对人工智能感到兴奋,Bryon说,把它看作是一个解决棘手商业问题的机会。但是,使用先进、复杂的技术来构建人工智能或机器学习系统是昂贵的,而直接、简单的统计方法通常也一样。建立人工智能系统只有在公司拥有高质量的数据,以及正确的分类和访问数据的方法的情况下,才具有长期的可持续性。

在许多情况下(从保险,广告,制造业,以及更多),数据以不一致的格式流向公司。数据仓库可能包含存储在大型分布式系统或单个应用程序上的事件类型数据,每个应用程序都具有独特的数据存储格式,只有每个系统的专家才知道如何检索数据。

如何管理好数据

要做正确的第一步是承认驱动业务的数据从根本上是一组内聚的信息,而不是分离的部分或系统,然后以可访问的格式表示该数据。

企业很少关注数据管理问题并打算解决它们,直到问题变得难以管理。事实上,在一开始就定义数据格式和组织是一个战略性的举动,因为做错的代价是巨大的,Bryon解释说。

首席数据官的角色

组织的每个部门都可以很好地定义数据,但是数据可能无法在组织中顺畅地流动。拥有一个首席数据官(CDO),其最重要的任务是理解和管理数据,这将确保数据具有价值并完成其在业务中的角色。这还可以使公司不必对不正确设置的数据体系结构进行昂贵的修复。

处理不一致的系统是必要的。CDO可能与过去做出的一些选择有关。取代管理固定数据点(驱动企业核心)的主数据管理系统是不现实的。但在数据策略中仍有一些灵活的元素是CDO可以关注的,比如数据仓库、应用程序获取、消费和生成数据的方式,而无需重新格式化、重新使用和重新理解。

想要雇佣CDOs的公司应该从工程组织中寻找有经验的数据科学家,因为这些专业人员在构建产品测试解决方案时应该已经获得了数据管理技能。他们还习惯于通过经过验证的敏捷方法来解决越来越大的问题。统计、数学和分析技能无疑是重要的,但数据管理从根本上来说是一个工程问题,Bryon告诉我们,工程是许多关键的CDO技能的来源。

首席信息官将负责这些系统。还会有其他利益相关者,可能是主题专家、市场营销或财务。但在现实世界中,Bryon解释说,只有当问题变得不成比例时,这些人才会聚集在一起,而且大多数公司可能只会在需要处理组织糟糕的数据的压力下才会聘用CDO。

布里昂·雅各布的采访集锦

以下是Bryon回答的主要问题。听众可以使用嵌入式播客播放器(在这篇文章的顶部)跳转到他们可能感兴趣的部分:

  • (4:00)企业在太快进入人工智能领域时会遇到哪些常见的错误?
  • 在你看来,组织数据的最佳过程是什么?
  • (10:03)谁是需要就定义数据作出策略性决策的干系人?
  • (12:55)我们如何建构数据,使其即时及日后有用?
  • (19:25) CDO需要什么样的经验和学历?
  • (23:55)当各行各业的公司开始组织数据进行机器学习时,他们需要知道和理解哪些要点?

订阅我们的人工智能产业播客你最喜欢的播客服务:

itunes-podcast
soundloud-podcast
google-podcast
stitcher-podcast

标题图像信贷:HL编年史的数据保护

保持在AI曲线的前面

发现关键的人工智能趋势和应用程序,在未来的业务中区分赢家和输家。

报名参加“人工智能优势”通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
保持在机器学习曲线的前面

在Emerj,我们拥有最大的关注人工智能的在线商务读者群体——加入其他行业领袖的行列,每周收到我们发送到您收件箱的最新人工智能研究、趋势分析和访谈。

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。