AI财务透明度-理解黑箱

丹尼尔Faggella
《阿凡达》

丹尼尔是在Emerj研究部主管。联合国,世界银行,国际刑警组织和许多全球性企业呼吁,丹尼尔是一个抢手的对企业和政府领导人AI的竞争战略意义的专家。

人工智能金融透明度-了解黑匣子

金融业是最早开始尝试的一个机器学习应用适用于各种使用情况。在2019年,银行等银行正在寻找机器学习,以此来赢得市场份额,并在不断变化的环境中保持竞争力,其中一个人不再专门去银行处理他们所有的银行业务需求。

尽管放款人可能对在自己的企业中进行机器学习项目感到兴奋,但许多人并没有完全意识到在金融领域采用机器学习所带来的挑战。在实现机器学习方面,放款人面临着一些独特的困难,特别是在基于机器学习的信贷模型方面。

为了更好地理解这些特定领域的挑战,我们采访了周杰伦Budzik,首席技术官在热情的人工智能,机器学习的透明度是应用到金融部门以及银行可以克服通常被称为“黑盒”的机器学习问题。

在这篇文章中,我们描述了金融中机器学习的黑箱,并解释了缺乏透明度是如何给贷款人和消费者与基于机器学习的信用模型交互带来问题的。这些问题包括:

  • 无效的模型开发和验证
  • 无法解释为什么信贷申请人被拒绝
  • 算法偏差(种族,性别,年龄)
  • 无法监控模型制作

后来在文章中,我们讨论了解释的机器学习一个流行的技术Budzik的批判。最后,我们通过探索什么机器学习为主的信贷模式意味着贷款人和贷款申请人写完这篇文章。

机器学习金融的黑匣子

虽然基于ML-信贷模型比传统的模型(如Logistic回归和简单的基于FICO记分卡)在很多情况下更具有预测性,他们往往缺乏这些传统模式最关键的优势之一:explainability。

机器学习有一个所谓的“黑盒”问题,这意味着通常很难弄清楚一个基于mlb的信用模型是如何达到它对特定信用申请人的评分的。

这是由于ML算法,如基于树的模型或神经网络的性质。在神经网络中,以响应模式的网络大火的每个节点,它的“看见”之前,但它实际上并没有明白是怎么被提交给它。换句话说,一个不能探测节点要弄清楚什么概念或理念使它火而复杂的诊断是远离无处不在机器学习的世界。

在监管较少的行业,黑箱问题就不那么严重了。例如,如果在线商店的推荐引擎错误地向客户推荐了他们不感兴趣的产品,最糟糕的情况是客户不购买该产品。在这种情况下,模型最终如何向客户推荐该产品并不重要。

假以时日,这种模式就会变得更善于推荐产品,网上商店的运营也会照常进行。但在金融领域,机器学习模型的不准确输出可能会给使用该模型的企业带来严重后果。

无法解释为什么信贷申请人被拒绝

信贷承销,贷款人必须能够为什么会被拒绝对授信申请人解释。传统的线性模型使这个相对简单,因为人们可以很容易解释的模型和承销商是如何来到借款人决定,并在可能比机器学习模型显著的变量较少,他们的因素。

一个基于机器学习的信用模型可能涉及数百个变量,这些变量之间的相互作用本身就是变量。

如果没有严格的explainability,贷款人不能向申请人提供的不利行动的通知这些信息详细说明了他们被拒绝的原因,他们可以利用这些信息来改善自己的信用状况,并在未来成功获得信用。我们将在本文后面讨论机器学习模型中用于解释的SHAP技术时,进一步讨论这对消费者的影响。

无法解释的基于机器学习的信用模型可能会给使用它们的贷款人带来严重的法律后果。该1970年《公平信用报告法》要求贷款人能够解释他们使用批准和拒绝授信申请人的车型。

F如果不准确地这样做,可能会导致巨额罚款和/或吊销银行执照。不合规可能是贷款机构谨慎采用机器学习进行信用评分和承销的最重要原因。

算法偏差(种族,性别,年龄)

贷款人希望采用基于机器学习的信用模型的另一个关键问题是算法偏差。尽管我们可以假设一种算法是客观中立,以在它创造的社会背景下,那些开发算法给他们带来自己的假设对社会其所属。这些假设可以无意中影响机器学习工程师开发一种算法的方式,并且,作为结果,该算法的输出可被无意地偏置。

在贷款模型,偏更经常被确定数据或该算法将用来做出是否批准的申请人或不是其决定权重时推出。贷款人知道他们需要避免使用与传统的信用模型做决策时,是哪些数据点,他们手动记分卡或线性回归模型,其中包括:

  • 申请人的种族或族裔
  • 申请人的性别或性
  • 申请人的年龄

有无疑将是从使用禁止信贷建模其他数据点更多的法规在接下来的几年里。其他数据点可以作为种族的明确代理,例如属性值,

人们可能认为,简单地确保这些特定的数据点不被提供给ML算法是很容易的。但是,黑盒问题使得我们很难知道,歧视性的信用信号是否会作为其他看似无关的数据点的组合,不经意地被纳入一个基于机器学习的信用模型。根据Budzik:

申请人的位置可以很好地预测他们的种族和种族,因此在考虑某个人的位置等属性时,你必须非常小心。我们已经看到,即使是在州一级,当你将一个人的生活状态与其他属性(如汽车行驶里程)联系起来时,你最终也可以得到他们种族的非常完美的预测值。因此,重要的是能够对该模式进行全面检查,以确保它不会从歧视的角度做错事,不会做出有偏见和不公平的决定。

一个有偏差的算法的结果可能会有所不同,但在信用建模中,它们可能对那些在获取信用方面已经处于劣势的人有害。有色人种已经做到了更可能被拒绝贷款比白人使用传统的信用评分,部分原因是他们的评分没有考虑到租金、电话费和水电费等经常性支出。

因此,有色人种的信用记录可能很薄,但也有可能像有着广泛信用记录的白人借贷者一样偿还贷款。这是当前信贷体系的现状;如果放贷机构和监管机构无法研究算法并找出其结论,机器学习可能会加剧问题。

政治领域也开始关注算法的偏见。在一个信件几个政府机构,包括消费者金融保护局,总统候选人沃伦和阿拉巴马州的参议员道格·琼斯问是什么机构在做,以打击在自动信用建模算法偏差,呼唤FinTech公司专门为很少包括在环人承保贷款的时候。

此外,激爽AI在此之前,该公司首席执行官道格拉斯·梅里尔(Douglas Merrill)发表了讲话众议院金融服务委员会的AI专责小组对算法的偏见和公司的本意是开发透明的承保能力的算法。

SHAP及其局限在信贷审批

沙普利添加剂的解释(SHAP)是将explainability机器学习这是积累了一些人气自2017年成立以来的一个方法,该方法有助于解释基于树的机器学习模型是如何来它的决定。它采用博弈论的要素要做到这一点,它可以声称商务应用做这个速度不够快。

据激爽AI,然而,SHAP,单独使用时,在授信一定的局限性,当谈到解释基于ML-信用模型。其中最大的是在很大程度上特定领域的问题。

贷款人可能希望他们的模型批准,它认为申请人的百分比。这个百分比,这个期望的结果,存在什么所谓的“得分空间。”同时,机器学习模型的实际输出不是百分比;它存在于什么叫“的空白。”

SHAP旨在解释存在于机器学习模型输出“余量空间”和热情AI指出,这是一个挑战使用时解释为什么申请人被拒绝贷款。换句话说,贷款人需要解释是在“2得分空间”,但SHAP不允许这样容易。其结果是,根据Budzik在岗位关于主题:

如果你计算一组加权的关键因素在保证金空间,你会得到一组非常不同的因素和权重,如果你计算它们在得分空间,这是银行推出他们的前五个解释拒绝借款人。即使使用相同的总体,并且只查看转换后的值,也不会得到相同的重要性权重。更糟糕的是,你可能不会以同样的因素进入前五名。

其结果是,贷款人可以提供不利行动通知消费者是不准确居申请被拒绝的原因。这可能会导致申请人试图纠正自己的信用状况在错误的道路,专注于一个拒绝理由竟是他们的拒绝比另一个原因,这是不准确的排名不太重要不太重要。

什么为基础的ML信用模型意味着贷款人

截至目前,有适用于授信解释的机器学习的几个例子。激爽AI不要求其ZAML软件就是其中之一,致力于解释多种类型的基于机器学习的信贷模式。

话虽如此,但由于监管方面的不确定性,贷款机构可能还需要几年的时间,才能适应用机器学习完全自动化他们的信贷承销。最近在金融领域讨论机器学习的兴趣表明,政府很可能在未来几年内就使用基于mlb的信用模型做出若干决定。

这不,但是,一定意味着贷款人应等待找出在时机成熟时,他们将究竟如何实现一个基于机器学习的信贷模式。他们应该被关注的黑盒问题,以及如何FinTechs,银行和监管机构都应对它。

黑匣子的问题很重要,因为它克服可以解锁机器学习在金融,特别是信用担保的真正潜力。可以解释的模型可以让贷款人批准否则将被在不增加他们承担的风险否认了更严格的信贷模式更多的贷款申请。

就美元而言,这意味着更多的收入和更少的钱借给借款人,将无法偿还。

参与机器学习模型接近无穷大的数据点可以在很大程度上源于黑箱问题,但他们什么也将使贷款人建立一个贷款申请人的更细致的轮廓。

基于ML的信贷模型对借款人意味着什么

基于机器学习的信贷模型可能允许贷方在以前没有的情况下批准他们的贷款。当可解释的ML在信贷承销中变得无处不在时,理想情况下,贷款人将能够经营更有效的业务,并允许更多的人公平获得信贷,而不论年龄、性别或种族。

这篇文章是由飞龙AI赞助,写,编辑出版对准我们的透明Emerj赞助内容指南.了解更多关于到达我们的ai集中执行观众的信息Emerj广告页面.

标题图片来源:WallStreet.com

艾曲线保持领先

发现关键的人工智能趋势和应用程序,在未来的业务中区分赢家和输家。

订阅“AI优势”简报:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - Check your email and open our welcome email to confirm your email address with Emerj">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅图像
银行业的关键人工智能洞察

加入数千名专注于人工智能的银行业领袖,深入了解银行、保险和金融领域的人工智能用例:

感谢您订阅了Emerj“AI Advantage”时事通讯,请检查您的电子邮件收件箱以进行确认。