天天日报丨索信达控股:AI助攻,打响金融反欺诈之战
金融业风险防控是一个永恒的主题。随着人工智能、大数据等技术与金融业务的深度融合,进一步增加了金融风险的复杂性、隐蔽性、突发性,此外,随着新技术的发展和应用,利用AI技术等高科技的新型诈骗越来越多,诈骗手段不断升级,令人防不胜防。
(相关资料图)
人工智能技术就像一把达摩克利斯之剑,既能给行业、给用户带来技术红利,让金融消费者享受到更加便利、更佳体验的金融服务,也让金融机构和消费者面临了新的风险。作为金融机构和金融消费者,又该如何应对科技时代的风险局面?
对于金融机构而言,一方面要加强风险防控技术水平,制定及时有效全面的应对措施,构建完善的风险防御体系,另一方面,也应加强面向用户的防诈骗及信息保护方面的科普教育宣传,将各类新型诈骗手段及时向消费者和用户普及。
对于消费者而言,要提升个人隐私保护安全意识,加强防骗知识的学习,提高警惕性,保持与时俱进,提升知识储备,多加了解AI诈骗等新型诈骗的原理和案例,在网络活动中保护好自己的个人信息。
以子之矛,攻子之盾。在数字化时代下,科技手段已成为风险防控的关键,而这对金融科技提出了更高的要求。如今大数据技术、AI技术在金融风控中的应用已十分普遍。欺诈风险一直是金融机构面临的最严重风险问题之一。Brett King在《银行4.0》一书中提到,目前全球每年只有约3%的欺诈案例被识别。传统的经验规则筛选无法带来更多的提升空间,在此情境下,索信达AI创新中心探索利用人工智能模型来找到更多欺诈样本,并提出新的思路来解决问题。下面就以两个具体的案例,来看看AI技术在金融反欺诈中的应用思路。
案例一 AI在银行内部反欺诈场景的应用思路
本案例以某银行理财经理飞单欺诈案例,探索AI技术在内部反欺诈场景的应用思路。以威胁源作为分类标准,可以将银行欺诈问题分为内部欺诈与外部欺诈。近年来,随着商业银行规模效益的快速增长,内部欺诈问题的严重性呈反弹趋势。银行业内部常见欺诈手段主要包括:盗取挪用银行资金、伪造票据文件、窃取银行公章、非法集资、飞单等等。内部欺诈具有作案手段复杂多变、交易金额小、周期较长、欺诈技术性较低等特点。
内部欺诈的传统监管方式上也存在诸多难点:比如基于规则的筛选方式通常造成较高的假报警率;由于正样本量(既确定为欺诈的样本)数量往往非常少,有监督模型难以在这里使用;欺诈行为多样,在数据上难以对特征进行总结,也导致很多有监督方法难以使用;另外传统的方法只关注了用户数据之间的距离,而忽视了关系圈数据中可以发掘到的图形拓扑关系等。
在通过AI模型解决内部欺诈问题前,首先要基于银行内部关于理财经理的诸多维度数据,通过对既往违规案例进行专题分析,发现该银行过往的违规行为。在数据特征上,大致可以分为两类,一种是交易行为维度上的体现,第二种是通过人际关系网实施的欺诈,在数据上体现在了数据之间的关系结构异常。结合对过往案例的分析,有两种解决思路:第一种,用多种无监督模型侦测异常的解决思路;第二种,构建图结构的数据,用社团检测和半监督算法,如Louvain和GCN的解决思路。
总之,任何单一的方法都不能包括在数据层面上通过别的数据结构角度体现出的信息,这也就是在此方案中,基于交易数据和基于关系圈数据分别采用不同算法来进行检测,从而达到双管齐下的重要性。
案例二:利用图卷积神经网络(GCN)算法破解团伙欺诈风险
金融风险按照参与人数可以分为来自个人的风险和来自团伙的风险,来自团伙的风险主要是团伙作案造成的风险,如团伙欺诈。为了更好控制风险,专业人员将机器学习算法引入金融行业的风控领域,极大提高了风控水平。但是金融风控领域的数据有一个很大的特点,就是正负比例通常极不均衡,因为有风险的客户数量相对全体客户来说占比非常小,这种极不均衡的数据并不适合用传统的机器学习模型来处理,无监督或半监督模型会更适合。
建模的原则是根据不同的数据建立相对应的模型:对于个体风险,可以使用检测个体异常的无监督算法。对于团伙风险,由于这类场景中样本之间存在关联,且样本间的关联包含了重要的风险信息,但是个体的异常检测算法难以捕捉样本间的关联信息,此时可以将样本之间的关联信息组成复杂网络的形式,再使用针对复杂网络算法来处理这类数据,比如图卷积神经网络(GCN)。
GCN在金融风控领域,尤其是团伙欺诈和反洗钱等场景有着很好的应用。在金融风控领域,往往只知道少量样本的真实标签(如发生过违约的用户,可以确定有风险),目前没有违约的用户很难确定是否有风险。GCN这种半监督模型只需要少量有标签的样本就可以训练出精度高的模型,面对极不均衡的数据时效果会更好。相对传统模型大多只能分析单个样本的风险信息,GCN还有一个特点就是能将样本之间的关联信息(如社交网络、共用电子设备、财务往来等)利用起来,适用于金融风控中团伙风险的场景。
比如根据企业自身的财务状况信息和企业之间的金融交易数据构建一个复杂网络,再使用GCN来处理这类数据,从而识别哪些交易具有欺诈性。例如,可以建立一个交易的超级节点图,判断是否有洗钱圈?从而找出洗钱团伙。
总之,金融行业是对风险管理和安全性要求非常高的行业。因此在应用人工智能等新技术时,需把安全性和可解释性应摆在重要位置,防范模型和算法风险,需要加强模型和算法风险管理制度,规范技术应用。针对不同业务场景下的数据集特点,进行算法层面的分析,寻找模型精度与解释性之间的平衡。