神经网络使用银行交易数据进行信用评分
来自 Skoltech 和一家主要欧洲银行的研究人员开发了一种神经网络,该网络在使用交易银行数据进行客户信用评分方面优于现有的最先进解决方案。该研究发表在 2020 年 IEEE 数据挖掘国际会议 (ICDM) 的论文集上。
机器学习算法已经广泛用于风险管理,帮助银行评估客户及其财务状况。“现代人,尤其是银行客户,不断在数字世界中留下痕迹。例如,客户可以在支付系统中添加有关向另一个人转账的信息。因此,每个人都会获得大量可以表示为有向图的连接。这样的图表为客户的评估提供了额外的信息。有效处理和使用有关客户端之间连接的丰富异构信息是我们研究背后的主要思想,”作者写道。
统计机器学习小组的负责人 Maxim Panov 和来自 Skoltech 的 Kirill Fedyanin 及其同事能够证明,与仅使用目标客户数据的算法相比,使用客户之间的资金转移数据可以显着提高信用评分的质量. 这将有助于为值得信赖的客户提供更好的报价,同时降低欺诈活动的负面影响。
“特定银行客户的定义属性之一是他或她与其他人的社交和财务互动。它促使我们将银行客户视为一个相互关联的代理网络。因此,这项研究的目标是找出著名的谚语“告诉我你的朋友是谁,我会告诉你你是谁”是否适用于金融代理人,”帕诺夫说。
他们的边权重共享图卷积网络 (EWS-GCN) 使用图来聚合来自它们的信息并预测目标客户的信用评级,其中节点对应于银行客户的匿名标识符,边是它们之间的交互。新方法的主要特点是能够按原样处理出现在银行数据中的大规模时间图,即没有任何通常很复杂并导致数据中包含的信息部分丢失的预处理。
研究人员对六个模型进行了广泛的实验比较,EWS-GCN 模型的表现优于所有竞争对手。“该模型的成功可以通过三个因素的结合来解释。首先,该模型直接处理丰富的交易数据,从而最大限度地减少其中包含的信息丢失。其次,模型的结构经过精心设计,使模型具有表现力并有效地参数化,最后,我们为整个管道提出了特殊的训练程序,”Panov 指出。
他还说,要在银行实践中使用该模型,它必须非常可靠。“复杂的神经网络模型受到对抗性攻击的威胁,由于我们对这种现象缺乏与我们的模型相关的知识,我们目前无法在生产过程中使用它,将其留待进一步研究,”Panov 总结道。
标签: