银行业作为高度数据化的行业,加上业务规则和目标的明晰,是人工智能和云计算等数据驱动技术的最好应用场景之一。
在上海,就有这样一家科技公司利用人工智能技术来帮助银行进行可疑交易监测,以及提供信贷风控反欺诈解决方案。
上海氪信信息技术有限公司(以下简称“氪信”),成立于2015年12月,主要业务是为金融机构提供智能风控、智能营销、智能运营等领域的建模和业务咨询服务。氪信目前已成为招商银行、工商银行、民生银行,中银消费金融、招联消费金融等多家金融机构的全程AI伙伴。先后获得招商局创投、上海金融发展投资基金、真格基金、火山石资本、美国中经合集团、墨白资本等多轮重量级投资。
用机器学习还原洗钱场景,有效识别复杂洗钱交易
对于银行等金融机构来说,传统的反洗钱工作模式是:银行等金融机构的监控系统通过对海量交易进行规则过滤,生成基于账户的异常交易包,再安排大量人工复核,挑选可疑性较强的案宗进行上报。
但这样的方式往往会面临以下困扰:专家策略误判率的高低取决于策略人员的经验水平,基于专家策略的可疑交易识别误判率较高;目前大多数防御系统仍为孤立地分析单个账户或交易事件;大型金融机构往往配备大量人工进行复核,运营成本高昂;反洗钱策略需要不定期进行更新,并要严格保密,一旦泄露将对平台造成不可挽回的损失等等。
基于上述情况,氪信利用机器学习,开发出了一套可监测可以交易的系统——TAI可疑交易监测解决方案 。
首先,基于知识图谱技术和反洗钱场景的金融专家经验、数据体系结构洞察,TAI构建了集账户属性、交易特质以及资金网络的全域高维资金交易知识图谱,具有标准化、可迁移特性。在高维知识图谱之上TAI进行深度交易和账户特征挖掘,来构建完整的KYC((know-your-customer)账户和交易关系网络。
其次,针对人工审核压力和成本,TAI机器学习可自动学习资深反洗钱专家对可疑案宗进行等级分类和排序上报的思路,提取与洗钱行为关联的信号,从而提升可疑交易的甄选效率。氪信技术团队还研发出了专门针对可疑交易场景的模型架构体系,该模型架构基于半监督和图挖掘技术的多级模型体系,依赖少量标注黑样本,挖掘未知风险模式和风险团伙,与人效比提升至40倍。
再次,针对银行数亿笔交易流水带来的海量历史数据,TAI大规模图挖掘算法可在分钟级别完成亿级别结点和亿级别边的社区挖掘算法计算。同时,TAI列式计算引擎可支持分钟级别处理数十亿交易数据的单类型特征计算。
最后,TAI基于图卷积的半监督机器学习,可以利用行为数据和少量特征标签,完成群体可疑交易的识别,从而还原洗钱场景,有效识别复杂洗钱交易。
用AI来帮助银行发“好人卡”
机器学习除了能监测可疑交易外,还能帮助解决信贷风控欺诈。
在金融业务里,通常最容易被忽略掉的是“长尾人群”。金融领域里的“长尾人群”指的是一群过去从未申请过贷款或信用卡,与银行等传统金融机构无信贷关系历史,征信记录基本空白的人群。
据公开数据显示,目前国内征信记录缺失的人有接近十亿,对于这些人,以往通用的各种传统征信评价手段会显得力不从心。这种情况下,通过使用大数据和可替代性数据,可以最大程度地弥补强征信数据不足的问题。氪信对此利用互联网大数据建立了一套模型。
举例来说,如果一个样本客户在淘宝上的地址一直在变,这说明信用情况是值得怀疑的,因为普通人是不会如此频繁更改住址的。但从银行的角度来讲,它更关注的是这个人历史上跟金融机构因为借贷和担保关系所形成的债项关系。只要发生了拖欠,满足一定条件的就定义他为“坏人”。
氪信的模型是拿历史的样本去预测。简单来说就是利用大数据历史来判断新用户是“好人”还是“坏人”。从这个意义上说,AI可以帮助银行给“长尾人群”发“好人卡”。
据氪信介绍,其基于AI技术的风险特征衍生框架,针对各类金融数据包括人行征信、申请资料,行内资产、App行为等,衍生出高维风险特征因子库。在此基础上采用机器学习集成模型技术,充分挖掘稀疏高维、低饱和、非结构化数据的价值,实现模型准确性、稳定性的提升。同时,提供模型快速迭代更新能力。