洋钱罐风控模式分析:用户高维度弱变量分析建模与集团性欺诈监测

文章正文
发布时间:2018-06-08 19:28

  随着监管的深入,网贷行业再度掀起洗牌热潮。线下理财平台转型失败、小平台不堪重压纷纷退出市场竞争,网贷行业竞争进入了更纯粹的阶段。

  “824”网贷监管方案提出,“直接或变相向出借人提供担保或者承诺保本保息”;“57号文”明确提出,“禁止辖内机构继续提取、新增风险备付金。”这些都意味着,监管的原则非常明确,用户要有风险意识,平台不会帮你兜底。但用户自身难以把控风险,即便能够看到借款人的信息,也无法得出客观真实的评价。在这个背景下,平台的风控实力成为判断风险的近乎是唯一的标准,也是用户选择平台的核心要素。

  与此同时,网贷机构服务的用户往往是银行没有或者无法覆盖的群体。欧立信《2017年我国征信市场深度分析报告》中显示,我国13亿人口中只有3亿多人在央行有信贷数据。而根据中国个人征信行业报告中的数据显示,相比美国 92%的个人征信渗透率,我国个人征信记录覆盖率只有 35%。中国的GDP已经达到美国的60%,理论上授信规模也应当达到这个比例,也就是中国可以有60%左右的可授信群体。以此计算,在中国,目前有30%左右的人群没有得到真正的授信,基于中国如此大的人口基数,未授信群体规模可能在4亿左右。既然银行无法授信,网贷机构就需要自行搭建有效的风控模型。

  何为有效的风控模型?怎样才能剔除有潜在的欺诈群体,保证平台的健康稳健。我们以洋钱罐为例,来说一说风控的那些事儿。

  之所以选择洋钱罐,主要在于这家平台可以做到三分钟完成审核而不需要庞大的审核团队。在三年多时间里,累计交易额已经达到了近550亿,出借注册用户超过了130万,累计借款笔数2646万笔,平台保持稳健运营。这表明,平台有一套强大的风控体系做支撑,并且已经得到了充分的印证,其做法有着重要的借鉴作用。

  那么,洋钱罐风控的秘诀在哪里?我们主要从征信评估、反欺诈服务和监控预警三个方面探讨。

  大数据与借款人高维度弱变量分析建模

  在借贷发生前,平台首先要对借款人进行征信评估。传统金融机构往往是查询工资流水、社保记录、工作、家庭背景等等,但一方面,网贷平台覆盖的群体,这些信息并非完全清晰可见。另一方面,即便用户提供这些信息,也不足以完全勾勒出一个清晰的借款人画像,造假的成本也不高。在移动互联网时代,数据维度和处理计算模型就变得极其重要。

  洋钱罐的做法是,在业界通行的互联网爬虫技术及在线身份认证技术之外,还与线上数十家数据合作方建立合作,通过纯线上的方式便能够抽取数千维度的变量。据洋钱罐CTO耿博介绍,依托用户在移动互联网上的信息,洋钱罐可以将弱关系、碎片化的内容形成一个高维度、细颗粒化的描绘。基于这个描绘,机器学习算法可以进一步对用户进行分类。

  也就是说,洋钱罐的大数据风控不只看“大”,重点是看机器能否很好地处理这些数据。洋钱罐依托海量的数据,针对诚信、失联、关联聚类、信用等多个维度构建了若干个机器学习模型,能够精确判别用户的欺诈和信用风险等级。据耿博透露,机器学习算法可以对借款人形成一个细颗粒度的分类,并通过高维度的弱变量进行建模分析,对信用不满足要求的借款人,平台能够及时剔除。

  借款人的信用是概率性的,反应借款人在某一个概率下的置信度。信息维度越广、数据变量越多、机器学习越精确,对借款人描绘的颗粒度就越细,造假的成本就越高,对借款人授信的置信度就越高。这项基础工作做好了,反欺诈的工作就变得水到渠成。

  欺诈个体与群体的动态甄别

  在正常情况下,借贷逾期或者坏账产生的原因,除了借款人的疏忽大意,无非就是没有还款能力和没有还款意愿。针对这两方面问题,洋钱罐的风控基本原则是,保证借款人有还款能力,挡住无还款意愿借款人。

  在还款能力上,洋钱罐的资产主要来自小额消费类资产,小额信贷一般都是几百、几千块的小额借款,这个从平台数据可以看出。洋钱罐的运营数据显示,平台人均累计借款额只有5000多元(划重点:累计),前十大借款人待还金额占比仅有0.014%。最大单一借款人待还金额占比仅有0.001%,很好地体现了小额分散的特点。小额分散的借款方式可以保证,只要是正常的借款需要,借款人基本都可以保证有还款能力。

  那么,核心问题集中在还款意愿的评估上,其实就是检测欺诈用户。欺诈用户分为组团欺诈和个体欺诈。

  在个体欺诈方面,洋钱罐将自主研发数据与其他台的征信数据相结合,建立起一个海量数据库,从而能够精确判别用户的欺诈和信用风险等级。据耿博介绍,个体欺诈属于经典的基于互联网大数据和有监督/半监督的机器学习技术去解决的问题,随着数据量不断积累,发掘的互联网变量逐步增多,可以持续迭代不断优化。

  群体欺诈的难度在于,它虽然是个体欺诈的集合,但需要平台既不会误伤优质借款人,又能够彻底挖掘出所有欺诈个体。这有赖于借款人画像和聚类算法模型。洋钱罐的做法是,通过对比数据库判别个人信息是否与其互联网画像一致;活体识别技术检验是否本人操作;通过比对设备和联系人等信息,借款发生的频率和集中度等因素,多方位检测借款人的行为。对不同用户画像基于相似度进行聚类,结合不同申请人之间关联关系,集中剔除掉组团诈骗的可能。据耿博介绍,集团诈骗的防范属于机器学习中的无监督学习范畴,度量学习以及聚类算法在这里起着至关重要的作用。通过聚类算法,洋钱罐能及时甄别出欺诈流量,并作出及时的反应。

  在反欺诈技术的积累上,洋钱罐可以保证平台上基本上可以没有群体性欺诈,很少有个体欺诈。

  动态监控预警及智能催收

  当然,也应该看到,对风险的监控应该是实时动态的,应当持续对用户进行信用预警和贷后监控,及时发现用户的信用恶化及其他金融风险,实现对金融的风险态势感知。

  在这一方面,洋钱罐自研了适合自身业务需求的实时监控系统,应急响应时间全天候保证在数分钟之内,确保服务安全可靠。据耿博介绍,洋钱罐每日都会对用户存在还款和逾期状态更新。这些状态更新能够高效反馈到模型并更新模型的参数,当用户人群发生迁移或者欺诈行为发生变化时可以动态地进行适应。

  而在此之外,洋钱罐还针对催收研发了智能催收系统。这套系统一方面最大限度地保证用户信息的隐私和安全,完整记录催收的整个过程。另一方面,智能催收系统通过IVR方式,实现机器与人的沟通,提醒借款人还款,并提供其相应的还款方式。随着AI技术的发展,洋钱罐正在实现像谷歌那样的智能客服,以标准化的方式进行催收,可以保证信息准确传达,并防止暴力催收。

  综上所述,从征信评估、反欺诈服务和监控预警三个方面来看,洋钱罐有两个非常关键的要素:技术驱动、动态调整。这与平台最原始的基因有关。其核心技术团队来自全球知名互联网企业,包括Facebook,Google,Apple,Microsoft,SAP,Oracle,腾讯等。所以,在平台风控架构上,团队都在尽可能杜绝不可控因素。比如,在审核层面,洋钱罐并没有组建规模庞大的线下审核团队,而是以大数据和计算模型提供置信度高的用户授信。在技术上,团队都在尽可能追求严谨性,保证动态调整。洋钱罐之所以能够保证高交易量、低人员成本和稳健运营,其秘诀就在于风控技术的绝对实力。

文章评论
—— 标签 ——
首页
评论
分享
Top