3、信贷历史(信用卡数量、还款历史、房贷信息等),这部分是央行征信查询获得的。
4、行内数据(存款额、卡数量、用户等级等),这部分是存量客户在某行存款、开卡等记录。
1、欺诈风险用到模型主要是社会关系网络模型,通过每笔案件之间的关系,判断新案件是欺诈申请的可能性。
小额现金贷最主要的是欺诈风险和多头。逾期后以电话催收为主,所以要从通讯录和运营商数据深挖特征,减少用户逾期失联带来的催收困难。
特征主要从上面原始数据衍生出一量或者第三方公司输出的变量,通常需要根据iv值等指标进行筛选,才能加入模型。
一般模型会以ks值和auc作为评价指标,ks大于0.4,auc大于0.8为优,但指标过高也要评估模型是否过拟合。
信贷行业一般包含欺诈风险和信用风险,欺诈指故意骗贷,没有还款意愿。信用风险指各种原因未能按期偿还,有还款意愿但暂时不具备还款能力。具体会有通过率和逾期率,坏账率等指标来衡量。
数据方面包含借款申请人填写的基本资料,通讯录,通话记录和其他运营商数据,以及在其他第三方平台提供的黑名单和其他借贷平台借贷还款数据,和app抓取的手机数据,有些还包含人行征信,社保公积金工资银行流水等数据,针对不同额度和客群需要用户填写和授权的资料不一样。
2、信用风险主要用到模型是逻辑回归建立评分卡(也有的用决策树),量化新申请人可能违约的概率,根据评分高定不同的授信规则和催收策略。
现在很多金融机构都能够用大数据模型自动做出决策,大数据风控也用到很多场景中,比如租房分期、手机分期、二手车等。前几天本人刚刚通过某知名房产中介的app,贷款租了一套房子,全程无人工审核,两分钟搞定,非常便捷。
风控不是风险越低越好,而是要控制在一个合理水平,根据不同风险对客户(额度,期限,费率)进行定价。
很多行业会用到风控这个词汇,像券商、保险、银行甚至制造业,都会设置风控这个岗位,风控的意义是通过各种手段去管理可以预见的风险,保证公司业务的收益。
本人做的是个人贷款风险建模,对其他行业不是很了解,这里主要讲个贷。个人贷款的风控具体通过反欺诈、信贷策略、审批、贷后管理手段保证贷款本金和利息能够收回。
1、申请表数据(身份信息、收入水平、工作单位风控、联系人等),这部分是申请贷款时客户自己填写的。
模型效果评估指标大同小异,KS值,GINI系数,ROC等都是评价模型区分好坏客户的能力,以目前我国数据质量来看,一般来说KS达到37以上就不错了。再一个是人群稳定性PSI指数,当客户趋于不稳定时,就该重新调整风控策略,或者重建评分卡了。
每个行业不一样,单以个贷来说,每家公司的优势都不尽相同,目前做消费贷款的公司既有企业,也有网商,还有银行系。这个问题真是不好回答,只能说八仙过海各显神通吧。