风险控制是数据挖掘中最为常见的应用,通常通过以往历史数据判断用户违约的概率。
据统计,银行传统风控模型对市场上70%的客户有效,但另外30%的用户,其风控模型效果大打折扣。
大数据风控作为补充,利用行为数据来实施风险控制,可作为另外的30%客户风控的有效补充。
那么,大数据风控中,是如何进行行业数据分析的呢?
首先,让我们了解一下风控模型的开发流程
↘ 数据抽取
↘ 数据探索
↘ 建模数据准备
↘ 变量选择
↘ 模型开发与验证
↘ 模型部署
接下来,以个人信用评分为例,看看哪些用户行为数据能够进行进行统计分析
在用户行为数据中,风控效果最好的是用户个人金融属性数据,例如:
↘ 年龄
↘ 收入
↘ 职业
↘ 学历
↘ 资产
↘ 负债
这些数据信用相关度高,还可以有效的反映用户还款能力和还款意愿。
除此之外,部分用户行为数据对于信用风险评估也具有较大的影响,甚至在某些条件下这些行为数据是决定用户信用风险事件的强相关因素。
过去,这类用户行为数据并没有被信用风险评估模型采用,也没有参与客户的信用风险评估。然而,随是互联网日渐成熟,金融企业、互联网金融企业在信用风险事件事后分析中发现,用户行为信息在多次风险事件中起到关键的作用。
用户行为数据产生于互联系金融的的各个环节。物以类聚、人以群分,一些群体性的行为特征规律是值得关注的,因此,通过标签获取的用户行为数据,通常倾向于分析用户群体的规律行为的相近性判断。
行为数据在风控中的应用
用户画像
用户画像即为用户打标签,区分不同属性的用户。如:
↘ 性别标签
↘ 年龄标签
↘ 消费偏好标签
用户画像包括人口统计学特征、消费能力数据、兴趣数据、风险偏好;企业客户画像包括企业的生产、流通、运营、财务、销售和客户数据、相关产业链上下游等数据。
用户画像在电商行业被广泛运用。其原理是通过样本数据分析不同标签用户的行为特征,再根据分析获得到的知识对未知标签的用户进行分类。
用户画像在互联网金融的风险控制上可用于征信评级,反欺诈风险控制、动态调整级别和监控(增收和降低坏账率)、快速放贷等业务中。
金融机构拥有的客户信息并不全面,基于平台自身拥有的数据有时候难以得出理想的结果,甚至可能得出错误结论。
因此,大部分的金融机构不仅仅收集自身业务中产生的用户数据,己经开始整合更多其它渠道的行为数据,更全面的对客户进行了解,丰富用户画像。
例如:
↘ 社交媒体上的行为数据(光大银行就建立了社交网络信息数据库)。
↘ 客户在电商网站的交易数据,如建设银行将自己的电子商务平台和信贷业务结合起来
↘ 企业客户的产业链上下游数据。
可以看到,对于个人,银行打通内外部数据,与社会化数据融合,获得更完整的用户拼图,从而为更精准的用户营销服务;
同时,对于企业客户,银行也在收集企业所在的产业链上下游的数据,掌握企业的外部环境发展情况,从而预测企业未来的状况;
风险管理的核心是反欺诈。通过分析用户社保数据、运营商数据、网络行为数据(职业、收入等预测)进行规避己经十分普遍。
实时监控系统内的各类数据,通过实时分析数据结论监测潜在风险并做好预警防范。如:
用户操作
交易流水
访问记录
某内部工作人员在某段时间内操作存贷/汇交易的时间大幅度快于其历史水平;
通过对用户行为数据的采集和分析,找出欺诈者留下的蛛丝马迹,预防欺诈行为的发生。其现实意义在于在欺诈行为发生之前就将其制止。
这个直接用DAQ里的labview singalExpress就可以做,很简单,不过具体的DAQ采集卡需要你自己去了解,可能因卡而异,一般常用的有USB的和PCI总线的,都很好用,不过价格比较贵~个人推荐阿尔泰的USB系列也可以,价格公道些。如果有现成的DAQ卡也可以,最好能提供下型号,和接口方式,有的A0,和A1不能同时作为输入输出~波形生成比较简单,labview有自带的波形生成函数。噪声也有些,可以加入高斯白噪声,柏松噪声之类的~滤波也比较简单,不过滤波后的效果应该非常好,例如加入高斯白噪声用高斯滤波器滤出的效果就非常好了,不过可以用其他滤波器去滤除~波形显示非常简单,频谱分析也是现成的,数据存储方面一般采用存储为TXT文件格式。不过labview7.0手头没有,最老的版本也是7.1的了,只有实验室好像用的还是7.0的。如果可以,下个高点版本的,然后慢慢照抄过去也不难~
B
【答案解析】选项A,会计电算化有狭义和广义之分。狭义的会计电算化是指以电子计算机为主体的课志台设位右难内电子信息技术在会计工作中的应用;广义的会计电算化是指与实现电移算化有关的所有工作,包括会计黑所片争切果攻区软件的开发应用及其软件市场的培育、会计电算化人才的培训、会计电算化的宏观规划和管理、会计电算化制度建设等。选项C,ERP是指利用信息技术,一方面将企业内部所有资源整合在一起,对开发设计、采购、生产、成本、库存、分剂克创句批银销、运输、财务、人力资源、品质管理进行科学规划;另一方面将企业与其外部的供应商、客户等市场要素有机结合,实现对企业的物资资源(物流)、人力资源(食编人流)、财务资源(掌府财流)和信息资源(信息流)等资源一体化管理(即“四流一体”或“四流合一”)。选项D,数据库系统是为适应数据处理的需要而发展起来的一种较为理想统带的数据处理系统,也是一个为实际可运行的存储、维护和乡粉与意端沿件烈师文应用系统提供数据态呼常火声酒况常的软件系统,是存储介质、处理对象和管理系统的集合体。