首页>云计算大数据

大数据风控是宜信金融云的核心支撑

更新时间:2015-03-25

       宜信当前推出了许多创新性的在线产品,与传统金融行业的服务很不同。通过极速模式或者商通贷,宜信的客户享受信贷服务的速度远快于传统方式,而且更加便捷,支撑这些服务的是大数据风控技术,比如数据获取、数据处理、风控建模等。
       也许有人会问,为什么可以做到这么快速的审核批贷?流程简化了,是不是风险很高呢?实际上,宜信金融云的大数据实时授信平台的目标,就是分析客户的信用状 况和风险,实时地评估授信额度、检测风险,或者辅助非实时业务进行信用及风险预估。具体到宜信的大数据风控技术,可以简要地谈谈以下几个方面。

        一、超大的数据规模

        说到风控,首先要说一下建模,风控建模是现代金融领域的必备技术。以申请环节的风控建模为例,通过分析大量正常客户与逾期客户的申请资料,可以找出正常客 户和逾期客户各自不同的    特点,找到这些不同点,就能够识别出可能出现逾期的客户,从而拒绝申请,降低风险。这些可以用来区分两类客户的特点,就是模型,而寻找这些特点的过程就是 建模。建模的过程是利用“人工智能”技术由计算机自动完成的,在建模中,金融专家的经验、对问题的理解都可以融合到模型中,提高模型准确度。
       在传统金融服务的风控建模中,一般使用与客户相关的十几条到几十条信息(数据),大数据风控建模与传统风控建模的最明显不同就是所处理的数据规模不同,可以达到几十万、千万、甚至上亿条信息。
       在大数据风控建模中,一切数据都是客户的信用数据,我们使用尽可能多的数据,即使看起来某些数据和信用似乎没有什么关系。比如说在英语国家,习惯大写字母通常意味着更高的教育水平和还款能力,而在中
国,一个人在线填写申请的习惯和速度,也可以反映出一个人对互联网技术的熟悉程度和还款能力;如果一个客户在新浪微博很活跃,好友众多,互动频繁,说明他 很喜欢社交,突然消失的可能性就不高。当前很多新兴的互联网金融公司,已经成功把互联网行业对数据的处理方式搬到了金融领域,使用尽可能多的数据分析客户 风险,比如ZestFinance、Kabbage等。

        二、领先的数据处理技术

        伴随数据规模的扩大,是数据处理难度的增加,这需要更先进的数据处理技术。数据规模扩大后,每一条客户的信息重要性也许会下降,但是这些信息仍然很有用, 需要充分利用。一些数据看起来和风险没有什么直接相关性,但是能够反映客户的重要属性,所以也可以用来预测风险。比如客户有军事新闻的浏览记录,说明用户 很可能是年轻男性;使用知乎的用户可能就比使用豆瓣的用户更偏理工科。
         另外在大数据风控建模中,有确定意义的所谓结构化数据只占一部分,比如在借款申请表中的身份证号码,一定是16位或者18位,并且代表一个人的身份,根据这个号码可以从公安系统中查到一个人的姓名、照片
等信息,这就是结构化数据。大部分数据是不太容易处理的非结构化数据,比如网页上出现了一串不是很规则的数字,有可能是发帖人的电话,有可能是某个饭店的电话,有可能都不是,甚至有可能不是电话号码,这就是非结构化的数据,需要用一些专业技术进行分析。
        当数据规模达到一定程度,处理的难度会直接来自规模本身,单台计算机无论是处理速度还是存储容量都无法满足建模要求,这个时候需要使用分布式的计算框架,使用很多台计算机一起来完成模型训练和建模的
工作。

        三、宜信金融云的风控优势

        在风控建模中,数据量很重要,企业掌握的客户数量越大,模型就越准确,宜信积累了数百万级的用户数据,是宜信金融云的基础财富。
        在风控建模中,金融专家的领域知识也非常重要,宜信八年多的风控经验积累为宜信金融云提供了有力的支撑。大数据建模的技术就好像是一辆跑车,可以高速跑到很远的距离,但是宜信风控的经验积累可以帮助
        这辆车找到最好的方向。在极速模式的建模过程中,一开始由于还没有客户的真实逾期数据,无法准确判断谁是好用户,谁不是好用户,所以需要通过经验进行人工 定义。建模工作进入瓶颈后,宜信风控专家会重新审视该项目,然后进行重新定义,可以使准确度成倍提高。
        最后,宜信拥有客户从获客到还款整个生命周期的数据,形成了数据闭环。形成闭环意味着基于“人工智能”的风控模型具有自学能力。比如说,风控模型认为某个 客户资质良好, 但是最终该用户逾期,风控模型可以自动从这个客户身上吸取教训,修正模型,随着时间积累,模型性能可以越来越好。

上一篇:企业实施大数据的五大关键...

下一篇:中兴集团招聘云计算工程师4名!...

金源在线客服

QQ在线咨询

咨询电话
010-83650488

在线咨询

在线咨询

电话咨询