第一篇:征信数据—征信大数据的挖掘与风控应用
互联网金融发展的关键是风险控制,“风险控制”已然成为诸多互联网金融企业能否长大的魔咒,这个不争的事实像一座大山摆在众多互联网金融大佬与创业者的面前。为什么阿里金融能够将它的网络小贷不良率控制在不到1%,有胆量再贷多点吗?大数据挖掘技术和互联网金融的风险控制到底是什么关系?互联网金融将怎样建立有效的风险控制生态体系?本文将带你揭开大数据挖掘与互联网金融风险控制的神秘面纱。
最近互联网金融圈不仅自己玩的很开心,而且还拉上了金融界甚至央行的大佬们一起玩的很开心。尽管让互联网金融企业头痛的问题——央行征信系统不对市场开放,仍然没有解决,但至少央行的态度明朗,支持互联网金融的发展,并认为互联网金融是传统金融的有益补充。
生命的神奇之处在于它总能找到一个出口。作为新生事物的互联网金融也不例外,在那扇门朝他们关闭的同时,他们却找到了另外一扇窗。在亦步亦趋的探索中,他们中的大企业通过自身力量,小企业通过联合的力量找到了适合自身发展的风险控制生态系统,正朝着良性和有序的方向发展,正如凯文凯利在他的《失控》中描述的群氓智慧那只无形的手。
互联网金融掌握了可以颠覆传统金融的风控技术
在不依赖央行征信系统的情况下,市场自发形成了各具特色的风险控制生态系统。大公司通过大数据挖掘,自建信用评级系统;小公司通过信息分享,借助第三方获得信用评级咨询服务。
互联网金融企业的风控大致分为两种模式,一种是类似于阿里的风控模式,他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型。另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构,再分享征信信息。
央行的征信系统是通过商业银行、其它社会机构上报的数据,结合身份认证中心的身份审核,提供给银行系统信用查询和提供给个人信用报告。但对于其它征信机构和互联金融公司目前不提供直接查询服务。2006年1月开通运行的央行征信系统,至2013年初,有大概8亿人在其中有档案。在这个8亿人当中,只有不到3亿人有过银行或其他金融机构发生过借贷的记录,其中存在大量没有信贷记录的个人。
而这些人却有可能在央行征信系统外的其它机构、互联网金融公司自己的数据系统中,存有相应的信贷记录。市场上一些线下小贷公司、网络信贷公司对于借贷人的信用评级信息需求非常旺盛,也因此催生了若干市场化征信公司,目前国内较大的具有代表性的市场化征信公司有几家:如北京安融惠众、上海资信、深圳鹏元等等。
从P2P网贷公司和一些线下小贷公司采集动态大数据,为互联网金融企业提供重复借贷查询、不良用户信息查询、信用等级查询等多样化服务是目前这些市场化的征信公司正在推进的工作。而随着加入这个游戏规则的企业越来越多,这个由大量动态数据勾勒的信用图谱也将越来越清晰。
互联网海量大数据中与风控相关的数据
互联网大数据海量且庞杂,充满噪音,哪些大数据是互联网金融企业风险控制官钟爱的有价值的数据类型?下图为大家揭示了互联网海量大数据中与风控相关的数据,以及哪些企业或产品拥有这些数据。
(图)风控相关大数据及代表企业或产品
利用电商大数据进行风控,阿里金融对于大数据的谋划可谓非一日之功。在很多行业人士还在云里雾里的时候,阿里已经建立了相对完善的大数据挖掘系统。通过电商平台阿里巴巴、淘宝、天猫、支付宝等积累的大量交易支付数据作为最基本的数据原料,再加上卖家自己提供的销售数据、银行流水、水电缴纳甚至结婚证等情况作为辅助数据原料。所有信息汇总后,将数值输入网络行为评分模型,进行信用评级。
信用卡类网站的大数据同样对互联网金融的风险控制非常有价值。申请信用卡的年份、是否通过、授信额度、卡片种类;信用卡还款数额、对优惠信息的关注等都可以作为信用评级的参考数据。国内最具代表性的企业是成立于2005年,最早开展网上代理申请信用卡业务的“我爱卡”。其创始人涂志云和他的团队又在2013年推出了信用风险管理平台“信用宝”,利用“我爱卡”积累的数据和流量优势,结合其早年的从事的FICO(费埃哲)风控模型,做互联网金融小微贷款。
利用社交网站的大数据进行网络借贷的典型是美国的Lending Club。Lending club于2007年5月24日在facebook上开张,通过在上面镶嵌的一款应用搭建借贷双方平台。利用社交网络关系数据和朋友之间的相互信任聚合人气。借款人被分为若干信用等级,但是却不必公布自己的信用历史。
在国内,2013年阿里巴巴以5.86亿美元购入新浪微博18%的股份,其用意给人很多遐想空间,获得社交大数据,阿里完善了大数据类型。加上淘宝的水电煤缴费信息、信用卡还款信息、支付和交易信息,已然成为了数据全能选手。
小贷类网站积累的信贷大数据包括信贷额度、违约记录等等。但单一企业缺陷在于数据的数量级别低和地域性太强。还有部分小贷网站平台通过线下采集数据转移到线上的方式来完善信用数据。这些特点决定了如果单兵作战他们必定付出巨大成本。因此,贡献数据,共享数据的模式正逐步被认可,抱团取暖胜过单打独斗。其中有数据统计的全国小贷平台有几百家,全国性比较知名的有人人贷、拍拍贷、红岭和信用宝等。
第三方支付类平台未来的机遇在于,未来有可能基于用户的消费数据做信用分析。支付的方向、每月支付的额度、购买产品品牌都可以作为信用评级的重要参考数据。代表产品为易宝、财付通等。
生活服务类网站的大数据如水、电、煤气、有线电视、电话、网络费、物业费交纳平台则客观真实地反映了个人的基本信息,是信用评级中一类重要的数据类型。代表产品为平安的“一账通”。
互联网金融风控大数据加工过程
(图)大数据加工过程图解析
如上图所示,在进行数据处理之前,对业务的理解、对数据的理解非常重要,这决定了要选取哪些数据原料进行数据挖掘,在进入“数据工厂”之前的工作量通常要占到整个过程的60%以上。
在数据原料方面,越来越多的互联网在线动态大数据被添加进来。例如一个虚假的借款申请人信息就可以通过分析网络行为痕迹被识别出来,一个真实的互联网用户总会在网络上留下蛛丝马迹。对征信有用的数据的时效性也非常关键,通常被征信行业公认的有效的动态数据通常是从现在开始倒推24个月的数据。
通过获得多渠道的大数据原料,利用数学运算和统计学的模型进行分析,从而评估出借款者的信用风险,典型的企业是美国的ZestFinance。这家企业的大部分员工是数据科学家,他们并不特别地依赖于信用担保行业,用大数据分析进行风险控制是ZestFinance的核心技术。他们的原始数据来源非常广泛。
他们的数据工厂的核心技术和机密是他们开发的10个基于学习机器的分析模型,对每位信贷申请人的超过1万条原始信息数据进行分析,并得出超过7万个可对其行为做出测量的指标,而这一过程在5秒钟内就能全部完成。
事实上,在美国,征信公司或者大数据挖掘公司的产品不仅用于提供给相关企业用于降低金融信贷行业的风险,同时也用于帮助做决策判断和市场营销,后两者不在本文的探讨范围内,但是可以从另一个方面给我们很多启发。
神州融大数据风控平台是由神州融与全球最大征信局Experian(益博睿)、阿里金融云联合各大征信机构、电商平台等伙伴合作打造,小微金融机构零门槛即可拥有价值千万、世界顶级信贷工厂管理系统与量化风控决策能力,一站式轻松接入3000+维度鲜活数据源和自动化决策评分卡,并免费对接大型电商平台、获得垂直信贷场景下的创新金融产品。
第二篇:大数据征信
大数据征信 互联网金融的罗生门
2015-02-19徐富记
从央行个人征信牌照开闸,到首家互联网银行微众银行给卡车司机发放第一笔贷款,互联网金融的浪潮俨然已从P2P网贷汹涌到众筹,又波涛到大数据征信。
史铁生曾说过:“历史在发生时未被发现,在发现时已被重组”,正如当下之大数据征信,尽管已悄然发生,但未被发现,而再发现时,却已被改写,局内人的自说自话,局外人的不明觉厉,大数据征信,似乎已成互联网金融的罗生门。
四级征信机构 百花齐放
2015年新年伊始,央行下发《关于做好个人征信业务准备工作的通知》,正式开启个人征信市场化闸门,民营征信迎来元年,以阿里巴巴芝麻信用为代表的基于消费大数据的征信机构、以鹏元征信为代表的基于公共大数据的征信机构和以社交数据作为征信模式的玖富旗下的闪银(we cash)等征信机构纷纷登台亮相。
以目前国内的信用体系,信用数据大致分为国家级、电商级、互联网金融企业级、社交金融级,其中,国家级的信用数据为央行的征信中心和银行等金融机构的信贷数据、各部委的具有公共属性的比如通信、水、电、煤气等公共数据。
电商级的即包括以阿里、京东为代表的消费数据;互联网金融企业级的则如安融惠众、上海资信;社交金融则如闪银等开启的新型征信模式。
毫无疑问,征信产业的发展不仅有效防范金融的风险,改善个人贷款质量,提高了银行的净收益,同时,随着国内信贷行业及消费行业的提速,也再次催生了征信业的巨大需求,据《中国征信业发展报告(2003-2013)》显示,截止 2012 年我国征信机构达到 140 家左右,总规模达 20 亿,相较于美国近800 亿市场和日本 40 亿市场仍有较大的差距。
为此,方正证券研究认为,如果我国采取市场化模式,按照现有价格、企业及个人总数的体量,在发展成熟后我国征信行业仅个人征信市场总空间将在 1000 亿左 右,相较目前不到 20 亿的体量有 50 倍的成长,是名符其实的蓝海。
我的“痛”,有谁知?
在如此蓝海之下,我国目前的大数据征信的成长阶段跟美国早起的征信市场类似,百花齐放,百家争鸣,那么,现在的信用数据体系中,各种不同模式又各自有着怎样的“痛”呢。
以央行的征信中心数据体系为例,由于起步较晚,目前我国个人的征信体系明显存在覆盖面不足的情形。到2013年底,央行征信系统收录的自然人数量已经超过8亿,但其中有信贷记录的仅有3.2亿人,占全国总人口数的1/4不到。另外征信在日常生活服务中的应用几乎为空白。而且这些数据都来自于银行的信贷数据,涉及面较为单一。
以电商为代表的消费信用数据“芝麻信用”的模式,则是通过分析人的互联网行为记录,对人的身份真实性、行为可信性进行评估并给出认证等级,并且首次作为第三方平台征信数据,提供给P2P平台等。
事实上,阿里巴巴在早年就已推出诚信通指数,这是阿里在诚信通会员的“诚信通档案”基础上推出评分系统,由A&V认证、证书及荣誉、会员评价、经验值等要素构成。每次成功交易或获得贷款,均会累计会员的诚信通指数,并实时公布,从而引导客户注重累计自己的信用度、活跃度,形成信用市场的良性循环。
然而,众所周知的是,阿里巴巴的金融业务无论是对个人还是对商户,业已开展的如火如荼,这意味者如果芝麻信用要将自己的信用数据与p2p等金融机构互换(芝麻信用不一定会拿出自己的全部数据),那么,芝麻信用的数据值将是1+1》2的模式,一旦换取更多的信用值,自己的信贷业务又如火如荼,那么,阿里巴巴就充当了又当裁判,又做球员。
这就类似与美国的FICO,因为FICO为各家信用卡机构提供评分和信用结果,结果FICO自己又去发放信用卡,那么,信用卡机构是无法跟FICO长期愉快地玩耍的。
第三种模式则是以安融惠众、上海资信互联网金融征信机构,央行杭州中心支行行长张健华在日前发表的《我国互联网征信发展与监管研究》披露的数据是,截至2014年7月25日,网络金融征信系统(NFCS)(即上海资信)共接入203家P2P平台,日均查询量达约2000次。
与之相比,北京安融惠众征信有限公司的数据量似乎更高,其创建的“小额信贷行业信用信息共享服务平台”(MSP)于2013年3月正式上线,为P2P、小贷公司、担保公司提供行业信息共享服务。截至2014年9月15日,MSP征信平台会员机构已经达到405家,会员间信用信息共享查询量已达日均9000余件,有信用交易信息记录的自然人信息主体数量突破100万人。
就笔者了解,上述两种征信机构目前阶段还属于接入更多数据阶段,也只有接入的P2P、小贷公司、担保公司的量足够庞大,才能考虑在此数据量的基础上,开发数据模型与信用评分。
第四种创新的模式则是基于社交的大数据征信模式,典型的代表企业为玖富旗下品牌闪银,闪银被看作是中国的Zestfinace,通过利用移动互联网、利用大数据技术分析用户的社交信息等数据,完成个人授信。
在闪银的评价模型中,社交数据尤为重要,比如个人的微信、微博、朋友圈、校友录、信用卡账单等,通过附加社交维度评估个人信用状况,大大降低传统单一的通过资产或流水形式评估的信用风险。
揭开“大数据征信”面纱
如此来看,无论是正规军,还是后起之秀,大数据征信,无论哪一家都需要解决的一个痛点是“大”,怎么才算大?是足够多还是足够重要?是一家独大还是大而不全?在央行打开的这半扇罗生门里,需要拨开以所谓“大数据”为外衣的云雾,只有当我们看到征信业的新历史正在发生时,我们才能发现这个历史,而非在它重组之时。
拨开这层云雾,则回到征信的初衷,征信的本质在于解决两方面问题:信用能力和信用意愿,换而言之,即解决个人的还款能力和还款意愿,再追根溯源一点,即解决坏账和逾期两个问题。
那么,大数据征信,无论是传统在银行的资金流水,还是在电商的交易,还是在各种社交平台上的轨迹,都需要去验证,这些数据对坏账和逾期的相关性问题。
而这个验证的工作,正如一个精巧的匠工,首先需要海量的数据积累,然后有的才是一点一滴地去校验过程,只有这个过程做到足够庞大,就像手表一样,才能走得足够精准。如此以来,征信对金融的价值才能准确发挥。
第三篇:企业征信数据主要内容以及数据来源
企业征信数据主要内容以及数据来源
—、企业征信数据主要内容企业征信数据由企业信用信息转换而来,企业信用信息只有经过数据处理后、被存储到企业征信数据库中的数据才是企业征信数据。企业信用信息只有转化成征信数据之 后,才能达到商品化要求,才能用于生产企业征信报告。企业征信数据与企业信用信息之间的区别很大。企业征信数据除了带有经过数据处理的特征之外,还要有统一数据格式要求,不仅同一项数据的结构和精度均相同,而且 对于每项数据的起始点和终结点都有严格的要求。企业征信机构不见得广泛地采集所有能够采集到的信用信息,企业信用信息或企业征信数据的采购是被限定在特定范围之内的。企业征信机构是否加工或保存一类征信数 据,受到两个基本条件的约束,一是技术,征信数据必须能对企业信用价值的评估做出 贡献;二是成本,即在经济上合算。对于加工和存储成本高,又对制作报告产品贡献不太大的征信数据,企业征信机构不会加工和保存。企业征信数据内容通常包括企业的注册信息、财务报表、公共记录、雇员、进出口情况、银行往来情况、付款记录、经营者简历、企业发展史、财务报表反映不出的经营 状况、产品介绍以及相关的市场宏观经济状况和行业发展状况等。I
二、企业征信数据主要来源(一)政府掌握的企业征信数据政府掌握的信用信息是公务信息的一部分,产生于政府执行公务或对企业实施监管的工作过程之中。根据企业征信机构的经验,十几个政府部门掌握了大量的企业信用信 息,如工商行政管理局、税务局、中国人民银行、海关总署、统计局、法院、国资委、商务部、邮政局等(见表3-1)。工商行政管理局掌握着大量的企业基本信息、企业财务信息和行政处罚信息。目前,工商行政管理系统掌握的信用信息是有条件的开放,其中企业登记注册的信息是基本对外开放的。工商行政管理局在很多省市地区开通了 “红盾网”,可以免费在网上査询当地企业的登记注册信息。统计局定期形成的各种统计报表和经济普查报告,其中包括企业的财务报表。目前,统计局掌握的信用信息还没有全部对外开放,还无法从这个信息源中得到单个企业的信 用信息。海关掌握企业从事进出口活动的相关信息,海关的统计部门和信息中心会定期形成报关单和各种进出口统计报表,主要内容包栝进出口的产品名称、货品数量、产地、发 货地、到达地、交易对象、交易时间等。此外,海关还会形成季度和进出口统计和 分析报告。中国人民银行征信中心负责国家金融基础信息数据库的建设管理工作,已经建立了公共的企业征信系统和个人征信系统,各类正规金融机构掌握的企业及个人信贷已经被 汇集到这两个系统中。商业银行等金融机构经企业、个人授权同意后,在审核信贷业务 申请以及对已发放信贷进行贷后风险管理的情况下,可提供企业、个人征信报告。国有资产管理委员会拥有国有企业的资产、隶属、经理人员、并购、政策等资料。外汇管理局掌握着所管辖有外贸经营权企业从事外汇交易活动的外汇交易额、进出口货 物情况、结汇情况、应收账款情况等。房屋管理局主管房地产登记管理工作,确认房屋 权属,办理房屋所有权登记和初始登记、转移、变更、注销及设定他项权登记。公安局车辆管理所掌握所管辖区域内所有机动车所有权登记信息。还有些政府部门会定期公布诸如破产、抵押品置留权、动产抵押申请、民事诉讼、经济仲裁等公共记录,上述政府部门提供的企业信用信息非常有价值。(二)非官方的企业信用信息非官方的企业信用信息,是指政府公务信息之外的企业信用信息,有时也被称为“民间信息”,特别指那些非商业化的企业信用信息。非官方的企业信用信息的主要来源 是商业银行、行会商会、公用事业单位、电信公司、企业的供应商、各类房东、租赁公 司和新闻媒体等,这些信用信息的拥有者所提供的信息是庞杂的。但是,经过企业征信机构的筛选和处理,有些信用信息是可以利用的,能够成为企业征信数据。商业银行拥有大量的企业信用信息,如企业开户信息,贷款、担保和还款记录等信息,资金流人和流出量及去向方面的信息。长期以来,商业银行是最重要的民间信用信 息来源,对于那些没有公共征信系统的国家更是如此。在许多国家,商业银行都会向企业征信机构提供信用信息,它们不仅正常地提供企业信用信息,而且还不一定收取费用。中国人民银行征信中心建立了我国企业和个人公 共征信系统,产生于商业银行的企业信甩信息都被汇集到中国人民银行征信中心的企业 征信系统中。目前中国人民银行征信中心不对金融系统之外的机构开放,只向商业银行等正规金融机构提供信息查询服务。第三章企业征信业务公用事业单位产生了大量的用户付费信息,这对于了解和评价其用户的信用行为和财务能力是非常有用的。所谓的公用事业单位,主要包括电力公司、自来水公司、电话 公司、煤气公司、供暖公司等,人们还经常将移动通信服务类公司也包括进去。如果一 个企业长期拖欠公用事业单位的费用,那么企业征信机构将视其的欠费额度大小,给予欠费企业不良信用记录。另外,公用事业用户的付费方式也对了解用户的财务状况和信 用行为有帮助。各行各业的行业协会或商会都有着自己行业情况的信息积累,如它们有相当详细的业内主流机构、行业发展和从业人员变化等信息。这些信息可以反映行业当前的实际情 况和行业发展趋势。行业协会掌握的信息有可能是与业内机构共享的,面向自已的会员 企业服务。很多行业协会都负责编纂本行业的年鉴,它们有采集年鉴所需信息的渠道,这些信息渠道对企业征信机构是有价值的。例如,《中国电子信息产业年鉴》《中国汽车 年鉴》和《中国金融年鉴》等。年鉴对行业在过去一年的发展情况、产品情况、技术水平、企业发展情况、盈利水平、发展趋势、大事记等做了详细的记录和说明,具有较高的参考价值。在报纸、杂志、广播、电视、网络等公众传媒上,也有大量的信用信息在传导,从中可以筛选出一些有用的信用信息。目前,互联网巳经成为重要的“信息集散地”,从各 类网站获取所需的信用信息成为企业征信机构的一个重要的信息渠道。政府部门的网站 是该部门的权威信息发布平台,相关行业政策、法规和行业总体运行情况都会在部门网站中得到及时反映。大量网站对行业和企业的经济活动给予动态报道,它们都是企业征 信机构的重要信息来源。不同信息来源的原始信用信息有可能存在不完整、有偏见、有误导、不够及时等缺陷,从征信机构的用户角度对企业信用信息来源做出的评价,如表3-2所示。(三)商业化的企业征信数据及其采购商业化的企业信用信息是非官方信用信息的一部分,通常以征信数据的形式存在,是可以进行交易的商品。在发达国家的市场上,可以找到许多数据供应商,企业征信机构可以从数据供应商处采购数据。因为数据供应商是销售数据产品的专业机构,它们有能力提供符合企业征 信机构要求的征信数据,而且数据的质量很高。除了数据供应商之外,企业征信机构还可以从其他的征信机构购买企业征信数据。一些拥有大型征信数据库的企业征信机构也提供不同加工深度的企业征信数据,如企业 基本fe息等。在必要的时候,企业征信机构还可以委托其他类型的机构帮助调查,取得一些特殊类别或特别准确的企业信用信息。例如,委托律师事务所进行调查,通过律师取证得到 调查对象的账本或特殊信息。当然,还可以委托会计师事务所进行调查。然而,通常企 业征信机构不使用律师事务所或会计师事务所提供的专案调查服务,尽管这种调査所取得信息的可靠性高,但费用太高。另外,这种调查的震动大,容易被调查的目标企业察 觉,可能伤害到企业征信机构与委托人关系。在市场上采购企业征信数据,要通过一个设定的工作程序,避免花钱却没买到可用的数据问题,或是买了质次价高的征信数据。一个好的企业征信数据供应商应该具备下 列特征:(1)是合法的征信数据供应商,提供的征信数据也是合法的。(2)提供的征信数据质量好,特别要剔除那些提供假数据(特别是假财务报表)的数据供应商。(3)征信数据的供应稳定,更新频率高。(4)征信数据的广度和深度达到要求。(5)征信数据的服务方式和数据格式符合买方的要求。(6)征信数据的价格合理。(7)大型的数据供应商还可以提供海外采购服务,代理销售外国企业的征信数据。(8)个别数据供应商允许交换数据,可以节约买方的采购成本。|
三、企业征信数据采集主要方式(一)公开数据的采集方式政府公务信息的采集主要存在如下常见方式:(1)掌握政府信息公开网站的结构,建立数据自动抓取系统,自动化采集。(2)建立商业化的信用信息采集关系。(3)建立数据交换关系。从公用事业单位采集信息,主要方法有两种:一是从公用事业单位或通信公司采购数据,至少要采集欠费用户的负面信息;二是承接公用事业单位或移动通信公司的信用 风险控制任务,帮助它们建立信用风险防范机制,包括欠费催收工作。对于征信数据供应商,企业征信机构主要的工作是对它们进行筛选。评价供应商优劣的硬性指标包括合法性、类型、覆盖、质量、更新频率、效率、成本、稳定性和服务 态度。(二)电话调查采集方式电话调查也是企业征信机构经常使用的调査方法之一,是一种低成本的调查方法。通常来说,企业征信机构使用电话调查方法的作用有两个:一是采集信用信息,二是核 实信用信息。在以传统作业方式操作的企业征信机构中,电话调查员主要的工作是采集信用信息,是根据委托人的需求进行个案调查。但是,在拥有大型征信数据库的企业征 信机构中,电话调查员的主要工作是核实征信数据。在拥有大型征信数据库的征信机构,如果向用户提供征信数据产品或数据库服务,需要有比较高质量的企业基本信息。因此,在这样的企业征信机构,需要相当数量的电 话调查员同时工作。企业征信机构对电话调查员的培训是很严格的,培训内容包括相关法律法规、通话用语、掌握主动、应对拒绝、控制时间、认真记录等。如果采用专业软件进行管理,需 要实现一系列业务和管理功能,主要体现在提示、录音和监控等功能上。对于企业征信 机构,最重要的是不能让电话调査员使用非法的语言。由于对方是否提供信用信息完全出于自愿,因此企业征信机构要严格管理电话调查员的业务操作行为,防止电话调查员 在通话时冒充具有监管职能的政府公务员,避免产生纠纷和政府查处。总之,电话调查方法既有优点,也有局限性。企业征信机构应该合理使用电话调查方法,既不能过分依赖,更不能完全放弃。(三)信用信息资源共享方式使用信息交换方式对于企业征信机构有如下好处:(1)通过交换,得到自己需要的信用信息。(2)不是采购行为,没有资金付出,经济成本很低。(3)与交换对象建立了良好的合作或公共关系,形成一种双赢的局面。(4)社会意义明显,如促进了失信记录的传播,有助于加大失信惩戒机制的震慑力度。鉴于上述诸多优点,企业征信机构应尽量采用信息交换方式获取自己所需要的信用信息。(四)信用信息采集的原则在采集信用信息时,应遵循以下4项原则:1.客观真实性原则在采集信用信息时,应保证客观、真实地反映企业信用状况,坚决杜绝由于信用信息采集工作人员的主观臆断、个人好恶或者由于其他目的的故意隐瞒事实真相,造成评 估决策的错误。2.多渠道验证原则在采集信用信息时,应通过多种渠道和方法采集信用信息,使这些信用信息能够相互验证。如果信用信息来源的渠道单一,由于信息资料短缺造成无法相互验证,信用信 息的质量就无法保证,出现误差的可能性就会很大。因此,一般要求通过3个以上的渠道 和方法采集客户信用信息。3.低成本高效率原则采集信用信息必须考虑获取信息的成本。对调查过于细致,固然能够保证采集信息更全面,调查内容更准确,但也会造成采集费用过大,信用管理成本过高,使企业 的整体效益受到影响,违背了信用管理降低企业成本的初衷。因此,在采集信用信息 时,应尽量降低采集成本,用最低的成本采集到能够满足企业信用评估和决策要求的信息。4.时效性原则为了保证征信数据库的更新频率,要求征信机构定期更新征信数据,所以采集信用信息的工作要非常及时。征信机构要根据自己拥有信用信息源的多寡,安排适当数目的 人员照看信用信息源,及时将所需要的信用信息采集上来。同时,征信机构还要聘用适 量的电话调查员去核实信用信息。
第四篇:ZestFinance用大数据颠覆传统征信业
ZestFinance用大数据颠覆传统征信业
2014-09-05 大数据邦
硅谷越来越多的科技企业开始向金融圈进军。ZestFinance就是其中之一。这家公司打出的旗号是“将Google算法带入征信领域”,其利用机器学习和大数据技术,创立了一套和传统模式相异的信用评分方式,其中应用的数据变量是传统模式的上百倍。
ZestFinance创立于2010年,创始人道格拉斯·梅里尔(Douglas Merrill)是Google的前信息总监兼工程副总裁,另一位来自金融圈的创始人肖恩·布德(Shawn Budde)曾在第一资本公司(Capital One)负责信贷业务。
记者专访了ZestFinance的创始人梅里尔,他认为,“ZestFinance完全可以取代银行现在用的算法。”
然而,美国个人消费信用评估公司(FICO)中国区总裁陈建表示,这不可能。在美国有1000多家当地信用局为消费者服务,基本隶属于三大征信公司。这三家征信公司分别拥有覆盖全美的数据库,包含超过1.7亿消费者的信用记录。在三大征信公司收集了海量个人征信数据后,还须经过复杂的模型计算才能形成征信产品。这三家征信公司目前使用的计算方法模型都来自同一家公司,即被称为“幕后大佬”的FICO。
越来越多类似ZestFinance的初创公司正在觊觎传统华尔街的地盘。而其势头如同多米诺骨牌,不断推向华尔街的要害。数据变废为宝
在ZestFinance的官网上有这样一句话:“所有的数据都是信用数据。”这句话恰恰浓缩了ZestFinance所做的工作——将成千上万的数据“变废为宝”,应用于信用评分。
这家公司在短短四年时间内,就先后获得了高达1.2亿美元的融资,其背后的出资人都是著名的IT风投,包括FlyBridge、GRP、LightSpeed以及Matrix等。
目前,美国绝大部分金融机构使用的信用评分都来自FICO的模型算法。自上世纪60年代至今,在美国的征信体系中,FICO的地位从未被撼动。
在美国,经过三大征信公司的整理和FICO的计算评分,海量的征信数据就变成了一份份整齐美观的报告和325-900分值区间的评分,用户可以只买报告,也可以报告+评分打包购买。
中国科学院院士、北京大学教授鄂维南对记者表示,FICO的评分模型的确首屈一指,但并非十全十美。FICO信用评分参考的数据变量只有不到50个,因此很多人摸清了FICO关注的变量后,就可以“模型套利”增加自己的信用评分,例如一个人可以每天反复在图书馆借书还书“刷信用”。
“针对FICO的不足,ZestFinance重新设计了一套信用评估模型。和FICO的不到50条参考变量相比,ZestFinance参考的数据变量多达上万条,并采用非线性化的、更前沿的技术来进行分析,从而防止‘模型套利’的现象,更精准地评估消费者信用风险。” 的确,ZestFinance远远超出了FICO 50条变量的界限。在这个位于洛杉矶的65人团队中,大多是数据科学家,他们开发了多个机器学习分析模型,而在这个模型中使用的数据变量多达上万条。上万条数据变量仅仅是原始信息数据,在这些数据基础上,模型可以得出超过7万个可以判断信贷行为的指标。而模型跑完这些指标仅需要不到3秒钟。
所谓机器学习,是让计算机模拟或实现人类的学习行为,以获取新的知识技能,在数据积累中不断自我完善,可谓是人工智能的核心。ZestFinance的模型之一Hilbert就是成功地将机器学习进行商业应用的案例,让机器承接7万个指标的数据分析工作,寻找逻辑关系,并不断自我改善,人类只需要根据结果进行一些逻辑分析和判断。
“多年来,美国金融机构都在用50条数据变量来决定是否给一个客户授信。问题在于,许多人并没有完整的信用记录,这导致在传统信贷中他们不断吃闭门羹,”梅里尔表示,“在ZestFinance,我们分析上万条数据变量,借助更加广泛的数据,从而对客户的风险预判更加精确。”
数据的类型亦极其广泛:一个人的网页浏览历史、手机付费记录、超市购物清单都可成为重要的参考依据,甚至在用户填写信贷申请表时是使用大写字母还是小写字母,也可以成为数据变量。
“很多数据都可以服务于信贷,例如申请人在我们的网站上停留的时间,就可以反映他对申请贷款的谨慎程度和还款诚意。”梅里尔说。
鄂维南认为,信贷记录属于强变量,在强变量缺失的情况下,可参考多种弱变量,当这些弱变量组合起来,就可形成强变量,服务于信贷风控。“例如,孩子是一个家庭支出的源泉,那么如果能推测出借款人孩子的年龄,就能预测他的消费周期:婴儿有奶粉等固定开销、学生每到9月就要缴纳学费等。只要能避开他的主要支出,就可控制坏账。” 在中国,由于征信业历史较短,缺乏足够的信贷数据,就可以用许多弱变量数据来对一个人进行还款预测。目前,学界有许多人也在进行类似的课题研究。
对于这些“弱变量”的开发利用,陈建亦表示认同,“把数据的价值挖掘出来是不可避免的趋势,大数据发展会越来越日新月异。”但他表示,从互联网数据中挖掘价值,最早做的正是FICO。“银行刷卡交易实时获得数据,通过分析进行风险识别,FICO十几年前就发明了,现在90%以上发达市场的银行都在用FICO这套系统。” 争锋FICO 的确,在当前ZestFinance和FICO尚不能同日而语。FICO占领着美国99%的信用评分市场和绝大部分发达国家的信用评分市场,而ZestFinance目前仅服务过10万名美国人。
在中国,FICO目前拥有80人的团队,已经和15家商业银行、30多家城商行和农商行建立了合作。ZestFinance目前在美国以外的其他地区还没有开展业务,但梅里尔告诉财新记者,目前正与多个中国金融机构洽谈合作。
但从未来发展的空间而言,似乎新生事物总能赢得更多青睐。面对ZestFinance等新型信用评分公司的诞生,美国主流媒体纷纷给予了报道——《经济学人》杂志写道:“ZestFinance比传统评分方法让违约率下降了40%。”CNBC表示:“ZestFinance让无账户人群不再被拒之门外。”
这一切声音,似乎都剑指FICO。
梅里尔表示,ZestFinance采用了和FICO截然不同的技术。FICO是基于20世纪50年代创造的“逻辑回归”模型,那时并无很多可供参考的数据变量。但随着互联网时代来临,数据开始爆发式增长,FICO的评分方式并未改变。梅里尔这位曾经的Google人,则将Google算法引入了征信领域,走在了技术的前沿。“ZestFinance完全可以取代银行现在用的算法。”梅里尔自信道。
对于外界的质疑,FICO表示很冤枉。陈建表示,外界对FICO其实缺乏了解。FICO并非只有一种算法,而是有几百种算法。在美国仅注册的算法专利就多达近200个。在不同的数据场景下,使用的数据变量和数量都不同。
陈建认为,数据变量并非越多越好。
“FICO信用评分的候选变量其实有1000多个,只是具体到每个评分中,只使用其中的几十个变量。”陈建表示,认为变量越多模型越好是幼稚的说法。从统计学角度,模型计算一方面要抓住本质规律,一方面要避免过度拟合。
“变量太多会造成过度拟合的问题。就好比做一双鞋子,与你的脚100%拟合,但别人都不能穿。FICO不是给一个人做一双鞋,而是要给全社会使用。如果一些变量不是适用于每个人,就不适合放在模型中。”陈建说。
根据惠誉评级公司的研究结果,FICO分数的影响力正在下降。现在美国各个银行都有自己的模型,他们会用自己的模型去跑征信原始数据,FICO评分只是其中一个参考变量。例如美联银行(Wachovia)对FICO评分的参考比重已经下降为零。
对此,陈建认为只是个别现象。“就我了解,目前美国银行业99%的资产组合还是基于FICO上,拿出1%来试验新的东西是可取的,但这并非主流。”
陈建表示,技术服务于产业,信用评分不是象牙塔里的空想,而是根基深入产业的积累。目前美国99%的银行都使用FICO的评分系统,深厚的积累是其他公司难以比拟的。
陈建毫不掩饰他对FICO的自信:“FICO已经成为发达市场金融管理的肢体部分,不会有人想要卸掉自己原本的胳膊,换上一对高科技的塑料胳膊。” 为无账户人群服务
“金融包容”正在成为一个新兴词汇,它的含义是指让没有银行账户或信用记录不好的人群公平地享受金融服务。
万事达公司CEO Ajay Banga近日在一份关于金融包容的倡议书中表示,目前全球有25亿成年人没有享受过金融服务,其中大部分是妇女和年轻人,以及一些居住在乡村的人。在美国,目前有4400万人没有银行账户。“因此,金融包容需要在所有国家倡议,绝非仅仅发展中国家。”
梅里尔表示,ZestFinance正是要为这些没有银行账户以及信用记录不好的人解决贷款问题。
“我最初的灵感来自我的小姨子。”梅里尔向财新记者追忆道,当时他的小姨子要贷款换一副汽车轮胎,然而银行因她没有足够信用记录而拒绝。“后来是我给她借了钱。如果我不借钱给她,她就只能去申请‘发薪日贷款’了。”
梅里尔提到的“发薪日贷款”是指在发薪日之前两周申请的小额个人贷款,借款人只需提供收入证明或政府救济证明,承诺在自己发薪水后即偿还贷款。如果到期无法还清贷款本金和利息,可以提出延期。然而,这种贷款的费率极高,每100美元收取15美元利息,年化利息高达400%。相比之下,信用卡的年化费率则只有12%-30%。
近年来,特别是在金融危机后,华尔街和美国监管层不断将目光投向“发薪日贷款”,认为这是高风险贷款,但屡禁不止。2014年6月5日,一批借款人向美国监管机构提起上诉,指出监管层将这些借款人列为“有声誉风险”的群体是不公平的。按照诉讼内容,美国超过80家主流银行都被监管层勒令中止和这些借款人的关系。
这些特殊借款人也引起了主流人群的同情。美国群众自发组织了团体,推进针对无账户人群的金融包容。
“ZestFinance的使命就是给这些无银行账户或信用记录不好的借款人创造透明公正的信用评分。”梅里尔表示,通过成千上万的数据变量,每个人都可以拥有一份公正的信用评价。
此外,ZestFinance还有另一个重要组成部分,即ZestCash贷款平台。
ZestCash类似一家小贷公司,它的主要业务是给那些没有银行账户或者信用记录不好的人提供小额贷款。ZestCash的借款中有90%是为了采购生活必需品,比如修车和医疗保险。
梅里尔表示,ZestFinance帮助信用记录不好的人贷款主要通过两种方式:一种是直接从ZestCash对其发放贷款;一种是让使用ZestFinance评分系统的金融机构,通过ZestFinance的评分结果对其发放贷款。“迄今为止,我们已经帮助超过10万名没有银行账户或信用记录不好的美国人获得了贷款。”
值得一提的是,ZestFinance并没有因为目标客户是“风险人群”而导致高坏账率。梅里尔表示,目前借助ZestFinance获得的贷款比银行的“发薪日贷款”违约率低50%。“也就是说,在ZestFinance算法的帮助下,‘发薪日贷款’可以节约一半的成本。” 竞争与风险
金融危机后,银行信贷更加谨慎,而硅谷的IT男们则不断尝到金融这块蛋糕的甜头,包括Prosper和Lending Club在内的P2P借贷平台应运而生,类似ZestCash的小额信贷公司也风生水起,包括Zebit、Avantcredit、Kreditech、DemystData在内的公司都看准了银行信贷这块短板。这类公司的共同特点是利用大数据做信用分析,并且大多拥有自己的网络信贷平台。
Zebit创建的Lending Stream网络借贷平台,可以在4分钟内获得50-1500美元的半年期个人信用贷款。
Avantcredit打出的标语是“从这里申请贷款不会影响你的FICO信用分数”。该公司也是自建信用体系,针对不同人的评分,给出的利率也是不同的。
Kreditech位于德国汉堡,两位自信的IT男利用大数据分析手段评估借款人还钱的概率,他们不要求客户提供信用证明,15分钟内就能提供500欧元以内的小额贷款。和ZestCash类似,Kreditech希望用户提供尽可能多的信息,连用户的借贷申请是使用iPad发送还是用老式电脑发送、输入时出错的概率、使用取消键的频率等都考虑在内。
上述公司都获得了风投的青睐,例如Kreditech2013年9月获得了900万美元A轮投资,Avantcredit2013年8月获得2000万美元B轮投资。
陈建认为,此类创新型公司和传统的FICO与银行信贷并不冲突,可以成为传统市场的补充。
当然,这类公司也并非可以为所欲为,也要受到美国监管的制约。其中,1975年通过的《平等信用机会法》(Equal Credit Opportunity Act)中规定,贷款必须发放给所有资信可靠的申请人,不论种族、宗教信仰、性别、婚姻状况、年龄和其他个人特征。然而,随着互联网大数据的井喷,这些信息都随着网络社交信息一起被纳入了ZestFinance等公司的变量测算中。此外,由于所有的征信数据都必须经本人允许采集,因此这种海量采集数据的方式还会面临侵犯消费者隐私的风险。
第五篇:大学生与征信
大学生与征信
征信,我相信现在大多数的人对这个词都还很陌生,那么它到底是个什么意思呢?征信是发生在金融行业的,特别是银行这种提供借贷的部门。银行把他们各自掌握的关于您的信用信息交给一个专门的机构汇总,由这个专门的机构给您建立一个“信用档案”(即个人信用报告),再提供给各家银行使用,像这种银行之间通过第三方机构来共享信用信息的活动就叫做征信。在我国,现在是由中国人民银行征信中心(简称征信中心)建立个人的“信用档案”,并为各商业银行提供个人信用信息。
那么,采用这种方式会带来什么好处呢?
对银行来说,这样做可以省掉很多不必要的程序。在以前,如果你向银行贷款,要向银行提供一系列的证明材料:单位证明、工资证明等;银行的信贷员也要打电话给你单位、上门拜访......两星期、甚至更长的时间后,银行才会告诉你是否给你借钱。真是银行累,贷款的人也烦,借钱可真够麻烦的。有了征信,有了征信机构的介入,有了信用报告,你再向银行借钱时,银行信贷员征得你的同意后,可以查查你的信用报告,再花点时间重点核实一些问题,便会很快告诉你银行是否提供给你借款。银行也省事了。
而对于借贷者个人来说,征信的第一个好处就是节省时间。银行需要了解的很多信息都在借贷者的信用报告里了,所以就不用再花那么多时间去调查、核实借贷者在借款申请表上填报信息的真实性了。如果借贷者的信用报告反映他是一个按时还款、认真履约的人,银行肯定喜欢,不但能提供贷款、信用卡等信贷服务,还可能在金额、利率上给予优惠。如果信用报告中记载借贷者曾经借钱不还,银行在考虑是否给他提供贷款时必然要慎重对待。银行极有可能让借贷者提供抵押、担保,或降低贷款额度,或提高贷款利率,或者拒绝贷款。如果信用报告中反映借贷者已经借了很多钱,银行也会很慎重,担心他负债过多难以承担,可能会拒绝再给他提供贷款。由此提醒珍惜自己的信用记录,自觉积累自己的信用财富。征信还有一大好处是,帮助借贷者获得更公平的信贷机会。征信中心提供给银行的是信用历史的客观记录,“让事实说话”,减少了信贷员的主观感受、个人情绪等因素对贷款、信用卡申请结果的影响,让借贷者得到更公平的信贷机会。
然而对于大学生来说,与征信直接相关的便是申请助学贷款了。这就需要大学生助学贷款个人信用征信了。该征信就是通过一定的机制把分散在不同授信机构、司法机构、行政机构等能反映大学生个人偿债意愿的信息(信用记录)集中到一个或若干个数据库中,让授信机构在授信决策时能方便、快捷地获得完整、真实的信息,从而大大地节约交易费用。它包括对个人信用信息的采集、利用、提供和管理。大学生助学贷款个人信用征信不仅仅是为征信活动及其涉及到的各方提供一套行为规范,而且涉及到授信机构信息处理模式的改变,从依靠自己收集信息到从信息库获取信息,它又有赖于(取决于)社会信息结构的改变,即从封闭信息、分割信息到信息透明、允许信息自由流通和利用。大学生个人信用档案和评级的信息来源主要涉及以下几个部门:学生所在学校的学籍管理部门;教育部的学历文凭学位证书认定网;学校公安处;学生的在校基本帐户银行;学生膳食消费卡部门;图书馆借阅部门;学生家庭所在地等部门;
助学贷款经办银行。因此,大学生在校期间一定要在这些方面有良好的信用记录,以便于能够顺利的申请到助学贷款。
有很多学生认为,自己大学毕业后,在校期间的个人信用档案就没有用了,其实不然,毕业后也是有学生个人信用档案的。这个时候的征信内容就有点变化了,包括毕业前中国人民银行助学贷款网中关于学生的个人信用档案以及信用评级报告;学生毕业分配的信息:各高校提供的借款学生的去向、工作单位的具体地址、学生的有效联系方式等有关信息,并将学生的贷款情况纳入其个人信用档案中,以供毕业后与该学生发生信贷储蓄关系的银行进行查询其信用记录。学生基本账户的个人信息,包括工作以后个人支票、工资账户、个人所得税账户、退休金以及养老金账户等其他分账户的信息。就业资料;个人的公共记录等。银行的追债记录:贷款银行追债的次数,联系不上的次数,联系上没有具体行动的次数、毕业学生与经办银行主动联系的次数等。当学生毕业后,银行要实施严格的贷后风险监测,一旦发现贷款学生不及时还款或与银行不按时联系或不与银行联系,银行应进入追债阶段。对损信的学生,将其违约行为记入助学贷款的个人信用档案,进一步纳入以后全国个人信用信息系统,使其以后个人交易行为都将受到影响,达到一次失信影响终生的社会监督效果。所以,就算是从学校毕业了,还是要在各个方面保持良好的信用,才能让自己在社会上更好地立足。
那么如何能让自己有良好的信用记录呢?如果有可能,尽早建立自己信用档案,简单的方法就是与银行发生借贷关系,例如可以向银行办理一张信用卡或一笔贷款。这里要澄清的是:不从银行借钱不等于信用就好。因为没有历史信用记录,银行就失去了一个判断您信用状况的便捷方法。如果拥有了良好的信用记录,就可能使银行相信您会按时还款,即使您无法提供物质抵押品,银行也会给您贷款。因此,良好的信用记录如同“信誉抵押品”,帮助您获得银行贷款。另外,良好的信用记录可使您获得优惠的金融服务,银行在贷款规模、期限和利率上会有一定的灵活性和优待。这些对自己今后的发展都是十分有利的。
信用既是无形的力量,也是无形的财富。圣人孔子也曾说过:“民无信不立。”因此,在大学期间,我们学生就得注意有关自己信用方面的事情,尽量没有不良记录,以树立自己良好的信用形象。