在通过购买、合作、置换等方式不断获取外部数据的过程中,未来在用户芝麻分的权重比例中,来自阿里系的数据可能只会占比30%左右。
此外,民间征信机构在采集和使用用户数据的过程中不可避免地会涉及信息安全和隐私保障等问题,上个月被央行准许筹建的8家民营征信机构是否做好了安全的准备?
自下而上
目前,芝麻分评测体系中包括了用户信用历史、行为偏好、履约能力、身份特质、人脉关系五个维度,每个维度下面又细分出数个至数十个因素,共同构成一个庞大的数据根系,但只有这些还不够。
以美国征信机构Zestfinance为例,其主动收集的来自互联网上的用户数据维度成千上万。理论上说,维度越大,对用户风险预测的误差越小。
“目前我们在和政府机构谈,像人口基本特征等这类数据对判断一个人的信用价值很大。”蚂蚁金服信用业务拓展负责人邓一鸣对《第一财经日报》记者说,政府方面的数据主要以购买方式获取,包括公安、学历学籍部门、工商、法院、电力、煤气公司等公共事业机构。
有意思的是,电力部门对开放数据的意愿较强烈,当水电煤缴费记录成为芝麻分的测评变量后,这将对用户费用的催收催缴工作有促进作用。
除了政府部门和公共服务机构外,一些本身具有大数据积累的商业公司也是芝麻信用的合作对象,比如运营商、P2P公司等,这部分可能会通过合作、置换、服务输出等方式获得。
邓一鸣说,对外部数据的获取秉承自下(商业公司)而上(政府机构)的过程,未来芝麻信用的目标是,在芝麻分的测评权重中,来自淘宝、支付宝等阿里系的数据占比降低到30%~40%。
在对外部数据的获取中,最难啃的一块骨头是银行等金融机构。尽管目前已有一些银行进驻到支付宝钱包的服务窗,但这离数据开放还有很大距离。事实 上,相比于政府和公共事业部门,银行也不是此前芝麻信用重要的沟通对象,一个原因是之前芝麻信用尚未获得征信牌照,无法与金融机构合作。
现在,央行已准许了包括芝麻信用在内的8家机构试水市场化征信业务,与银行的沟通正在加快,“相信银行也不排斥得到更多的用户数据信息来判断风险。”
接受开放式监管
一位业内人士对记者分析称,民间个人征信面临两个方面的潜在风险,一是征信机构在收集和使用用户的数据时对数据和隐私的保护;另一方面是信用积分算法体系是否健全,避免“聪明的用户”猜到评分算法,进而出现刷分、刷信用的积分滥用情况。
一个有意思的现象是,在芝麻分刚上线的前几天,不少用户对于比分数乐此不疲,某公司在收入、朋友关系、住所等方面均比较接近的两位同事中,A在 淘宝上经常购物,B的网物频率稍低,但B的芝麻分明显高于A,两个人分析后发现,B经常用支付宝给信用卡还款,而A在这方面的记录是空白。
这是不是表明,用户可以通过这种方式猜到影响自己芝麻分的因素,进而投其所好地去“套取”分数?
对于在采集和使用用户数据所涉及的隐私安全方面,芝麻信用的做法是需事前征得用户授权,比如在进入支付宝钱包的信用生活栏,选择某项服务时,会提示被采集并使用到哪些用户数据,用户同意该协议后,后台才会进行测算。
为了保证数据安全,芝麻信用内部绝大多数人接触不到核心数据,也不知道芝麻分具体是如何算出的,尽管其内部的技术员工比例高达80%。而在一些硬件保障上,工作人员无法将数据下载到自己的电脑里。
“芝麻信用一直是持很谨慎的态度,且随时准备接受开放式的监管。”面对未来像腾讯、拉卡拉等竞争对手的问题,邓一鸣说,这次央行准许8家征信机 构试水,表明了个人征信市场化的明确态度,芝麻征信目前不考虑赚钱问题,而是先把征信产品做好,一起和其他征信机构将个人信用的市场培养起来,“蛋糕做大 后怎么分,交给市场。”
欢迎光临 自动化论坛 (https://bbs.ca168.com/) | Powered by Discuz! X2.5 |