棱镜|数据业大整顿:爬虫与现金贷共生共荣,用户信息几元不等

划重点:

一位接近监管的人士对《棱镜》表示,监管方从年初就在酝酿针对数据公司的整顿清理,“(这次)应该是大动作”。
“打蛇打七寸!”大数据对于现金贷、“714”高炮、套路贷而言是命门,没有了数据做支撑,他们就无法放贷。
有助贷平台高管告诉《棱镜》,每个数据源的价格在几毛钱到几块钱不等,最终算下来一个借款用户的数据成本普遍在2元—10元之间,少数能达到20元左右。
中国银联的一名风险专家对《棱镜》提到,爬虫的本质是一种获取数据的方式,无好坏之分。但法律明确规定获取数据需要客户授权,所以数据公司很容易触碰法律红线,触及侵犯公民个人信息罪的问题。
《棱镜》作者 周纯

擅长清洗数据的第三方数据行业,这次轮到自己被“清洗”了。

从9月上旬开始,先是杭州的两家数据公司——新颜科技和魔蝎科技相关负责人被带走调查,随后公信宝、天翼征信等也被纳入调查行列,直至行业头部平台同盾科技被传出解散整个爬虫部门。

虽然同盾科技在第一时间辟谣称,为响应国家关于个人信息保护的相关政策,旗下信川科技的产品数聚魔盒2018年就开始逐步调整业务,目前已全部停止相关服务,但这也正印证了数据行业当前面临的窘境。

多米诺骨牌仍在继续推倒。9月19日,市场消息称,头部贷款超市平台信用管家被警方突击调查。一名从业者感慨:“整顿还在继续,谁也不知道下一家又会是谁?”

一位接近监管的人士对《棱镜》表示,监管方从年初就在酝酿针对数据公司的整顿清理,“(这次)应该是大动作”。

“打蛇打七寸”

在一家助贷平台做中层的孙丹(化名)最近准备跳槽了。她所在的公司同样涉及到大数据业务,虽然目前一切如旧,暂时没受影响,但这段时间不断传来的“XX平台遭调查”的消息,让她焦虑不已,最终还是下定决心辞职,远离这一曾经标榜科技与前沿的领域。

“行业人人自危。”她对《棱镜》表示。

虽然警方尚未对上述调查进行公开通报,但行业里的人都心知肚明:这大概率与第三方数据公司为“714”高炮平台、“套路贷”提供数据征信服务,非法获取和倒卖个人数据有关。

“714”高炮是指期限在7天或14天的包含砍头息的超利贷,在今年315晚会被曝光之后,被监管部门重拳整治。而为“714”高炮、“套路贷”提供土壤的数据公司,也不可避免地受到了波及。

据《棱镜》了解,目前很多涉及爬虫业务的数据公司都已经暂停或调整服务,进而引发更大的蝴蝶效应。

一位消费金融平台的市场部人士告诉《棱镜》,那些依赖数据公司提供服务的现金贷平台,一下失去了风控能力,这几天陆陆续续在各个渠道下架自己的贷款产品。“(他们的)风控模型还在重新调试,估计短时间不会正常放款。”

而作为一家第三方数据公司的副总裁,李亮(化名)则更能感受到实实在在的影响。在他看来,这次数据行业的震荡,比此前对于现金贷行业的整顿来得更严重,效果也更明显。

“打蛇打七寸!”李亮提到,大数据对于现金贷、“714”高炮、套路贷而言是命门,没有了数据做支撑,他们就无法放贷。

此外,对于一些相对合规的借贷平台而言,虽然数据公司暂停服务暂未对他们产生灾难性的影响,但他们仍然需要立即对数据源和策略做一些调整,来应对市场环境的变化。

而接下来监管会不会扩大清查范围,则是一把悬在他们头上的达摩克利斯之剑。

兴于现金贷

在多位行业人士的印象中,第三方数据行业从2013、2014年就开始兴起,在2017-2018年左右迎来大爆发。这也与P2P网贷和现金贷兴起至爆发的时间线基本吻合。

一家头部助贷平台的高管对《棱镜》表示,前端风控弱、主要依靠贷后催收是原本现金贷平台的一大特点,而数据公司擅长利用大数据搭建风控模型。现金贷行业惊人的吸金能力,让大家意识到“卖水”的数据行业也挺赚钱,加上行业模式已经相对成熟,“于是做这个事情的人也越来越多”。

根据亿欧智库2018年11月发布的《2018中国智能风控研究报告》(下称“《报告》”)显示,截至当时,金融风控企业已经达到573家,其中超过6成企业成立于2014-2016年。

巨大的市场机会也吸引了风投的目光。上述《报告》统计,573家金融风控企业中,有192家企业获得投资,投资金额超过1000亿元,其中3成企业获得三次及以上的投资。

在风投的加持下,行业一路高歌猛进。以行业头部平台同盾科技为例,据新流财经此前报道,同盾科技2016年-2018年的营业收入分别为6066万元、2.61亿元、5.42亿元,呈几何级数增长。截至2018年底,同盾科技累计客户数量为2421家,完成了对互金行业90%以上的覆盖。

据《棱镜》了解,第三方数据公司主要依赖大数据工具,如爬虫等技术,为市场提供场景化、定制化的大数据相关产品。这些数据主要分为司法信息、电商信息、银行卡信息、运营商信息、社交信息、开放数据等几大类。在这些数据维度中,比较受互金客户欢迎的都是覆盖度高、标准化较强的通用类数据,比如身份验证、逾期黑名单信息等,一般是通过爬取淘宝、社交网络、网上银行等获取数据。

在数据行业,每条信息都会有自己的标价。

《棱镜》获得的一份头部数据公司的报价单显示,仅信息核验服务就被细分为43个项目,包括实名验证、银行卡“三要素”核验、对用户消费偏好、经济能力方面的预测等等,不一而足,单次查询的价格从每项2毛钱到10块钱不等,如果包年的话另有折扣。

 

(某头部数据公司的部分报价单)

此外,该公司还为客户提供“逾期管家”、“催管大师”等贷后风控产品,包括未逾期客户还款提醒、逾期客户还款催缴等服务。另外,公司还帮客户智能关联催收公司,从中收取回款佣金的10%作为平台使用费。

前述助贷平台高管告诉《棱镜》,每个数据源的价格在几毛钱到几块钱不等,只要不是太贵,一般都会多接几个。最终算下来一个借款用户的数据成本普遍在2元—10元之间,少数能达到20元左右。

《棱镜》从接近监管部门的人士处了解到,用户地理位置、资产收入、运营商爬虫、信息修复、证照比对等数据信息,将是这次核查的重点。

灰色地带中的 “爬虫”

按照一定的规则,自动抓取互联网信息的程序或者脚本,这一技术被称之为“爬虫”。在此番行业整治风暴中,利用爬虫技术非法获取和倒卖用户个人信息,对用户进行“套路贷”,成为公安部严厉打击的对象。

在9月3日召开的全国公安机关打击“套路贷”犯罪工作推进会上,公安部公布了十起典型的“套路贷”案例。例如,犯罪嫌疑人王某焘设立“甜兔网”等24个“动物系”网贷平台,实施非法侵犯公民个人信息、“套路贷”犯罪活动,非法获取482万人的通话记录、电话号码本、银行卡号等公民个人信息,获利10.79亿元。

据《棱镜》了解,爬虫技术门槛并不高,但需要专门的团队进行维护,成本较高,对于大多数的借贷平台而言,选择以购买的方式,从第三方数据公司获得爬虫数据,反而不失为一种更为经济的方法。

中国银联的一名风险专家对《棱镜》提到,爬虫的本质是一种获取数据的方式,作为技术并无好坏之分。但法律明确规定获取数据需要客户授权,所以数据公司很容易触碰法律红线,触及侵犯公民个人信息罪的问题。

在他看来,数据行业总想自己去拿数据,这个逻辑本身就有问题,“大数据公司应该提供技术服务,而不是充当数据中介”。

2017年6月1日开始实行的《网络安全法》明确提到:网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意;网络运营者不得收集与其提供的服务无关的个人信息;未经被收集者同意,不得向他人提供个人信息。

这也意味着,只要数据来源未经用户授权,都存在法律风险。

监管环境倒逼之下,不少数据公司已经着手转型。一家排名靠前的数据公司产品负责人对《棱镜》提到,一是客户方向转型,近一两年P2P爆雷潮与互金监管越发趋严,导致互金客户数量减少,将目光投向银行等传统金融机构是大势所趋。

此前,有报道指出,第三方金融科技、数据服务、风控服务机构将服务重心从新金融领域逐渐转向银行机构成了最近一年来的明显趋势,比较大动作的数头部平台同盾科技。

其次是业务方向转型,单纯的数据服务已不能满足市场需求,将大数据有效的结合人工智能技术,通过风控规则建模等方式,对金融机构输出评分决策等结果,向科技赋能转型。

转型之路,道阻且长。而眼下,在公安部“彻底铲除‘套路贷’违法犯罪活动滋生土壤”的严厉表态下,可以预见的是,第三方数据行业的整顿仍将持续。 

相关产品

评论