这是一本建设数字中国的实战性著作,讲解了如何从合规数据源获取公共数据、个人数据和企业数据,并将这些数据合规地应用到各种金融风控场景。本书围绕公共数据、企业数据、个人数据的分类分级授权应用场景要点,通过分享公安、运营商、银联、工商、央行征信、百行征信、司法、航旅、铁路、税务、交通、电力、保险等十几种主流数据资源的开放背景、数据能力及现有的数据产品应用逻辑,帮助大数据行业从业者更好地了解数据资源持有权、数据加工使用权、数据产品经营权三类数据产权运行机制。书中凝聚了大量数据流通交易及应用方面的有价值的经验、方法论、规范、解决方案和案例,不仅能让读者即学即用,还能让读者了解大数据行业及数据经济产业的发展趋势。通过本书,你将掌握以下内容:?合规数据源的特点?金融机构数据采购评估的要点?各类公共数据、企业数据及个人数据资源的开放背景、产品形态及应用场景?反欺诈及风险防控等十几种主流数据源的深度剖析?消费金融反欺诈路径的设计?车险风险防控的策略?小微企业金融风险防控的逻辑?物流金融风险防控的机制?车联网及工业互联网数据应用情况?数据交易所对金融机构数据采购及应用的影响及合作思路
(1)服务数字中国:数据合规是数据要素流通的关键,数据要素是数字中国的基础制度,本书围绕数据合规及其应用为数字中国建设提供实践指导。(2)作者背景资深:作者在数据要素和金融数据风控领域有10余年经验,是资深的数据要素流通应用专家和金融风控专家。(3)内容极度稀缺:迄今鲜有系统讲解如何从合规的数据源获取公共数据、个人数据和企业数据的资料。(4)全面指导实践:本书能为数据使用方提高数据素养、数据所有方提升数据服务能力提供全面的实践指导。(5)16位专家力荐:16位来自金融和数据领域的专家和企业领导高度评价并推荐。
为什么要写这本书
作为一位资深的金融数据要素应用专家,我深知大部分金融机构从业者至今依然不懂如何在市场上找到有效、合规的数据源,这无疑极大地阻碍了金融行业全业务流程的反欺诈及风险防控体系的建设。
即使到了2022年,《中华人民共和国数据安全法》等已落地多时,各地数据交易场所积极成立并开始对外提供服务,数据供需双方信息不对称导致的数据信息孤岛现象也依然普遍。
数据信息孤岛现象存在的主要原因有:一是金融机构反欺诈及风险防控相关部门(如技术、产品、策略及数据采购部门)人员的金融数据素质,与现今数据要素开放流通的速度不匹配。二是合规数据源方,如政府机构、国企等,因无专门的数据服务综合团队,不能充分满足实体经济发展的数据需求,导致各机构、企业均采取保守的数据开放策略。仅部分机构、企业在国家政策的引导下,陆续为金融等多行业提供数据产品服务,并不断挖掘数据要素潜能,研发更有竞争力的数据产品。
多年来,我通过“大数据猎人”订阅号陆续发布了数十篇与权威数据源、反欺诈及风险防控相关的原创分析文章,得到了保险、消费金融、互联网金融、金融科技等行业机构和人员的关注与认可。
但我之前分享的系列文章,内容体系还不够完善,更多与金融业务需求及数据应用逻辑相关的核心内容并未对外公开。另外,我发现市场上只有与技术模型相关的智能风控类书籍,缺少以合规数据源视角切入的智能风控类书籍。因此,我结合近几年的实际数据业务实践经验,编写了本书。我期望本书可以给金融机构供需双方人员提供一点参考和启示。
本书内容
本书分为四篇:
第一篇从政策及行业发展背景角度分享数据合规对于金融机构的意义,以及合规数据源的选择要点和合规数据采购的要点。
第二篇主要介绍14类权威数据来源情况,包括机构情况、开放背景及现有产品形态。
第三篇从业务数据应用实践角度出发,介绍消费金融、车险、物流金融及小微企业金融四大主流金融场景,目的是让读者了解各类合规数据源在不同场景下的反欺诈及风险防控应用逻辑。
第四篇从新数据和新逻辑两个方面展开讲解。新数据方面主要分享车联网及工业互联网两类新型数据源的情况;新逻辑方面主要围绕合规数据流通交易,对市场背景、政策背景、技术要求及交易场所进行介绍。
读者对象
本书适用于以下读者:
金融行业从业者及与金融行业相关的其他人员
各级数据管理部门中从事数据产品研发的人员
关注数据交易应用业务的律师事务所、产学研机构人员
勘误和支持
由于我的水平有限,书中难免会出现一些错误或者不准确的地方,恳请各领域专家和广大读者批评指正。大家可以通过订阅号“大数据猎人”或邮箱305673669@qq.com将发现的问题反馈给我,期待得到你们的真挚反馈。
致谢
感谢我的领导及同事,感谢汤寒林、张培、谭坤、叶玉婷、朱晨君、卢烨、江翔宇、苏子芳等数据交易行业中的大咖,是你们在日常交流中给予我指导和支持。感谢公众号“数据交易网”负责人张瑶对本书的大力支持,感谢各数据源相关方的无私奉献及支持。
谨以此书献给我最亲爱的家人,以及关注金融行业发展的朋友们!
本书赞誉
前言
第一篇 金融风控数据源
合规的重要性
第1章 数据源合规的推动力及效能 3
1.1 数据源合规的五大推动力 3
1.2 金融风控的最大红利—权威
数据领先效能 8
第2章 合规数据源的选择与
采购要点 9
2.1 选择合规数据源的三大要点 9
2.1.1 主体合规 10
2.1.2 类型匹配 11
2.1.3 场景丰富 12
2.2 数据采购价值评估四大要点 13
2.2.1 匹配度 14
2.2.2 性能 16
2.2.3 效果 18
2.2.4 计费模式 28
第二篇 权威合规数据来源解密
第3章 四大身份验证数据源 31
3.1 身份证验证数据源 31
3.1.1 全国公民身份证号码查询
服务中心 33
3.1.2 中盾安信 35
3.1.3 公民网络身份识别系统 43
3.1.4 银行专属身份验证平台 46
3.1.5 主流身份验证产品 49
3.1.6 实名制与公安体系数据
开放 55
3.1.7 公安体系风险名单 57
3.2 银行卡验证数据源 57
3.2.1 银联 58
3.2.2 实卡制与银联数据开放 60
3.2.3 银联数据标签能力 61
3.3 手机号验证数据源 63
3.3.1 运营商数据平台 64
3.3.2 实名制与运营商数据开放 66
3.3.3 运营商数据服务 66
3.4 企业验证数据源 71
3.4.1 全国组织机构统一社会
信用代码数据服务中心 72
3.4.2 国家企业信用信息公示
系统 74
第4章 反欺诈及风险防控相关
数据源 77
4.1 央行征信 77
4.1.1 成立背景 77
4.1.2 二代征信的特点 80
4.1.3 个人征信服务 81
4.1.4 企业征信服务 89
4.1.5 服务情况 92
4.2 持牌征信机构数据(以百行
征信为例) 92
4.2.1 数据维度 93
4.2.2 个人征信产品服务 95
4.2.3 小微企业征信产品服务 97
4.2.4 服务情况 99
4.3 司法大数据:中国法研 99
4.3.1 开放背景 100
4.3.2 数据维度 100
4.3.3 产品服务 101
4.4 航旅大数据:中航信 103
4.4.1 成立背景 104
4.4.2 数据维度 105
4.4.3 产品服务 106
4.5 铁路大数据:12306网站 107
4.5.1 开放背景 107
4.5.2 数据维度 108
4.5.3 产品服务 110
4.6 税务大数据:航天信息 114
4.6.1 成立背景 114
4.6.2 数据维度 116
4.6.3 产品服务 117
4.7 交通大数据 119
4.7.1 数据宝 119
4.7.2 中交兴路 125
4.8 电力大数据 128
4.8.1 国家电网 128
4.8.2 南方电网 129
4.8.3 数据维度 130
4.8.4 产品服务 130
4.9 保险大数据:中国银保信 135
4.9.1 成立背景 135
4.9.2 数据维度 136
4.9.3 车辆贷款反欺诈产品
服务 141
4.10 人社大数据:金保信 144
4.10.1 成立背景 144
4.10.2 数据维度 144
4.10.3 产品服务 145
4.11 其他渠道可用数据 147
第三篇 金融风控数据应用逻辑
第5章 消费金融风险防控 151
5.1 消费金融欺诈 151
5.2 金融欺诈图谱 152
5.2.1 欺诈主体类型 152
5.2.2 欺诈持续及普遍存在的
主要原因 154
5.2.3 黑产团伙欺诈的主要防控点 155
5.3 反欺诈路径 162
5.3.1 设备反欺诈 162
5.3.2 身份信息验证 164
5.3.3 信息核验 164
5.3.4 历史行为核验 169
5.3.5 反欺诈评分 170
5.3.6 团伙排查 171
5.3.7 人工核查 172
第6章 车险风险防控 173
6.1 4.5吨以下非营业货车车险
防控 174
6.2 货车车险防控 175
6.2.1 轨迹欺诈行为分析 175
6.2.2 挂靠行为分析 176
6.3 理赔反欺诈策略 177
6.3.1 七个基本防范策略 177
6.3.2 六类主要欺诈行为 178
第7章 物流金融风险防控 181
7.1 行业需求及发展难点 181
7.1.1 资金需求及难点 181
7.1.2 小微物流货车司机画像 182
7.2 风险防控逻辑 186
7.2.1 常用数据类型 186
7.2.2 通用数据应用逻辑 187
第8章 小微企业金融风险防控 192
8.1 小微企业定义 192
8.2 准入风险防控 193
8.2.1 禁入强规则 194
8.2.2 准入评分卡六大规则 195
8.3 反欺诈逻辑 197
8.3.1 身份识别 197
8.3.2 黑名单识别 198
8.3.3 空壳企业防控 201
8.4 授信逻辑 204
8.4.1 基本情况 204
8.4.2 行业情况 204
8.4.3 财务情况 205
8.4.4 负债情况 206
第四篇 金融数据要素发展展望
第9章 新数据 211
9.1 车联网数据 211
9.1.1 基础属性类数据 212
9.1.2 车辆工况类数据 213
9.1