1.数据如何变成资产?如何界定数据产权?如何确保数据安全?如何有效监管大数据杀熟?……你关心的所有关于数据的问题,这本书给你一一解答
2.中科院院士、图灵奖得主姚期智 倾情作序
央行原副行长吴晓灵、北大国发院副院长黄益平、华夏银行原行长张健华 联袂推荐
3.科学分析直击要害的100个数据要素化关键问题,直观清晰,方便查阅
4.原创手绘漫画讲解抽象专业知识,深入浅出,通俗易懂
5.清晰表格 实发案例 生动漫画 多样流程图,立体解析从概念到应用,是权威专家写给大众读者的科普读本
6.领导干部、政策研究者、高校学者、从业人员、投资机构等的重要参考
序言一
发展自主可控的数据要素流通技术
姚期智
中国科学院院士,图灵奖得主
清华大学交叉信息研究院院长
清华大学金融科技研究院管委会主任
党的二十大报告指出加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。当前,数字经济是我国经济发展的新动能、新引擎。自党的十九届四中全会正式将数据列为生产要素以来,我国加快了培育数据要素市场的步伐。2022年12月,中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》,成为下阶段我国数据要素市场化建设的指引。
数字经济的基础技术将数据和算法进行融合,释放数据价值。人工智能算法的落地应用给各行各业带来了明显的价值提升,而数据是算法作用的对象。因此,国家把数据纳入生产要素。近些年,虽然人工智能算法技术已经有了长足发展,但在很多行业中,算法的价值发挥越来越受到基础数据可用性的限制,诸如数据孤岛、数据安全、隐私保护等问题阻碍了数据价值进一步释放。因此积极推动数据要素的安全利用,已经成为建设数字经济的关键举措。
本质上,数据要素应用的核心挑战是如何保证数据要素使用可控。从数据可控流通的技术来看,四十年前多方安全计算实现了理论上的突破。一直到近几年,随着数据流通和数据隐私保护并重的产业需求愈加旺盛,大家在计算机科学各个领域开展研究和实践,极大地提升了这些技术的性能,并且已经在金融等领域取得实践应用的初步成果。但是当前,数据要素相关技术、产业和政策的结合,仍然面临两个核心挑战。
第一是交叉学科的挑战。如数据要素在金融领域的应用,是典型的交叉学科范畴。但目前的金融科技发展仍面临一定问题,其根源是金融从业者、科技人员与监管方之间互相难以沟通和理解,缺乏开放心态和敬畏之心。其实,科技人员要敬畏金融规律,理解金融领域防范系统性风险底线的根本要求;金融业从业者也需要敬畏科技,理解不断涌现的科技的原理和本质。当然,各方之间需要互相理解的重要性还在于,监管与合规是金融行业非常鲜明的特色,如何设计开发拥抱监管而不是逃避监管的技术,才是行稳致远的根本。
第二是交叉学科人才和技术自主可控的挑战。清华大学交叉信息研究院一直致力于培养具有国际一流的科技创新人才。我们希望自主培养的创新人才队伍,能够在安全利用数据要素这一关乎国家安全的关键领域中,创造出独立自主、国际领先的技术。同时,我们与五道口金融学院合作,共同创办清华大学金融科技研究院,也希望能培养出具备交叉学科能力,并能够在金融等产业进行应用创新的人才。
我很高兴清华大学金融科技研究院发扬了清华大学产学研平台优势,依托不同领域领先的科研水平,组织专家编写出版了《数据要素化100问:可控可计量与流通交易》一书。社会各界对这一交叉领域的深刻理解,是打通技术、业务与政策的关键。本书简洁全面地介绍了数据要素相关的关键技术、政策要求、产业应用、国际比较等内容,具有通俗性、可读性,相信能让各级领导干部、政策研究者、技术人员、业务人员获益匪浅。
序言二
稳步有序推进我国数据要素化
廖理
清华大学五道口金融学院金融学讲席教授、博士生导师 清华大学金融科技研究院院长
自党的十九届四中全会正式将数据列为生产要素以来,我国数据要素化进程按下了快进键。2020年4月9日,中共中央、国务院出台《关于构建更加完善的要素市场化配置体制机制的意见》,明确提出加快培育数据要素市场,随后《要素市场化配置综合改革试点总体方案》《关于加快建设全国统一大市场的意见》等一系列鼓励政策密集出台,京沪深等地开启新一轮新型数据交易所建设热潮,数据加工、数据合规、数据资产评估等专业服务机构加速出现。2022年12月,中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》,为促进数据高效流通使用、赋能实体经济提供制度支撑。在把握数字经济发展新机遇背后,我们也要认识到中国数据要素化进程也伴随着很多挑战,需要自上而下打通关键节点,理顺错综复杂的症结所在。
近些年来,社会各界对数据价值的认识、数据化决策和管理能力已经有了很大的提升,有力推动了我国经济转型发展和治理能力的现代化水平。但大家对于数据作为新生产要素的科学理解、数据要素化的难点堵点及深层次动因、数据要素化的创新探索等关键问题的认识恐怕还有很多困惑。这是因为,关于数据要素化,无论观念上的认知理解,还是实践中的市场化配置改革,在我国甚至全世界都是一个新生事物,因此更需要我们与时俱进,解放思想,走出新路,加速壮大发展新动能,这也是数字经济时代提升数据思维的应有之义。
一般提到数据要素,大家都会感到既熟悉又陌生。熟悉在于,数据要素其实来源于数据。《中华人民共和国数据安全法》第一次给出了数据的法律定义,指出数据是任何以电子或者其他方式对信息的记录。从这个角度说,从上古时代的结绳记事,到文字发明后的文以载道,再到现代科学的数据建模,其中用到的信息记录都叫数据,数据一直伴随着人类社会的发展变迁。陌生在于,虽然数据要素和数据紧密相连,但又存在着本质区别,不是所有的数据天然就是数据要素。数字经济时代,数据的使用对象已经从人变成了计算机,数据成为数据要素,需要具备两大前提条件:一是把原始数据加工成机器可读的,具备投入生产使用条件的生产数据。二是让数据可以通过流通进入到社会化大生产中,而不是手工作坊似的自有资源。因此,具备机读 流通的数据才能真正成为数据要素。
从数据到数据要素,字面上虽仅有两字之差,但背后却是对数据在下阶段人类经济发展历程中所起到的决定性作用的全新定位和前瞻研判。我国是名副其实的数据资源大国。国际数据公司(IDC)和数据存储公司希捷(Seagate)开展的一项研究发现,我国每年以超过全球平均数3%的速度产生和存储数据,2018年约产生7.6ZB(1ZB1万亿GB)数据,至2025年全球新增的数据将有近30%来自中国。数据也已经成为我国数字经济持续壮大的关键基础。2020年我国数字经济规模位居世界第二,逼近5.4万亿美元,同比增长9.6%,增速位居全球第一。基于数据资源和市场规模等优势,我国不断创新发展出移动支付、电子商务、在线教育、远程医疗等一批新业态新模式,为经济社会发展注入了强大活力。
从数据到数据要素的过程,就是数据要素化。它能够推动我国数据资源通过市场化配置实现在全社会范围内的广泛流通,推动数据资源全面进入社会化大生产,这涉及我国数据要素市场基础制度、基础设施、标准规范、技术创新、产业应用等方方面面,各行业各领域都是这个过程的参与者、推动者和受益者。数据要素化的本质是流通。数据只有通过流通,才能为优化自然资源和社会资源使用和分配提供支撑。而数据流通的关键在于可控。调查显示,2021年全球数据泄露事件平均成本(损失)出现了近年以来的最大增幅,从2020年的每起386万美元增加到2021年的424美元,增长9.8%。这还不包括以合法手段获取却将数据用于非法用途等的滥用行为。因此,在《要素市场化配置综合改革试点总体方案》中,明确要求探索建立数据要素流通规则,建立数据用途和用量控制制度,实现数据使用可控可计量。
可见,数据流通是数据要素化的前提,而使用可控又是数据流通的前提。可喜的是,使用可控目前已可通过技术手段实现,这也为我国数据要素化带来了历史性优势。40年前,我国姚期智院士首创了多方安全计算理论,为转化这一重要原创性科研成果,清华大学发起成立了华控清交信息科技(北京)有限公司进行工程化落地,经过近些年持续的技术攻坚,其性能耗费已从明文的10万~100万倍降低到了目前的10~100倍(个别运算可在10倍以内),实用性大大增强,为从根本上解决明文数据流通中的信息泄露和使用不可控问题提供了创新方案。这也是清华大学金融科技研究院重点孵化的科技应用。可以说,以多方安全计算等隐私保护计算技术为代表的技术领先应用,在某种程度上实现了我国数据要素化的国际创新引领。
当然,目前来看,我国数据要素化还面临很多困难。数据责任和数据权属界定尚不明晰、数据相关定价和流通机制还不完善、数据安全流通技术应用能力不足等,导致数据要素化过程中普遍存在不敢流通、不愿流通、不会流通的尴尬局面。比如,明文数据流通,无法有效管控数据使用目的和方式,无法厘清数据相关方之间的责、权、利;再比如,数据所有权及其相关的使用权、受益权和处置权的定义与含义在法律上也还没有得到明确,数据权属难有定论;等等。随着国家间数字经济竞争日益激烈,国内新旧动能加速转换,需要各界不断加大讨论力度,加快凝聚共识,为顺畅解决这些问题提供支持。
本书聚焦数据要素化与数据流通的关键认知与实现路径,旨在系统性厘清数据要素化的掣肘难题,并尝试从政策、法律、国内外产业实践等角度展现业界创新解决思路,还邀请了华控清交参与本书编写,全面介绍多方安全计算等隐私保护计算技术、工程化和产业化的最新进展。在形式上,以问答方式提炼出直击要害的100个数据要素化关键问题,希望能够帮助关注数据要素的领导干部、政策研究者、高校学者、技术业务专家等加深对数据要素化的最新理解,为制定数据政策、开展业务实践提供高质量的研究参考。也希望本书能让更多普通读者读懂数据要素,用好数据要素,发挥数据要素价值,为中国数据要素市场建设贡献力量!当然,由于中国数据要素化实践处于起步阶段,本书中也有一些问题还没有明确答案,期待和政产学研各界加强沟通交流,不断碰撞出中国数据要素化的特色之路!