拒绝数据“裸奔”,走进隐私计算“国家队”

WechatIMG72_meitu_1

【猎云网北京】9月29日报道

人脸识别支付、金融风险控制……在许多重要的行业应用领域,隐私计算技术正在频频现身。而在未来,可能所有产生数据的企业,都会进入一条“数据河道”,将有数以兆计的数据合法、合规地流通起来,供企业自由使用和交易,实现数据价值的最大化。

梦想有多远,科技去实现!本期对话国内隐私计算领域的“国家队”——华控清交CEO张旭东、副总裁宋巍,听他们揭秘如何让隐私数据“可用不可见、可控可计量”。

数据被卖、银行卡盗刷、骚扰电话疯狂轰炸…“大数据时代无隐私”困扰着每个人。然而数据既是隐私也是资源,如何保证不让隐私数据泄露,又能让数据流动产生价值?华控清交利用“隐私计算”技术为数据“穿上衣服”,实现数据“可用不可见、可控可计量”。「梦想有多远」第六期,拒绝数据“裸奔”,一起走进清华“姚班”学霸云集的隐私计算“国家队。

第六期节目主角企业——华控清交华控清交在隐私计算领域是独一无二的存在:创始人是清华“姚班”的创建者姚期智、由清华大学联合发起成立、多个姚班毕业生担任技术骨干、公司运营着全球唯一一所新型数据交易所,如今更是打通了“产学研用”关键一环,在金融行业正式上线企业级多方安全计算平台,向大规模应用迈上关键台阶……

以下为「梦想有多远」第六期视频完整版:

   

高智商人才云集——都是“求”来的

陈蜀杰:张总曾经是高盛的全球合伙人,如今作为华控清交CEO,为公司招了许多高智商人才,是因为公司做的事情很“烧脑”?

张旭东:对,我的头发已经“烧”完了。公司确实有很多大脑发达的人,密码学、数学、IT精英等人才在我们这儿不稀奇。但从某种意义上讲,怎么把这些人才聚在一起,做一件能够对党、国家和老百姓交代清楚的事情,特别重要。所以我的工作就是把事情、人、资本组织起来,这也是我的本分。

至于人才,华控清交的人才都是我一个一个“求”来的,不是招来的。都“求”过来以后,再进行募资,最后大家一起定方向。

陈蜀杰:为公司“定方向”其实是“思路决定出路”的问题,需要慎之又慎,你们当时是怎么定方向的?

张旭东:“Consensus”是我从高盛学来的一个特别好的方法,不靠投票举手、少数服从多数或者谁对谁错,而是不断地讨论,让每一个人都把话讲完。

其实大家存在共识,也都知道各自该干什么,那么正式决定或决议就是多余的,反而会让各自发表意见的人觉得自己被证明错了,或者不够完整,所以我们刻意不去做决定。这是我在高盛学到最宝贵的经验。

隐私计算,给数据隐私穿上“衣服”

陈蜀杰:一些人说,AI的发展让用户数据开始“裸奔”,而华控清交的隐私计算技术是给数据隐私穿上了“衣服”。这是极具创新价值的概念,而关键是不是在于,华控清交如何把它从一种技术理论变成商业化产品?

张旭东:你讲得非常对。我补充一点:给“数据隐私”穿上“衣服”有一个特别重要的意义,就是它能够上台面,正式成为一种流通形态。

你前面还提到“数据智能”,我觉得特别好。我们公司内部对“数据智能”和“人工智能”有严格区分。因为我们是做数据融合的,数据放在一起、叠加维度后,它所蕴藏的能量才会大幅度提升,这不是简单的“1+1=2”的问题,涉及到内部函数和维度的复杂度。所以把数据融合在一起,就是为数据增加能量,而AI是提炼这种能量的工具。所以,我们认为未来的世界是一个数据智能时代,不是人工智能时代,因为它是个工具。

那么如何既让数据流通,又保存数据价值?这就是我们正在做的事情:让数据的使用价值流通,而数据本身不流通。暂时先把数据的确权问题放一放,这很复杂。

怎么充分保障数据的使用价值,同时最大化地使用?通过密码学和IT工具把“数据可见的信息部分”和“用不着看见就可以进行计算的使用价值”区分开来,做到“可用不可见”;在基础技术上规定数据的具体用途用量,精确到算法中最基础的加法、乘法和比较层面,实现数据使用权和所有权的分离。

陈蜀杰:宋总一直致力于建立基于隐私计算技术的数据流通生态平台,在搭建过程中,华控清交会遇到哪些挑战?

宋巍:我觉得第一是人们的观念还不够领先。老的数据观认为数据等于信息,很多人也认为二者一样,但事实上不是。老的明文数据观在新数据观的下面,新数据观是向前兼容的,明文数据的流通只是数据流通的一种特殊形式,它完全可以做到“可用不可见、可控可计量”地流通。

第二是要打破制度和法律的障碍;第三是技术挑战。我们作为一个技术公司来讲,要保障技术是一直演进的,所以我们既要做理论上的创新,也要做工程化的创新,持续支撑大规模的数据流通。

第四个挑战是监管。任何一个要素的大规模流通,必须有一种合理合法的框架去审视、观察它。因为我们说一辆车跑得快,油门好不是最重要的,刹车好才重要。刹车足够好的时候,你还可以拼命踩油门,让发动机发挥最大的效益。如果没有一个好的监管和友好型的框架存在,大家就得一起“裸奔”,反而会破坏人类数据的生态文明。

张旭东:数据滥用对社会的负面影响很大,但是追根溯源很复杂,所以它容易造成像化工企业往河里排放污水一样的事情,这就需要监管,需要为快速发展的新型数据生态先考虑“刹车”问题,别等到撞车了以后,再去大型翻车现场检查事故原因。

北京国际大数据交易所落成,数据流通趋势不可阻挡

陈蜀杰:北京国际大数据交易所的落成,对这些挑战有什么重要意义?

张旭东:数据流通是人类向数据智能进发的滚滚车轮,不可阻挡。到目前为止,不管你让不让数据流通,它总会流动的。就像河流,一年总要泛滥一次,怎么办呢?要疏通“河道”、建立“渠道”,让数据顺着正确或者我们希望的有序渠道,每年长流,这是很重要的。现在数据流通以各种形式发生,有些会产生负面影响,有没有监管?目前来讲很零散,从白到黑,还有五十度灰。

那怎样建立良好的、合规的数据流通渠道?政府要建立基础设施。其实政府现在就在大力支持,我觉得新型数据交易所加了“新型”两个字,就是说数据建立在“数据可用不可见、用途可控可计量”的基础上。流通的是数据的特定使用权,它保障了流通的数据不被滥用,这是最关键的“新型”。

新型数据交易所其实就是在监管情况下,为数据合法合规的流通开了一条“大渠”。

陈蜀杰:据说中国是全球第一个建立这种新型数据交易所的国家,这背后的意义是什么?

张旭东:北京做这件事,对整个国家的意义非常大。第一,它彰显了国家的决心,国家数字化建设要往那个方向走;第二,展现了国家对数据生态新的认识,比如刚才讲的新数据库和数据流通的基础设施。

新数据观下的数据流通方式被我们国家认可,而且依据它去建设数据流通生态网络的核心节点,建立起来之后,我们国家会有很多核心的数据流通枢纽。我们希望做的,是帮助国家建设、建立国家数据流通网,像电网和互联网一样,它是不同时代的标志。

陈蜀杰:数据智能时代的基础设施其实是数据交易搭建的网络。

张旭东:你的这句话还涉及到数据流。徐葳老师(华控清交首席科学家、清华大学交叉信息研究院长聘副教授)有一个很好的理论,讲到“数据垄断”。数据垄断有它的主观性、主动性和被动性,在P2P时代,几乎所有互联网公司都会做个P2P。用流量开一个P2P公司是流量变现最直接的一种方式,因为数据使用权和数据价值没办法流通变现,数据不能流动,干脆就地开个灶,把它“煮”了。

另一方面是它有数据,应用都跑到数据那儿去,不垄断也垄断了。我们现在做的事是像大禹治水一样“开渠引水”,把“河系、网道”都连起来,建立国家数据网,让数据跑向应用,化解真正的数据垄断。

陈蜀杰:两位描绘出了清晰的蓝图,那么为了推动这件事情的发展,华控清交接下来需要怎么做?

宋巍:第一是布道新数据观念,包括刚才谈到的基础设施、数据平权、“南水北调”,让大家接受这件事情。

第二是引导制定数据流通标准,我们会跟国家、行业一起制定一系列的数据流通行业标准,希望最后能够上升为国家的数据流通标准。

第三是不断打磨自己的技术产品和通用平台,需要有更多应用开发者在平台上开发基于数据流通的应用,它的应用性、通用性、可扩展性都非常重要,越容易被开发、成本越低,普及起来就越简单,大家进入的门槛就越低。

最后是要联网,要把每一个数据节点结成一张“大网”,网和网之间要有联通,所以需要一个广泛存在的网络,或者叫“水系”。

数据基础设施赋能企业:合法、合规使用数据

陈蜀杰:未来,所有产生数据的企业,都需要纳入到我们的“数据河道”?

张旭东:有很多种思路,我们目前的思路是当“赋能者”和“基础设施建设者”。

第一,我们不拥有基础设施,这是国家的。基础设施包括高速公路、高铁、乡村小道等,村里的路要先跟三级公路连起来,才能连接到高速公路上,所以要联通融汇,这是主旋律。怎么去包容、兼容,为所有的数据形态服务,是我们非常重要的研究方向,甚至从科研方向来讲,也非常重要。

第二,我们讲“通用”。数据路线开通之后跑什么“车”?“车”上装什么东西?这些不是我们关注的内容,我们关注的是这条路线是不是支持所有的“车”流通。

陈蜀杰:我问一个很小白的问题,比如一个企业产生了很多数据,但它不敢去变现,这种情况下,华控清交的技术怎么帮它获得一些额外价值?

张旭东:首先,在保护隐私、不泄露重要信息的情况下,让数据跑起来,以“可用不可见”为前提,实现“用量可控可计量”,这是特别重要的。那么怎样流通?将来的数据节点、和它相勾连的渠道,会有“闸”和管理。

你在国家政府认可的“航道”里走,国家对你的合规性、合法性予以认可,对数据的使用方法在节点上会有监管。所以我们希望把“水”引到可监管的渠道里,其实也是为企业、政府中数据流通的合法性、合规性提供服务,让他们不用担心。

宋巍:比如酒店的数据怎么发挥价值?它涉及到很多住房客人的数据,你想为客人提供更好的服务,但是又不能泄露客人的隐私。

这是两个层面的问题,第一个层面是“数据如何去流通”,这是一个基础性问题;第二个层面是针对行业和场景,如何用好你的数据,这是数据科学的问题。

我们可以开个脑洞,一个酒店里肯定有大人有孩子,酒店在度假村或者海边,这些是有一个整体画像的。在不泄露任何隐私的情况下,整个人群的样本能够分析出来,包括这个人是男是女、小孩大概长什么样子,这是一种大样本的数据。

张旭东:为什么数据要“要素化”?为什么数据变得那么重要?再讲得粗一点,人类社会发展到现在,外向型发展已经逐步受到限制,我们的资源消费量、人口红利等等已经变得平缓,那就要效率。效率从哪来?从对社会资源、自然资源的使用和分配上优化而来。数据是这种优化的根本依据,大到国家的智能“大脑”,小到个人浏览某个网站,所以特别重要,这就叫真实人工智能。

未来,数据智能将带来巨大的效率红利

陈蜀杰:无论是影响力还是价值,华控清交在业内有着不可撼动的地位。我们现在回归一个商业公司的本质探讨,华控清交的经营模式是什么?

张旭东:第一,基础是提供价值。我们是清华的企业,我们有很重的国资成分,有“国家队”的身份,我们企业的发展战略,要为国家战略。同时,技术本身是有价值的,能创造好的应用、设施,以后会为社会、国家创造巨大价值,那么我们肯定会收费。

第二,数据生态未来。数据“河道、沟渠”都通了之后,也要有管理的各种机制、措施和设施,我们希望国家能够给我们机会,允许我们参与其中,为数据管理做出贡献。

第三,当所有的“沟渠、水系”都汇集在一起,边上长了“庄稼”的时候,肯定要有各种生态,也就是新型数据生态。我们希望在新型数据生态里,作为积极参与和扶持培育的一支重要力量。

陈蜀杰:接下来,在全球的数据智能领域,中国或者中国公司的发展路径是什么?

张旭东:第一,我们要赶超欧美。这是一个非常好的时机,用一个时髦的词是“换道超车”。我们国家不光数据量,在利用数据的水平和状态上,不比发达国家差。

第二,我们要充分发挥制度优势。统一思想、决策、行动的决心和执行力度,是我们制度的优势。要利用制度优势促进数据智能的发展,把水系、沟渠、数据流通、基础设施链接起来,实现数据智能时代的赶超。

宋巍:我们国家是制造大国和基建大国,事实上数据的基础设施也是基建。那么我们的资源是什么?是大量数据。

以前的基建是制造、生产的出口、换汇,现在的基建完全可以发掘庞大的数据资源。因为我们是经济活动大国,涵盖各行各业,这是一个庞大的市场。所以“内卷”就是效率的提升,是精度的优化,是创新,是内部竞争力的打造,而这些都控制在我们国家自己手里,想象力是无限大的。以前是人口红利,以后是通过数据智能带来的效率红利。

张旭东:我们国家的经济效率、社会效率提升之后,全世界的资源都会过来。

陈蜀杰:感觉未来十分可期,张总作为CEO,你的Vision是什么?

张旭东:2013年的“退休”,其实已经为我的奋斗事业画上一个小小的句号。但是几年以后,我虽然生活过得很好,却好像正在社会性死亡,我觉得自己和社会脱节了,梦想也“死”了。

所以,我又进入了大概一周工作100小时的状态,做一件自己特别憧憬、觉得很有意义的事情,在不断追求答案的路上一路狂奔,对我个人来讲,这是又“活”过来了。

你问我Vision是什么,引用姚期智老师的一句话,就是为国家多做点事。因为我能为自己做的事儿,已经做了好多好多,也差不多够了。有机会去为国家、集体、他人,包括我自己做点事儿,我为有这样的机会而感到高兴。