华为张福鹏:以数据为中心构架数字流,让数据真正服务于经济增长

数字经济时代,数据是最重要的生产要素之一,用好数据资源对实体经济的发展有着至关重要的作用,但是,众多数据资源分散在不同行业、不同机构,形成了一个一个的“数据孤岛”。如何让数据要素真正流通起来,让数据蕴藏的巨大价值充分显现的同时做好数据及隐私的保护,成为了社会各界共同关心的问题。

在近日举办的第一财经新金融峰会上,华为数据存储与机器视觉产品线副总裁张福鹏受邀与国家金融与发展实验室副主任、金融科技50人论坛学术委员杨涛、中国信通院人工智能与数据治理中心副主任王强、对外经贸大学数字经济与法律创新研究中心执行主任许可、粤港澳数据要素产业化联盟秘书长黄蓉进行了主题为“数据要素市场建设进行时”的圆桌对话,就数据要素市场发展面临的挑战、数据要素与数字经济未来、数据要素与金融科技的关联展开讨论。

华为数据存储与机器视觉产品线副总裁张福鹏从技术发展角度,阐述了对数据价值挖掘和数据基础设施构建的思考,以下为主要观点实录。

数据的生产链条是数据交易链条的基础

从技术的角度来讲,数据的价值链有生产、交易两个层面。数据交易链条解决的是政府、企业之间如何进行数据价值挖掘和交易的问题;数据生产链条解决的是组织内部从数据的采集、存储、计算与分析到有效使用,如何围绕数据进行全生命周期管理的问题。

数据生产、交易链条从本质上是相互交叠的,数据生产链条是交易链条的基础,只有当企业在“生产环节”产生了海量的、有价值数据之后,数据交易链条才足以成为一个值得讨论的话题,也才有之后的数据确权,数据定价,数据交易,数据共享等问题的探讨。

用变化、发展的眼光看问题,拓宽数据价值深度及宽度

从蒸汽时代的蒸汽火车到后来的内燃机车,直至后来依靠电力的动车、高铁,基于铁路的基础设施随着技术的进步和需求的升级不断的演进,在质量、效率和体验上也获得了极大的提升,诸如此类的基础设施升级换代,给全社会的生产、生活带来了巨大的变化。同样,在数据层面,不同时期数据的产生途径、形式、数据量、价值点都是不同的,因此,我们在数据价值的挖掘上,也需要时刻站在变化的角度,用发展的眼光看问题,不断的升级和演进数据基础设施。

以金融行业为例,一方面,以往银行的数据更多的是数据库格式、基于账务的结构化数据,这种数据用数据模型就可以很好的完成分析,并衍生出一系列的金融产品和金融服务。但随着云、AI、物联网等技术的发展,金融领域数据的类型逐渐从结构化数据拓展到非结构化数据,如票据影像、生物特征识别、视频等,同时数据产生主体也不仅仅局限于人了,更多的是人所授予的物理资产所产生的数据,而目前对此类数据的挖掘深度、挖掘广度、挖掘量都是远远不够的。

另一方面,中国在金融科技的应用领域已经走在世界前列,业务办理全面线上化、移动化。移动支付的普及,双十一、双十二等大量交易峰值的出现,都对背后的数据基础设施提出了新的要求和挑战,而在应用层技术的先进性,某种程度上掩盖了对基础设施层面技术先进性的感知度和关注度。

目前数据基础设施的发展有三个重要方向,第一,全面推动数据存储的闪存化,逐步减少硬盘比例,让数据读写、流动性能都大幅度提升,以支撑数字化业务的海量并发、极致体验等要求;第二,加强数据保护,实现核心数据全容灾/备份,保障业务稳定可靠;第三是实现绿色节能,在不断留存数据资产的同时,减少数据副本拷贝,进行数据缩减(重复删除和压缩),降低每比特存储功耗,实现节能环保目标。

多重市场因素导致数据基础设施应用难、数据价值释放难

基础设施的升级换代,往往是最难的,一方面在研发端,需要耗费大量的人力物力,持续投入;另一方面在市场应用端,基础设施作为固定资产,企业高成本、高投入的同时又缺乏充分发挥其价值的能力与实践,都让企业在数据基础设施的升级方面徘徊不前。

2008年的一场雪灾,造成了我国南方大面积的电网瘫痪,罪魁祸首是高压线结冰,后来我们知道,解决这个问题只需给高压电线加上直流电,让高压电发热把冰融化掉,就能解决高压线结冰的问题。但看似一个很简单的问题,在基础设施领域里,却要花很长的时间去思考、规划、研究、部署。

在企业数字化转型的过程中,大量的业务开始依托于数据来完成,而我们对数据基础设施稳定性、可靠性等性能的要求,还未达到足够的规范程度。

在市场应用方面,企业高成本投入后,还面临着“三年一代”、不同厂商、不同型号设备兼不兼容等问题,更承受着系统升级、数据迁移过程中可能会出现的业务中断、数据丢失风险,这些都造成了企业不敢轻易更换、升级数据基础设施。更重要的是,企业即使部署了最先进的数据基础设施,也还是“新瓶装旧酒”,没有也不知道如何在更深、更广的角度,完成数据价值的挖掘。

如金融行业目前对于数据基础设施的升级换代,大多都是基于监管对数据保护的要求,除了强制性的数据保护之外,银行没有意识到生产环节越来越多的数据也应该进行容灾、备份、归档。国家对银行提出了“两地三中心”灾备要求,但银行所备份的数据,还是传统观念中的核心数据,对于视频、图像等数据不做备份和归档。而在技术端,AI技术的使用和普及,已经可以让视频类和图像类的数据产生更大的价值。

企业拥有数据,却不知道如何让数据产生价值,科技公司有很多算法,却不拥有数据。因此,我们需要建立一种机制,面对未来更加海量的数据,一方面让存储及算法提供商的技术有的放矢,一方面让企业能用更加低成本、绿色的方式做好数据价值的挖掘及数据保护。

以数据为中心构架数字流,让数据真正服务于增长

数字经济时代数据成为新的生产资料,算力成为新的生产力,5G、云、AI成为新的生产工具,产业数字化成为了目前充分发挥数据价值的核心。目前的产业数字化,从本质上只是交易和物流的数字化,如目前的在线购物都是基于标准产品的交易过程,还没有涉及到数据直接应用到生产端的个性化定制和产线的柔性制造等方面。如果无法做到全产业链的数字化,在信息爆炸的时代,所有的数据都将是无效数据。

要做到产业数字化,必须要摒弃之前“以生产流程为中心”来构架数字流的模式,建立全新的“以数据为中心”来构架数字流的模式。首先要考虑数据在哪里,是什么类型、什么格式,有多大规模,可以产生什么价值,如何跟5G、云、AI等技术产生关联,之后才能围绕数据,将订单、生产、物流等流程串联起来。

金融行业因其行业的特殊性,对数据基础设施的性能、效率、稳定性等方面都有着非常高的要求,也因此成为数据基础设施应用与实践的标杆领域。以全闪存为例,全闪存以其强大的性能、高效率、高稳定性,迅速在金融行业普及,也激发了整个行业数字化转型的新动力。但目前我国整体闪存的普及率只有22%,相比闪存普及率高达50%以上的美国,在数据基础设施的建设方面还需要更加快速的推动演进升级,为数字化转型发展铺平道路。

在中国市场,以往的认知都是应用驱动市场,而从全球科技发展历史看,真正强大的国家和商业组织,都是先于应用推动基础设施的升级,然后获得技术红利带来的市场应用大发展。改革开放40年,我们在应用层面奠定了良好的发展基础,未来40年,我们应该转换思维,重视基础设施领域的率先发力,让技术红利推动市场应用的新一轮增长。

正如今天的主题——唯变不变、存真求稳、开放生态,作为数据基础设施及数字化转型方案的提供方,华为OceanStor存储已经为全球众多金融行业客户提供了存储及数字化转型方案。未来,华为也将持续创新突破,推动闪存的普及,提升核心数据的可靠性,降低数据存储的体积和功耗,在变化中“坚守”和“探索”,助力金融行业进一步释放数据价值。