郑保卫:做好数据治理和数据资产管理工作,推动数据要素流通进程

发布日期:
2021-09-20

浏览次数:

9月17日,“第一届长三角数据要素高峰论坛”在苏州智博会期间成功举办。在论坛上,恩核(北京)信息技术有限公司郑保卫发表了主题为“做好数据治理和数据资产管理工作,推动数据要素流通进程”的精彩演讲。


以下为演讲内容:


郑保卫:大家好,有幸今天能跟大家分享,我觉得特别开心,因为我和前面演讲的御书坊的刘晨总、毕马威的陈总,其实经常在一块分享、合作,而且有时候会在客户那里遇到。大家能够在这个场合深入探讨这个事情是非常有意思的,非常感谢我们的主办方对我们的邀请。

接下来我介绍一下数据治理的事情。今天的主题是长三角的数据要素流通,我们主要是做工具层面的。我就从工具层面来看怎么支撑数据要素的流通。

数据要素流通的概念大家都在追随,但是要真正达到数据要素的流通,还有非常多的工作要做。我今天的主要演讲内容就是“做好数据治理和数据资产管理,推动数据要素的流通”。

郑保卫:做好数据治理和数据资产管理工作,推动数据要素流通进程

先简单做一个自我介绍,我做数据工作也很多年了。上学的时候就学了这个专业,现在又在从事这个工作,一直做产品方面的研发和交付。同时也是DAMA中国的理事,在推动整个数据治理的发展,把国外一些先进的理念和知识体系引进到中国来。还有大家熟知的数据治理工程师CDGA和数据治理专家CDGP认证考试,是我在协会负责。我们现在为了培养人才,一直在推广数据治理相关人才的认证, 数据要素发展,人才先行,我们通过开展认证,加速人才培养。

自2018年5月份银保监会发布《银行业金融机构数据治理指引》,及2019年10月份十九届四中全会上,中央首次提出将数据作为生产要素以后,数据治理和数据资产管理如雨后春笋般蓬勃发展。其实我们可以看一下,现在数据真正要用起来,要变成资产化,我个人觉得还有很远的距离。理想看着很美好,但是现实还是很残酷的。因为我们在给金融机构实施项目的过程中,发现还有非常多的问题,需要我们一步步脚踏实地的去解决。

最简单的是数据找不到、看不懂、不会用、质量差等等这些问题,随便一家机构都是存在的,只是程度不太一样而已。这些问题怎么去解决,对于机构,尤其是金融机构来说,至少需要三年时间踏踏实实的往前走,才能做到数据要素的流通,甚至数据的交易。虽然现实不是很乐观,但是确实这就是现状,我们必须去面对这个客观现实。


我们把整个机构里面的数据治理和数据资产管理路径分成三步:

第一步是基础设施建设阶段。很多金融机构从2018年开始开展数据治理工作,经过三年多时间,有不少金融机构已经获得较好的效果。所以从基础设施建设阶段来看,其中包括建章立制、体系建设、平台建设、关键领域等工作。该阶段根据我们的经验需要花费一年时间。

第二步是推广应用。平台搭建完成后,推广应用就显得格外重要,如果用不起来,它就是一个平台而已,产生不了任何价值。后面我会讲到,怎么样和正常的管理流程、开发流程、及已有流程结合应用,让全企业达到一个很好的使用效果。所以推广应用至少也需要一年时间。

第三个阶段就是全面治理,这个阶段也需要一年时间,数据治理工作获得一定效果后,便可逐步开展资产管理工作。数据治理和数据资产是分开的,数据没有治理好的时候,谈不上资产管理。既然是资产管理,就要把它当成资产,而资产就是有价值的,但是不是所有数据都有价值。所以,要把有价值的数据变成资产来进行管理,第一步要先治理好,打好基础。通过一定程度的治理、推广应用后,找到一些有价值的数据,之后再重新变成资产。所以在推广应用这个阶段,可以考虑做一些数据资产的事情。再到第三个阶段全面治理,企业级的全面治理,基本上全流程、全系统、全管理流程的融入数据管理。此时可以全局开展资产的分类、盘点,登记、运营、服务和评价、估值等等。由此可见,企业至少要经历三年时间,才能达到较好的数据资产管理效果。


数据治理这几年是一个非常火热的词,从宏观来看,我觉得解决三件事情:第一个是准确性。因为原来系统建设是一个一个建设的,而且不同时期建设的,数据标准化方面存在诸多问题。第一步首先要解决数据标准问题,标准建完之后还要标准落地。数据标准问题如果不能很好的解决,数据资产基本是无从使用。第二个就是可信度问题。第三个是可用度问题,像典型的金融机构,监管报送的数据存在这样那样诸多问题,在每次报送前,大家都是提心吊胆,心理没底,唯恐出问题。这些问题都是要通过一个完整的数据治理来解决。

在通过数据治理解决刚才三件事情的时候,首先是咨询、规划,然后逐渐实现落地,确保应用。在选择工具的时候,其实非常重要,给大家三个建议:

第一个要支撑开发。你选择的工具不能支撑开发,这个事情就不行。因为数据都是由业务产生的,如果数据治理工具支撑不了开发,基本是失控的。虽然难度很大,但是必须去做。如果不做的话,相当于自欺欺人,几年之后你会发现这个平台基本没有人用。

第二个就是数据管控。融入开发的时候,一定要在关键环节控制,不该控制的不要控制,就是不要让人觉得数据管控或者数据治理就是添乱不帮忙的。我经常说你要做到帮忙不添乱,在环节控制,要注重平衡。

第三个就是知识提供。知识提供能够做到的话,数据资产价值就可以慢慢体现出来。在选择工具的时候,一定尽量使用当前比较流行的人工智能的处理技术,提升智能化程度来降低人工工作量。


数据治理是最基本的东西,数据治理做的差不多才能谈资产管理,真正要做好,还是需要时间,基础没打好,上面这个其实比较难。我们也有些项目在做数据资产管理,包括资产规范化、资产登记管理、资产的管理和运营、资产评价,以及资产的估值,这些功能客户都在用,也获得了比较不错的效果。

另外现在说数据流通这个事情。因为数据资产不光是对内使用,还要对外使用。我个人觉得数据资产平台,其实是对接数据交易所的一个主要平台。因为企业哪些数据可以跟外部交易进行沟通、共享,一定是在数据资产管理平台里进行管理的,这个可能是未来的一个方向。

我们要做好数据治理,第一个就是文化。整个企业没有培养这方面的文化,没有这方面的认知,从高层到中层到基层,没有统一文化,这个事情很难做的,所以文化培养是非常重要的。

另外就是流程融入,要把数据治理工作能够融入到CMMI的管理流程里面去,如果能够逐渐完成流程融入,数据治理基本上就成功一半了。流程跑上两年到三年,效果会超出你的想象。但是这个很难,要改变现在系统建设的模式其实是一个改革。

另外,要做好数据治理,必须是业务驱动。有些企业客户没有想清楚,认为是技术驱动。例如数据质量问题不是一个简单的问题,需要很多业务部门参与,才可以很好的解决,而且数据质量问题分布在数据建设的全生命周期,从前端的录入到中端的加工,然后到后端的处理,这些都会有很多数据质量的问题。

还有就是治理的服务化。因为大家一说治理就是管理的意思,管理别人就很容易引起别人的反感。要把治理变成服务,你不要老是去管对方,你把你管的成果给对方提供服务,解决对方的问题,对方就很愿意去接受你的服务,来解决他的问题,他就愿意配合。

所以说,一定要把管理或者治理变成服务,通过工具,通过服务给对方提供很多帮助,事情就好解决了。


平台建设最重要的是要坚持4个原则:

第一个就是持续化。平台的投入一定是持续化的,不能阶段性的,一定是一个持续的投入过程。我也见过一些客户,投入了一年就不再投入了,虽然有了一些成果,但是过两年就很快回归原点了。所以说它是一个坚持可持续发展。

第二个就是自动化。一定要提高自动化程度,靠人工这件事是不可为的。数据治理里面如果大量的工作靠人工完成,这其实很难做,一定要通过现在的自然语言、人工智能等等这些来支撑自动化程度。

第三,全方位的服务。把管理变成服务,通过工具提供各种服务,来给各个平台提供支撑,让业务、技术可以很好的使用平台提供的服务。数据管理变为数据的供应者和提供者,另外就是通过平台给大家提供各种帮助。

第四,价值实现机制。因为数据要流通,也是要通过平台来支撑资产的盘点,资产的运营,资产的评估甚至是估值等等。


最后一个部分,今天整个会议的主题是数据资产流通。依据从事这个行业很多年的经验,我觉得应该分成4个阶段:

第一,提质阶段。企业里面的数据质量问题是很严重的,远超出我们的想象,质量不高,何谈流通问题。这是第一步,提质问题。

第二,数据信用体系建设问题。因为有那么多数据,随便一家企业,几百万个数据项,到底哪个是资产,哪个是质量高的,哪些是不良资产,数据也有不良资产,也有优良资产,必须进行区分,我们得把它找出来。然后要有一套评估模型,比如是热度评估、信用评估、评分体系,找出优质的数据资产。

第三,估值体系完善和成熟阶段。这个时候估值方法有了,定价体系有了,就可以进入资产负债表了,才有机会在市场流通,流通就会有价值。

第四,流通交易。有人说我们现在已经在成立交易所,已经在做资产流通的事情了。

我觉得虽然整个过程是分成4个阶段,从技术角度来看是逐层做的,但是从时间上来看可能有些是并行的。比如说,今天第四个事情可能正在做了,交易所有的地方已经成立了。但是这些事情解决不了,还是会影响最后的交易。

《数据安全法》9月1号也已经实施了,将来怎么落地呢,交易的数据是违法还是不违法呢,没有前面的东西作为支撑,其实落地还是有难度的。因为从技术角度来看这些要一步一步去完善的,每一个阶段都不能绕过,而且前一个阶段是后一个阶段的基础,每个阶段都需要稳扎稳打,开可以顺利完成数据交易和流通。

谢谢大家。