来源:谈数据,作者:石秀峰
全文共5240个字,建议阅读8分钟
经过了站在业务视角的自上而下的数据梳理,以及站在IT视角的自下而上的数据盘点,一套“热腾腾”的数据资产清单终于新鲜出炉了。
通过数据资产盘点,企业终于知道他们拥有哪些数据、如何使用数据、是否安全以及数据在哪里。 然而,据笔者观察,业内大多数的数据资产盘点工作是通过手工作业的方式进行的,使用Excel工具进行记录。请不要小瞧这种方式,Excel手工盘点数据资产的方式之所以是主流,证明其简单易用、方便灵活、协作敏捷的特点是被广泛认可的。这里要提醒广大的数据产品经理们注意了:如果你能涉及出一款比Excel还灵活、好用的数据盘点工具,一定会大受欢迎!可能有人要问,数据梳理的再好,盘点的再清晰,那输出的也只不过是一堆Excel,对企业没有什么价值啊?
是的。这个时候就需要“数据资产目录”来发挥他的作用了!
01 数据资产目录是什么?
我经常将书的目录与数据目录进行类比,翻开一本书的目录,它会告诉你这本书写了啥、内容结构、作者的写作思路等,如果你对某一章节感兴趣,通过目录就可以快速找到这想看的内容。图书目录起到提纲挈领,纲举目张的作用。
数据资产目录也一样,它也有都有“字典”的作用,能够帮助企业相关业务和技术人员快速定位数据,解释数据,找到数据,并从中提取业务价值。
1、数据资产目录的本质
数据资产目录本质上就是一个元数据的存储库,它提供特定范围内所有数据资产的清单,无论其位置或来源如何。数据目录包括有关数据资产的关键属性信息,例如:名称、业务含义、类型、大小、模式和其他相关属性。
数据资产目录支持数据治理,包括:数据的分类分级,数据权限的管理,识别冗余和不一致的数据并为数据血缘分析和影响分析奠定了基础。
2、数据资产目录与数据目录
数据资产目录和数据目录本质上是一样的,都是元数据管理。
在项目实践中,数据目录也叫数据资源目录,一般是指通过元数据管理工具,对相关数据源(业务系统数据库、数据仓库、数据湖等)的元数据进行采集,而形成的数据目录。由于直接采集过来的基本都是数据库表结构、数据流、ETL脚本、数据库操作日志等技术元数据,所以数据目录要有一定的技术基础才能看懂,而且它的定位就是给技术人员看的。
而数据资产目录是数据目录的子集,