从认知上理解,数据架构在整个数据管理上的重要性非常重要,所谓体系本身就是一个架构性的思维方式,如果希望数据可以长期有效地保障数据的高质量、可用性、稳定性,特别是实现数据的资产化并实现业务价值,自上而下的数据架构设计支撑非常重要。我们需要回过头来学习并理解相关与企业架构、业务架构、应用架构、技术架构,当然也有数据架构的资料及最佳实践。
接下来,我们从以下三个角度来考虑数据架构:
1、数据架构结果,例如各种级别的模型、定义和数据流,通常称为数据架构构件。
2、数据架构活动,以形成、部署和实现数据架构的目标。
3、数据架构行为,例如影响企业数据架构的各种角色之间的协作、思维方式和技能。
这三个部分共同构成了数据架构的基本组成部分。
数据架构完成支持整个企业的需求时,它才是最有价值的。数据架构的重要成果物(交付物)-数据架构设计文档,是一个正式的企业数据模型,包括数据名称、全面的数据和元数据定义、概念和逻辑实体、关系以及业务规则。
在DAMA中,数据架构的定义是:识别企业的数据需求(无论数据结构如何),并设计和维护总蓝图以满足这些需求。使用总蓝图来指导数据集成、控制数据资产,并使数据资产与业务战略保持一致。
数据架构的目标:
1、识别数据存储与处理需求
2、设计结构和计划以满足企业当前和长期的数据需求
3、战略性地为组织做好准备,快速发展其产品、服务和数据,以利用新兴技术中固有的商机
为了实现数据架构的目标,数据架构师需定义并维护以下规范:
定义组织中数据的当前状态
提供有关数据和组件的标准业务词汇
使数据架构与企业战略和业务架构保持一致
表达组织数据战略要求
高阶数据集成概要设计
与企业架构路线图集成
总体数据架构实践包括:
· 使用数据架构构件(主蓝图)来定义数据需求、指导数据集成、控制数据资产以及使数据项目投资与业务策略保持一致
· 与改进业务或IT系统开发的各种利益相关者合作,学习和影响他们
· 通过通用业务词汇和数据架构,搭建企业数据语言
企业架构框架(架构框架是用于开发各种相关架构的基础结构。架构框架提供了思考和理解架构的方法。它们代表了整体的“架构的架构”)。
矩阵框架中的两个维度分别是作为问询沟通的列维度(即,什么,如何,在哪里,谁,何时,为什么)和作为验证转换的行维度(标识、定义、表示、规范、配置和实例化)。框架分类由单元格(问询和转换之间的交集)表示。Zachman框架中的每个单元代表一种独特的设计工件。
· 企业数据架构
企业数据架构定义了对组织重要的元素的标准术语和设计。企业数据架构的设计包括对业务数据的描述,包括数据的收集、存储、集成、移动和分布。
企业数据架构描述必须包括企业数据模型(例如,数据结构和数据规范)以及数据流设计。
企业数据模型(EDM):EDM是一种整体的、企业级的、与实现无关的概念或逻辑数据模型,为整个企业提供数据的统一一致的视图。
数据流设计:定义在数据库、应用程序、平台和网络(组件)之间进行存储和处理的要求和主要蓝图。
数据流可以以不同的详细级别记录:主题区域、业务实体,甚至属性级别。
· 企业数据模型(EDM)
包括通用(企业范围的概念模型和逻辑模型)以及特定于应用程序或项目的数据模型,以及定义、规范、映射和业务规则。
EDM可以在不同的细节级别上构建,因此资源可用性将影响建设EDM的初始范围。而且随着时间的流逝、企业需求的增长,企业数据模型中需要捕获的详细信息的范围和级别通常会扩展。大多数成功的企业数据模型都是利用不同层级以增量方式和迭代方式来构建的。
· 数据流设计
数据流是一种数据血缘文档,描述了数据如何在业务流程和系统中移动。端到端数据流说明了数据的起源、存储和使用的地方,以及在内部和不同流程和系统之间移动时如何进行转换。数据血缘分析可以帮助解释数据流中给定点的数据状态。
数据架构管理活动:建立数据架构实施、与企业架构集成。
数据和企业架构从两个角度处理复杂性:以质量为导向(传统数据架构工作一致)、面向创新(不需要完全全面、长期的考虑视角,并且会应用未经验证的业务逻辑和前沿技术)。
建立数据架构实践的工作流:
战略:选择框架、陈述方法、制定路线图
接受和文化:告知和激发行为改变
组织:通过明确责任和职责来组织数据架构工作
工作方法:与企业架构保持一致,定义最佳实践并在开发项目中执行数据架构工作
结果:在总体路线图中产生数据架构构件
建立数据架构实践包括三个步骤:评估现有的数据架构、制定路线图和在项目中管理企业要求。
制定路线图需要满足业务数据驱动的需求,描述了数据架构3-5年的开发路径、路线图与业务需求,对实际条件的考虑以及技术评估一起描述了目标架构将如何变为现实。数据架构路线图必须集成到总体企业架构路线图中。
业务数据驱动的路线图从最独立的业务功能(即对其他活动的依赖性最小)开始,到最依赖其他活动的业务能力结束。顺序处理每个业务功能将遵循总体业务数据原始顺序。
与企业数据架构项目相关的活动包括:
定义范围:确保范围和接口与企业数据模型保持一致。
了解业务需求:捕获与数据相关的需求
设计:形成详细的目标规格,包括数据生命周期角度的业务规则。
实施:购买现成应用软件/针对通用数据结构以及现有和新流程映射应用程序的数据模型了解CRUD操作/根据数据结构实现数据存储,根据标准化或设计规范进行集成。
企业数据架构的开发方法:瀑布方法、迭代方法、敏捷迭代的方法。
工具及技术
工具包括:数据建模工具、资产管理软件、图形设计应用
需要考虑并采用的技术:
· 数据架构设计生命周期预测
· 图表清晰度
清晰一致的图例、所有图对象和图例之间的匹配、清晰一致的线方向、一致的线交叉显示方法、一致的对象属性、线性对称。