1. 数据仓库基础知识
1. 什么是数据仓库?
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
也可以理解为数据仓库是数据库的一种概念上的升级,可以说是为满足新需求设计的一种新数据库,但是它又不仅仅是数据库。一方面数据仓库可以容纳更多的数据,更加庞大的数据集。另一方面也用于数据挖掘和数据分析,以建立数据沙盘为基础,为消灭消息孤岛和支持决策为目的而创建的。
2. 数据仓库的用途有哪些?
1.数据分析、数据挖掘、人工智能、机器学习、风险控制、无人驾驶。
2.数据化运营、精准运营。
3.广告精准、智能投放。
3. 数据仓库的发展大致经历了这样的三个过程:
-
简单报表阶段:
这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个阶段的大部分表现形式为数据库和前端报表工具。
-
数据集市阶段:
这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。
-
数据仓库阶段:
这个阶段,主要是按照一定的
数据模型
,对整个企业的数据进行采集,整理,并且能够按照各个业务部门的需要,提供跨部门的,完全一致的业务报表数据,能够通过数据仓库生成对对业务具有指导性的数据,同时,为领导决策提供全面的数据支持。
通过数据仓库建设的发展阶段,我们能够看出,数据仓库的建设和数据集市的建设的重要区别就在于数据模型的支持。因此数据模型的建设
对于我们数据仓库的建设有着决定性的意义。