vlambda博客
学习文章列表

有了数据库,就不用做数据仓库了?

如果要评选在部署BI系统时BI技术人员最常被客户问到的十大怪问题,“有数据库了,你们为啥非要另外弄数据仓库?”肯定是其中之一。通常,技术人员往往只会简单回答一句“两边格式不兼容,把原来数据导进去”,以至于给很多人留下了BI系统兼容性好差、总需要另外导入数据的奇怪印象。
前几天,我们在《》中讲数据仓库和数据库的问题时,也有人提出这个问题:为什么需要数据仓库?以及什么时候需要数据仓库?

-01-

为什么需要数据仓库 


数据仓库是一种分析数据库,用于存储和处理数据,以便对数据进行分析。数据仓库有两个主要功能:存储分析数据和处理分析数据。如果多个业务数据有不同的数据源,就无法轻易地将它们存储在一起。或者,如果你的系统不适合用来运行大量的数据分析,会给系统带来很重的负载。
数据仓库是分析管道的核心,它有三个主要作用:
存储:在合并 (提取和加载) 步骤,数据仓库将接收和存储来自多个数据源的数据。
处理:在处理 (转换和建模) 步骤,数据仓库将处理大部分 (或全部) 由转换步骤生成的密集处理工作负载。
访问:在生成报告 (可视化和交付) 步骤,首先需要在数据仓库中收集报告,然后将其可视化并交付给最终用户。

-02-

什么时候需要数据仓库


简单地说,这取决于公司所处的阶段、所拥有的数据量和预算,等等。
值得一提的是,商务智能(BI)系统标配自带数据仓库。所以,如果你的公司采用了BI系统,那么就可以直接用商务智能 (BI) 连接数据库,从而拥有数据仓库的功能。引入BI系统和行业解决方案,能大大拓展数据仓库的适用范围。
在考虑商务智能BI系统和数据仓库时,可以从以下几个角度考虑:
第一,你是否比较依赖单个数据源? BI系统的数据仓库能够更好的帮你分析和整理数据源的大量数据。
第二,你是否需要将数据分析活动常态化? 比起写入、调出都麻烦的传统数据库,BI系统的即时相应和分析功能是一大优势。
第三,你是否拥有建立原始数据源的权限? BI系统可以自动对数据进行清洗,在能够掌控原始数据源写入平台时会是一个更好的选择。
第四,你的数据总量和分析需求量如何?  如果日常数据量和分析需求都很大,那么性能更强大的商务智能BI系统是你的首要选择。



有了数据库,就不用做数据仓库了?


--往期精彩回顾--



有了数据库,就不用做数据仓库了?
听说一键三连的人都开单了!