vlambda博客
学习文章列表

传统数据仓库与数据中台有哪些差异?

传统数据仓库与数据中台?


1. 传统数据仓库与数据中台的差异点
2. 如何将传统数据仓库向数据中台进行迁移

问题来自社区会员,回答来自社区交流,供同行参考


@zhuqibs Mcd 软件开发工程师:

两者的侧重点完全不一样:

(1)传统的数据仓库,做的是数据的聚集,将几个数据孤岛的数据汇总起来,做一定维度上的聚集和提炼;

(2)数据中台,其实是做数据的标准化,也就是做数据治理、数据管控,使得数据资产化,可以供各个业务所使用。

所以,数据中台的概念是包含数据仓库的,可以理解为数据仓库升级。要迁移,不是容易的事,做数据中台,你必须理解业务,不然你怎么治理,你怎么补全缺失的数据,你又怎么清洗数据。

从某种意义上说,数据中台提供的是数据的“产品”,是企业各业务环节可以使用的数据,接近于数据湖的概念。


@youki2008 广东溢达 系统架构师:

数据中台和数据仓库的区别核心在于理念的不同,数据仓库更多的是站在IT技术的角度,而数据中台是站在DT的交付,更多是服务于业务的视角,一开始就强调业务引领。


@某金融企业 技术经理:

1、数仓主要是数据聚集,数据中台主要是在数据集上增加相关数据处理,快速应对业务需要

2、我认为这中间可以先不用做迁移,保留T0层数据


@zftang0809 合肥华宇随身软件 软件开发工程师:

数据来源和建立数仓的目标以及数据应用的方向不同。

首先,从数据来源来说 ,数据中台的数据来源期望是全域数据包括业务数据库,日志数据,埋点数据,爬虫数据,外部数据等。

数据的来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式也是以结构化数据为主。

其次,建立数据中台的目标 是为了融合整个企业的全部数据,打通数据之间的隔阂,消除数据标准和口径不一致的问题。数据中台通常会对来自多方面的的基础数据进行清洗,按照主题域概念建立多个以事物为主的主题域比如用户主题域,商品主题域,渠道主题域,门店主题域等等。数据中台遵循三个one的概念:One Data, One ID, One Service, 就是说数据中台不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。而传统的数仓主要用来做BI的报表,目的性很单一,只抽取和清洗该相关分析报表用到基础数据,新增一张报表,就要从底层到上层再做一次。

然后,在数据应用方面 ,建立在数据中台上的数据应用 不仅仅只是面向于BI报表,更多面向营销推荐,用户画像,AI决策分析,风险评估等 。而且这些应用的特点是比较轻,容易快速开发出来,因为重要的数据分析工作在数据中台已经完成并且沉淀,之前工作成果都能被多个应用共享。


@尘世随缘 上海某互联网金融公司 技术总监:

数据仓库:解决数据孤岛问题,是IT技术解决方案

数据中台:重点强调业务,是业务解决方案

欢迎点击文末阅读原文到社区讨论交流,发表您的观点

觉得本文有用,请转发或点击“在看”,让更多同行看到


 资料/文章推荐:





下载 twt 社区客户端 APP

传统数据仓库与数据中台有哪些差异?

或到应用商店搜索“twt”