主数据与数据仓库相比,到底有什么不同?

1

目前主数据、大数据、数据仓库、Hadoop等概念都是市场上炒的很火的概念,但是很多人仅仅了解这些概念是互相有关联的,却不能很好的区分这些名词之间的区别,今天在这里我主要介绍一下主数据与数据仓库。

在我看来主数据是指具有高业务价值的、可以在企业内跨越各个业务部门且能被重复使用的数据,是单一、准确、权威的数据。而数据仓库是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。主数据可以看成是一类数据或多类数据,而数据仓库则是多类数据的合集。可以看出主数据其实是数据仓库的一部分。

我们搭建数仓,基于一定的规则进行数据抽取,将数据沉淀,保障数据是可追溯的。基于不同的算法规则对数仓中的数据进行计算、汇聚来实现预测分析。而主数据管理使得企业能够集中化管理数据,在分散的系统间保证主数据的一致性、准确性和权威性。主数据为数据仓库提供的基础数据(数仓模型的维表数据)就更具有权威性,那么在做数据分析时也能更准确、更趋向于实际情况,更好的帮助企业高层进行决策分析。

2

主数据指的是系统间共享的数据,比如客户数据,商品数据,供应商数据等。相对于记录业务活动的交易数据,主数据的变化比较缓慢。主数据与交易数据一起记录了交易的全部信息。举个例子,超市的结算小票可以看作一条交易数据,里面记录了流水号,商品的名称,数量,和金额,日期等。其中的商品名称,来源于主数据,可以简单理解为我们有一个货品清单。它的更新是比较慢的,而交易数据则一直在发生。在企业中,主数据一般有专门的主数据系统来管理。一般在不同的业务系统中,可能存在不同编码。比如商品名称,在一套系统用ABC编码,在另一套系统用123编码,在打通系统数据的时候,就需要主数据系统把两套系统做映射,相当于翻译,这样两套系统的数据才能共享。


数据仓库是为了支持企业决策分析而做的数据集合。它把销售,客户管理,库存,生产,财务,人事等等业务系统的数据汇集到一起,并按照业务规则搭建数据模型,形成一个支持多维度分析的数据集合。数据仓库系统不同于业务系统的地方在于,业务系统负责某个具体的业务功能实现,业务系统一般不保留历史数据。而数据仓库会把不同业务系统的历史数据都拿过来,并按照主题搭建分析模型。


主数据和数据仓库是两个完全不同的概念。在系统层面,这是两套独立的系统。操作上,主数据系统的数据也会同步到数据仓库中,作为分析的维度来使用。但是二者的定位和作用是完全不同的。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章