发电公司如何构建自己的数据仓库?

1

数仓主要为了提高数据etl效率。不知道电厂数据是非结构化多还是结构化多

2

根据以往的数据仓库项目经验以及数据仓库理论的掌握,我总结一下,如下供参考:

1、首先你得搞清楚建设数仓的目的是什么

是偏向于整合各系统数据,为数据分析决策服务,还是偏向于快速的完成分析决策需求?

如果是前者,那么在数据仓库建模的时候一般会选择ER建模方法;

如果是后者,一般会选择维度建模方法。

  • ER建模:即实体关系建模,由数据仓库之父BIll Inmon提出,核心思想是从全企业的高度去设计三范式模型,用实体关系描述企业服务。主张的是自上而下的架构,将不同的OLTP数据集中到面向主题的数据仓库中。

3

这问题有点专业哇,火电、水电、核电还都有区分,火电毕竟不算太环保,核电咱也讲不清楚,挑个简单的水电来说吧!

说到大数据,很多都觉得数据应该用有5V特性(我就不赘述了,大家可以直接问度娘),为了描述简单一点我梳理一下数据有哪些:

1.水电运行设备状态数据,结构化;

2.运维检修数据,结构化/半结构化;

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章