1
数仓主要为了提高数据etl效率。不知道电厂数据是非结构化多还是结构化多
2
根据以往的数据仓库项目经验以及数据仓库理论的掌握,我总结一下,如下供参考:
1、首先你得搞清楚建设数仓的目的是什么
是偏向于整合各系统数据,为数据分析决策服务,还是偏向于快速的完成分析决策需求?
如果是前者,那么在数据仓库建模的时候一般会选择ER建模方法;
如果是后者,一般会选择维度建模方法。
ER建模:即实体关系建模,由数据仓库之父BIll Inmon提出,核心思想是从全企业的高度去设计三范式模型,用实体关系描述企业服务。主张的是自上而下的架构,将不同的OLTP数据集中到面向主题的数据仓库中。
3
这问题有点专业哇,火电、水电、核电还都有区分,火电毕竟不算太环保,核电咱也讲不清楚,挑个简单的水电来说吧!
说到大数据,很多都觉得数据应该用有5V特性(我就不赘述了,大家可以直接问度娘),为了描述简单一点我梳理一下数据有哪些:
1.水电运行设备状态数据,结构化;
2.运维检修数据,结构化/半结构化;