Greenplum是由Pivotal公司发起的一个全球领先的基于MPP(大规模并行处理)架构的大数据平台开源项目。Greenplum产品被广泛运用于大规模商业智能和分析中,其优秀的数据存储、处理和实时分析能力为用户打通了业务-数据-洞见-业务的闭环,适用于包括硬件裸机、容器、私有云和公有云各种运行环境。随着近期Greenplum 6.0版本的正式发布,Greenplum可以支持更大规模、更多并发的任务处理。更多信息请访问Greenplum中文社区网站greenplum.cn。
Greenplum是基于postgres的MPP数据库,所以在表的类型上,首先是heap表,该类表是支持Alter table操作的,通过此即可修改表的字段。
另外,迎合大数据、数据仓库的海量数据,Greenplum还支持append only类型的表,以及分区表,针对这些表的操作,特别是涉及到海量数据时,一个建议是:
创建需要的新表,
将数据从旧表中倒入到新表中,
删除旧表
重命名新表名称为旧表名称
做analyze,更新统计信息