入门概念 | Amazon RedShift 是什么?


  基本概念

Amazon Redshift 是云中一种完全托管的 PB 级数据仓库服务。可以在 Amazon Redshift 查询编辑器 v2 或商业智能(BI,Business Intelligence)工具中,直接加载数据并开始查询。

AWS Redshift作为AWS云计算平台中的一项核心服务,为企业提供了强大的数据仓库功能,使其能够在短时间内做出明智的商业决策,实现商业价值的最大化。

Amazon Redshift Serverless 可以直接访问和分析数据,而无需对预置数据仓库执行任何配置操作。系统将自动预置资源,数据仓库的容量会智能扩展,即使面对要求最为苛刻且不可预测的工作负载也能提供高速性能。

  数据仓库

数据仓库是一个系统,它将来不同来源的数据导入一个中央存储库中,并为后续的快速检索做好准备。数据仓库通常包含了从事务系统、操作数据库、以及其他来源,提取到的结构化和半结构化的数据。数据工程师和分析师可以将这些数据用于商业智能、以及其他各种目的。

当前四大流行云数据仓库分别是:Snowflake、Amazon Redshift、Google BigQuery和Azure Synapse Analytics。

  工作原理

Amazon Redshift 专为大规模数据处理和高性能查询而设计,它基于MPP(Massively Parallel Processing)架构,可并行处理大规模数据集,提供快速、高效的数据查询和分析能力。无论数据集的大小如何,Amazon Redshift 都使用目前所用的基于 SQL 的相同工具和业务情报应用程序,来提供快速的查询性能。

...