1. 概述
Azure Data Lake Storage 是全世界最高效的 Data Lake。它将 Hadoop 兼容文件系统的强大功能与集成的分层命名空间以及 Azure Blob 存储的大规模和经济性相结合,可帮助加快从概念验证到生产的转换。
2. 选项
Azure Data Lake Storage 支持以两种不同方式组织数据。
通过分层命名空间选项,客户可以将其 Data Lake 组织为结构化目录、文件夹和文件。使用分层命名空间选项,客户将需要支付额外的元数据费用
利用平面命名空间,客户可以将其 Data Lake a 作为非结构化 blob 存储来操作。
1. 数据存储
Azure Data Lake Storage Gen2 提供高级、热、冷、极冷和存档等多种存储类型,每种类型的价格不同。用户可以根据数据访问频率和成本效益选择适合的存储类型。
2. 预留容量
Azure Data Lake Storage Gen2 预留容量允许用户为块blob和Azure Data Lake Storage Gen2数据在标准存储帐户中承诺一年或三年的预订,并提供容量折扣。这种方式确保预订期间提供固定存储容量,用户无需担心存储容量不足的问题。这种预订方式可以显著降低存储数据的容量成本。
3. 其他计费
3.1 事务费用。根据写入操作和读取操作的次数计费。
3.2 数据检索费用。对于存档存储层的数据,如果需要快速检索,可能需要支付额外的数据检索费用。
3.3 删除费用。如果将数据从冷、极冷或存档存储层提前删除,可能需要支付按比例计算的早期删除费用。
3.4 数据传输费用。将数据写入到GRS帐户时,该数据将被复制到另一个Azure区域,涉及异地复制数据传输费用。
3.5 增加数据可用性。将帐户复制设置从LRS更改为GRS或RA-GRS时,也需收取费用。