11---
2- title : " TPC-H Benchmark: Databend Cloud vs. Snowflake"
3- sidebar_label : " TPC-H SF100 Benchmark "
2+ title : " TPC-H 基准测试: Databend Cloud vs. Snowflake"
3+ sidebar_label : " TPC-H SF100 基准测试 "
44---
55
6- ## Quick Overview
6+ ## 快速概览
77
88### TPC-H
99
10- The TPC-H benchmark 是一个用于评估决策支持系统的标准,专注于复杂查询和数据维护 。在此分析中,我们使用 TPC-H SF100( SF1 = 6 Million Rows) 数据集比较 Databend Cloud 和 Snowflake,该数据集包含 100GB 的数据和大约 6 亿行,涵盖 22 个查询。
10+ TPC-H 基准测试是评估决策支持系统的标准,侧重于复杂的查询和数据维护 。在此分析中,我们使用 TPC-H SF100( SF1 = 6 百万行) 数据集比较 Databend Cloud 和 Snowflake,该数据集包含 100GB 的数据和大约 6 亿行,涵盖 22 个查询。
1111
1212:::info Disclaimer
13- The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing Performance Council ([ TPC] ( http://www.tpc.org ) ). Our benchmark, while inspired by TPC-H, is not directly comparable to official TPC-H results.
13+ TPC Benchmark™ 和 TPC-H™ 是事务处理性能委员会 ([ TPC] ( http://www.tpc.org ) ) 的商标。我们的基准测试虽然受到 TPC-H 的启发,但与官方 TPC-H 结果不具有直接可比性。
1414:::
1515
16- ### Snowflake and Databend Cloud
16+ ### Snowflake 和 Databend Cloud
1717
18- - ** [ Snowflake] ( https://www.snowflake.com ) ** : Snowflake 以其先进的功能而闻名,例如分离存储和计算 、按需扩展计算、数据共享和克隆功能。
18+ - ** [ Snowflake] ( https://www.snowflake.com ) ** : Snowflake 以其先进的功能而闻名,例如存储和计算分离 、按需扩展计算、数据共享和克隆功能。
1919
2020- ** [ Databend Cloud] ( https://www.databend.com ) ** : Databend Cloud 提供与 Snowflake [ 类似的功能] ( https://github.com/databendlabs/databend/issues/13059 ) ,作为一个云原生数仓,它也将存储与计算分离,并根据需要提供可扩展的计算。
21- 它由开源 [ Databend project ] ( https://github.com/databendlabs/databend ) 开发而来,定位为 Snowflake 的一种现代 、经济高效的替代方案,尤其适用于大规模分析。
21+ 它由开源 [ Databend 项目 ] ( https://github.com/databendlabs/databend ) 开发而来,定位于 Snowflake 的现代 、经济高效的替代方案,尤其适用于大规模分析。
2222
23- ## Performance and Cost Comparison
23+ ## 性能和成本比较
2424
25- - ** Data Loading Costs ** : 与 Snowflake 相比,Databend 在数据加载方面实现了 ** 67% 的成本降低** 。
26- - ** Query Execution Costs ** : Databend 在查询执行方面的成本比 Snowflake 大约 ** 低 60%** 。
25+ - ** 数据加载成本 ** : 与 Snowflake 相比,Databend 在数据加载方面实现了 ** 67% 的成本降低** 。
26+ - ** 查询执行成本 ** : Databend 的查询执行成本比 Snowflake 大约 ** 低 60%** 。
2727
2828:::info Note
2929
30- 对于此 benchmark,没有应用特殊的 tuning 。Snowflake 和 Databend Cloud 都使用了它们的默认设置 。
30+ 对于此基准测试,未应用任何特殊调整 。Snowflake 和 Databend Cloud 均使用其默认设置 。
3131请记住,** 不要只相信我们的话 - 我们鼓励您自己运行并验证这些结果。**
3232:::
3333
34- ### Data Loading Benchmark
34+ ### 数据加载基准测试
3535
3636![ Alt text] ( @site/static/img/documents/tpch1.png )
3737
@@ -49,7 +49,7 @@ The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing P
4949| ** Total Cost** | ** $0.77** | ** $0.25** | |
5050| ** Storage Size** | ** 20.8GB** | ** 24.5GB** | |
5151
52- ### Query Benchmark: Cold Run
52+ ### 查询基准测试:冷启动
5353
5454![ Alt text] ( @site/static/img/documents/tpch2.png )
5555
@@ -80,87 +80,87 @@ The TPC Benchmark™ and TPC-H™ are trademarks of the Transaction Processing P
8080| ** Total Time** | ** 207s** | ** 166s** |
8181| ** Total Cost** | ** $0.23** | ** $0.09** |
8282
83- ### Query Benchmark: Hot Run
83+ ### 查询基准测试:热启动
8484
8585![ Alt text] ( @site/static/img/documents/tpch3.png )
8686
87- | 查询 | Snowflake (总计 138 秒,成本 $0.15) | Databend Cloud (总计 124 秒,成本 $0.07) |
88- | ---------- | ----------------------------------- | ---------------------------------------- |
89- | TPC-H 1 | 8.934 | 7.568 |
90- | TPC-H 2 | 3.018 | 3.125 |
91- | TPC-H 3 | 6.089 | 5.234 |
92- | TPC-H 4 | 4.914 | 3.392 |
93- | TPC-H 5 | 5.800 | 4.857 |
94- | TPC-H 6 | 0.891 | 2.142 |
95- | TPC-H 7 | 5.381 | 4.389 |
96- | TPC-H 8 | 5.724 | 5.887 |
97- | TPC-H 9 | 10.283 | 9.621 |
98- | TPC-H 10 | 10.368 | 8.524 |
99- | TPC-H 11 | 1.165 | 1.364 |
100- | TPC-H 12 | 7.052 | 5.352 |
101- | TPC-H 13 | 12.829 | 6.180 |
102- | TPC-H 14 | 3.288 | 2.725 |
103- | TPC-H 15 | 3.475 | 2.748 |
104- | TPC-H 16 | 4.094 | 1.124 |
105- | TPC-H 17 | 4.203 | 13.757 |
106- | TPC-H 18 | 18.583 | 11.630 |
107- | TPC-H 19 | 3.888 | 7.881 |
108- | TPC-H 20 | 6.379 | 5.797 |
109- | TPC-H 21 | 10.287 | 9.806 |
110- | TPC-H 22 | 1.573 | 1.122 |
111- | ** 总时间** | ** 138 秒** | ** 124 秒** |
112- | ** 总成本** | ** $0.15** | ** $0.07** |
87+
88+ | 查询 | Snowflake (总计 138s, 成本 $0.15) | Databend Cloud (总计 124s, 成本 $0.07) |
89+ | -------------- | ---------------------------------- | --------------------------------------- |
90+ | TPC-H 1 | 8.934 | 7.568 |
91+ | TPC-H 2 | 3.018 | 3.125 |
92+ | TPC-H 3 | 6.089 | 5.234 |
93+ | TPC-H 4 | 4.914 | 3.392 |
94+ | TPC-H 5 | 5.800 | 4.857 |
95+ | TPC-H 6 | 0.891 | 2.142 |
96+ | TPC-H 7 | 5.381 | 4.389 |
97+ | TPC-H 8 | 5.724 | 5.887 |
98+ | TPC-H 9 | 10.283 | 9.621 |
99+ | TPC-H 10 | 10.368 | 8.524 |
100+ | TPC-H 11 | 1.165 | 1.364 |
101+ | TPC-H 12 | 7.052 | 5.352 |
102+ | TPC-H 13 | 12.829 | 6.180 |
103+ | TPC-H 14 | 3.288 | 2.725 |
104+ | TPC-H 15 | 3.475 | 2.748 |
105+ | TPC-H 16 | 4.094 | 1.124 |
106+ | TPC-H 17 | 4.203 | 13.757 |
107+ | TPC-H 18 | 18.583 | 11.630 |
108+ | TPC-H 19 | 3.888 | 7.881 |
109+ | TPC-H 20 | 6.379 | 5.797 |
110+ | TPC-H 21 | 10.287 | 9.806 |
111+ | TPC-H 22 | 1.573 | 1.122 |
112+ | ** 总时间** | ** 138s** | ** 124s** |
113+ | ** 总成本** | ** $0.15** | ** $0.07** |
113114
114115## 重现基准测试
115116
116117您可以按照以下步骤重现基准测试。
117118
118119### 基准测试环境
119120
120- Snowflake 和 Databend Cloud 均在类似条件下进行了测试 :
121+ Snowflake 和 Databend Cloud 均在相似条件下进行了测试 :
121122
122- | 参数 | Snowflake | Databend Cloud |
123- | ------------ | ------------------------------------------------------------------- | ----------------------------------------- |
123+ | 参数 | Snowflake | Databend Cloud |
124+ | -------------- | ------------------------------------------------------------------- | ----------------------------------------- |
124125| 计算集群大小 | Small | Small |
125- | vCPU | 16 | 16 |
126- | 价格 | [ $4/小时] ( https://www.snowflake.com/en/data-cloud/pricing-options/ ) | [ $2/小时] ( https://www.databend.com/plan/ ) |
127- | AWS 区域 | us-east-2 | us-east-2 |
128- | 存储 | AWS S3 | AWS S3 |
126+ | 价格 | [ $4/小时] ( https://www.snowflake.com/en/data-cloud/pricing-options/ ) | [ $2/小时] ( https://www.databend.com/plan/ ) |
127+ | AWS 区域 | us-east-2 | us-east-2 |
128+ | 存储 | AWS S3 | AWS S3 |
129129
130- - TPC-H SF100 数据集来自 [ Amazon Redshift] ( https://github.com/awslabs/amazon-redshift-utils/tree/master/src/CloudDataWarehouseBenchmark/Cloud-DWB-Derived-from-TPCH ) ,已加载到 Databend Cloud 和 Snowflake 中,未进行任何特定调整。
130+ - TPC-H SF100 数据集来源于 [ Amazon Redshift] ( https://github.com/awslabs/amazon-redshift-utils/tree/master/src/CloudDataWarehouseBenchmark/Cloud-DWB-Derived-from-TPCH ) ,已加载到 Databend Cloud 和 Snowflake 中,未进行任何特定调整。
131131
132132### 基准测试方法
133133
134- 我们对查询执行进行了冷热运行 :
134+ 我们对查询执行进行了冷启动和热启动两种方式 :
135135
1361361 . ** 冷启动** : 在执行查询之前,数仓被暂停并恢复。
137- 2 . ** 热启动** : 数仓未暂停 ,使用本地磁盘缓存。
137+ 2 . ** 热启动** : 数仓未被暂停 ,使用本地磁盘缓存。
138138
139139### 前提条件
140140
141- - 拥有一个 [ Snowflake 帐户 ] ( https://singup.snowflake.com )
142- - 创建一个 [ Databend Cloud 帐户 ] ( https://www.databend.com/apply/ ) 。
141+ - 拥有一个 [ Snowflake 账户 ] ( https://singup.snowflake.com )
142+ - 创建一个 [ Databend Cloud 账户 ] ( https://www.databend.com/apply/ ) 。
143143
144144### 数据加载
145145
1461461 . ** Snowflake 数据加载** :
147147
148- - 登录您的 [ Snowflake 帐户 ] ( https://app.snowflake.com/ ) 。
148+ - 登录您的 [ Snowflake 账户 ] ( https://app.snowflake.com/ ) 。
149149 - 创建与 TPC-H 模式对应的表。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/setup.sql#L1-L84 ) 。
150150 - 使用 ` COPY INTO ` 命令从 AWS S3 加载数据。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/setup.sql#L87-L94 ) 。
151151
1521522 . ** Databend Cloud 数据加载** :
153- - 登录您的 [ Databend Cloud 帐户 ] ( https://app.databend.com ) 。
153+ - 登录您的 [ Databend Cloud 账户 ] ( https://app.databend.com ) 。
154154 - 按照 TPC-H 模式创建必要的表。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/setup.sql#L1-L84 ) 。
155155 - 使用类似于 Snowflake 的方法从 AWS S3 加载数据。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/setup.sql#L87-L117 ) 。
156156
157157### TPC-H 查询
158158
1591591 . ** Snowflake 查询** :
160160
161- - 登录您的 [ Snowflake 帐户 ] ( https://app.snowflake.com/ ) 。
161+ - 登录您的 [ Snowflake 账户 ] ( https://app.snowflake.com/ ) 。
162162 - 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/snow/queries.sql ) 。
163163
1641642 . ** Databend Cloud 查询** :
165- - 登录您的 [ Databend Cloud 帐户 ] ( https://app.databend.com ) 。
166- - 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/queries.sql ) 。
165+ - 登录您的 [ Databend Cloud 账户 ] ( https://app.databend.com ) 。
166+ - 运行 TPC-H 查询。[ SQL 脚本] ( https://github.com/databendlabs/wizard/blob/b34cc686d2e43c3e3b0b3311eac5a50e8f68afc9/benchsb/sql/bend/queries.sql ) 。
0 commit comments