File tree Expand file tree Collapse file tree 1 file changed +11
-6
lines changed
Expand file tree Collapse file tree 1 file changed +11
-6
lines changed Original file line number Diff line number Diff line change 22title : 查询元数据
33---
44
5- 在本教程中,我们将引导你完成以下步骤 :将示例 Parquet 文件上传到内部 Stage,推断列定义,并创建一个包含文件级别元数据字段的表。当你想要跟踪每一行的来源或在数据集中包含文件名和行号等元数据时 ,这将非常有用。
5+ 在本教程中,我们将引导您完成以下步骤 :将示例 Parquet 文件上传到内部 Stage,推断列定义,并创建一个包含文件级别元数据字段的表。当您想要跟踪每一行的来源或在数据集中包含文件名和行号等元数据时 ,这将非常有用。
66
77### 开始之前
88
9- 在开始之前,请确保你已准备好以下先决条件 :
9+ 在开始之前,请确保您已准备好以下先决条件 :
1010
11- - [ 下载示例数据集] ( https://datasets.databend.com/iris.parquet ) 并将其保存到你的本地文件夹 。
12- - BendSQL 已安装在你的本地机器上 。有关如何使用各种包管理器安装 BendSQL 的说明,请参阅 [ 安装 BendSQL] ( /guides/sql-clients/bendsql/#installing-bendsql ) 。
11+ - [ 下载示例数据集] ( https://datasets.databend.com/iris.parquet ) 并将其保存到您的本地文件夹 。
12+ - BendSQL 已安装在您的本地机器上 。有关如何使用各种包管理器安装 BendSQL 的说明,请参阅 [ 安装 BendSQL] ( /guides/sql-clients/bendsql/#installing-bendsql ) 。
1313
1414### 步骤 1:创建一个内部 Stage
1515
@@ -19,7 +19,7 @@ CREATE STAGE my_internal_stage;
1919
2020### 步骤 2:使用 BendSQL 上传示例文件
2121
22- 假设你的示例数据集位于 ` /Users/eric/Documents/iris.parquet ` ,请在 BendSQL 中运行以下命令将其上传到 Stage:
22+ 假设您的示例数据集位于 ` /Users/eric/Documents/iris.parquet ` ,请在 BendSQL 中运行以下命令将其上传到 Stage:
2323
2424``` sql
2525PUT fs:/// Users/ eric/ Documents/ iris .parquet @my_internal_stage;
@@ -34,6 +34,11 @@ PUT fs:///Users/eric/Documents/iris.parquet @my_internal_stage;
3434```
3535
3636### 步骤 3:从暂存文件中查询列定义
37+ ::: caution
38+
39+ ` infer_schema ` 目前仅支持 parquet 文件格式。
40+
41+ :::
3742
3843``` sql
3944SELECT * FROM INFER_SCHEMA(location => ' @my_internal_stage/iris.parquet' );
@@ -54,7 +59,7 @@ SELECT * FROM INFER_SCHEMA(location => '@my_internal_stage/iris.parquet');
5459
5560### 步骤 4:使用元数据字段预览文件内容
5661
57- 你可以使用 ` metadata$filename ` 和 ` metadata$file_row_number ` 等元数据字段来检查文件级别的信息:
62+ 您可以使用 ` metadata$filename ` 和 ` metadata$file_row_number ` 等元数据字段来检查文件级别的信息:
5863
5964``` sql
6065SELECT
You can’t perform that action at this time.
0 commit comments