Skip to content

Commit 06614b0

Browse files
💬Generate LLM translations (#2215)
Co-authored-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com>
1 parent 61652b3 commit 06614b0

File tree

15 files changed

+226
-197
lines changed

15 files changed

+226
-197
lines changed

docs/cn/guides/40-load-data/01-load/index.md

Lines changed: 18 additions & 41 deletions
Original file line numberDiff line numberDiff line change
@@ -2,50 +2,27 @@
22
title: 从文件加载
33
---
44

5-
import DetailsWrap from '@site/src/components/DetailsWrap';
5+
Databend 提供简单、强大的命令来将数据文件加载到表中。大多数操作只需要一个命令。您的数据必须采用[支持的格式](/sql/sql-reference/file-format-options)
66

7-
Databend 提供了多种工具和命令,可以帮助您将数据文件加载到表中。它们中的大多数都很简单,这意味着您只需一个命令即可加载数据。请注意,您的数据文件必须是 Databend 支持的格式之一。有关支持的文件格式的列表,请参见 [输入 & 输出文件格式](/sql/sql-reference/file-format-options)。以下是数据加载和卸载流程及其各自方法的概述。有关详细说明,请参阅本章中的主题。
7+
![数据加载和卸载概述](/img/load/load-unload.jpeg)
88

9-
![Alt text](/img/load/load-unload.jpeg)
9+
## 支持的文件格式
1010

11-
本主题未涵盖所有可用的数据加载方法,但它根据数据文件的存储位置提供了建议。要查找推荐的方法以及指向相应详细信息页面的链接,请切换下面的块:
11+
| 格式 | 类型 | 描述 |
12+
|--------|------|-------------|
13+
| [**CSV**](/guides/load-data/load-semistructured/load-csv), [**TSV**](/guides/load-data/load-semistructured/load-tsv) | 分隔符 | 带有可自定义分隔符的文本文件 |
14+
| [**NDJSON**](/guides/load-data/load-semistructured/load-ndjson) | 半结构化 | JSON 对象,每行一个 |
15+
| [**Parquet**](/guides/load-data/load-semistructured/load-parquet) | 半结构化 | 高效的列式存储格式 |
16+
| [**ORC**](/guides/load-data/load-semistructured/load-orc) | 半结构化 | 高性能列式格式 |
17+
| [**Avro**](/guides/load-data/load-semistructured/load-avro) | 半结构化 | 带有 schema 的紧凑二进制格式 |
1218

13-
<DetailsWrap>
19+
## 按文件位置加载
1420

15-
<details>
16-
<summary>我想加载暂存的数据文件 ...</summary>
17-
<div>
18-
<div>如果您的数据文件位于内部/外部 Stage 或用户 Stage 中,Databend 建议您使用 COPY INTO 命令加载它们。COPY INTO 命令是一个强大的工具,可以快速有效地加载大量数据。</div>
19-
<br/>
20-
<div>要了解有关使用 COPY INTO 命令从 Stage 加载数据的更多信息,请查看 <a href="stage">从 Stage 加载</a> 页面。此页面包含详细的教程,向您展示如何使用该命令从内部/外部 Stage 或用户 Stage 中的示例文件加载数据。</div>
21-
</div>
22-
</details>
21+
选择文件位置以查找推荐的加载方法:
2322

24-
<details>
25-
<summary>我想加载存储桶中的数据文件 ...</summary>
26-
<div>
27-
<div>如果您的数据文件位于对象存储(如 Amazon S3、Google Cloud Storage 和 Microsoft Azure)上的存储桶或容器中,Databend 建议您使用 COPY INTO 命令加载它们。COPY INTO 命令是一个强大的工具,可以快速有效地加载大量数据。</div>
28-
<br/>
29-
<div>要了解有关使用 COPY INTO 命令从存储桶或容器加载数据的更多信息,请查看 <a href="s3">从存储桶加载</a> 页面。此页面包含一个教程,向您展示如何使用该命令从 Amazon S3 存储桶中的示例文件加载数据。</div>
30-
</div>
31-
</details>
32-
33-
<details>
34-
<summary>我想加载本地数据文件 ...</summary>
35-
<div>
36-
<div>如果您的数据文件位于本地系统中,Databend 建议您使用 <a href="https://github.com/databendlabs/BendSQL">BendSQL</a>(Databend 原生 CLI 工具)加载它们,该工具允许您建立与 Databend 的连接并直接从 CLI 窗口执行查询。</div>
37-
<br/>
38-
<div>要了解有关使用 BendSQL 加载本地数据文件的更多信息,请查看 <a href="local">从本地文件加载</a> 页面。此页面包含教程,向您展示如何使用该工具从本地示例文件加载数据。</div>
39-
</div>
40-
</details>
41-
42-
<details>
43-
<summary>我想加载远程数据文件 ...</summary>
44-
<div>
45-
<div>如果您的数据文件是远程数据文件,Databend 建议您使用 COPY INTO 命令加载它们。COPY INTO 命令是一个强大的工具,可以快速有效地加载大量数据。</div>
46-
<br/>
47-
<div>要了解有关使用 COPY INTO 命令加载远程数据文件的更多信息,请查看 <a href="http">从远程文件加载</a> 页面。此页面包含一个教程,向您展示如何使用该命令从远程示例文件加载数据。</div>
48-
</div>
49-
</details>
50-
51-
</DetailsWrap>
23+
| 数据源 | 推荐工具 | 描述 | 文档 |
24+
|-------------|-----------------|-------------|---------------|
25+
| **Stage 数据文件** | **COPY INTO** | 从内部/外部 Stage 或用户 Stage 快速高效加载 | [从 Stage 加载](stage) |
26+
| **云存储** | **COPY INTO** | 从 Amazon S3、Google Cloud Storage、Microsoft Azure 加载 | [从 Bucket 加载](s3) |
27+
| **本地文件** | [**BendSQL**](https://github.com/databendlabs/BendSQL) | Databend 用于本地文件加载的本机 CLI 工具 | [从本地文件加载](local) |
28+
| **远程文件** | **COPY INTO** | 从远程 HTTP/HTTPS 位置加载数据 | [从远程文件加载](http) |

docs/cn/guides/40-load-data/03-load-semistructured/00-load-parquet.md

Lines changed: 12 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -5,13 +5,13 @@ sidebar_label: Parquet
55

66
## 什么是 Parquet?
77

8-
Parquet 是一种列式存储格式,常用于数据分析。它旨在支持复杂的数据结构,并且在处理大型数据集时非常高效
8+
Parquet 是一种列式存储格式,常用于数据分析。它旨在支持复杂数据结构,并且能高效处理大型数据集
99

1010
Parquet 文件对 Databend 最友好。建议使用 Parquet 文件作为 Databend 的数据源。
1111

1212
## 加载 Parquet 文件
1313

14-
加载 Parquet 文件的常见语法如下
14+
加载 Parquet 文件的常用语法如下
1515

1616
```sql
1717
COPY INTO [<database>.]<table_name>
@@ -20,21 +20,22 @@ COPY INTO [<database>.]<table_name>
2020
FILE_FORMAT = (TYPE = PARQUET)
2121
```
2222

23-
有关语法的更多详细信息,请参见 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
23+
- 有关 Parquet 文件格式的更多选项,请参阅 [Parquet 文件格式选项](/sql/sql-reference/file-format-options#parquet-options)
24+
- 有关 COPY INTO table 的更多选项,请参阅 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
2425

2526
## 教程:从 Parquet 文件加载数据
2627

27-
### 步骤 1. 创建一个内部 Stage
28+
### 步骤 1. 创建内部 Stage
2829

29-
创建一个内部 Stage 来存储 Parquet 文件。
30+
创建内部 Stage 以存储 Parquet 文件。
3031

3132
```sql
3233
CREATE STAGE my_parquet_stage;
3334
```
3435

3536
### 步骤 2. 创建 Parquet 文件
3637

37-
使用以下 SQL 语句生成一个 Parquet 文件:
38+
使用以下 SQL 语句生成 Parquet 文件:
3839

3940
```sql
4041
COPY INTO @my_parquet_stage
@@ -47,7 +48,7 @@ FROM (
4748
FILE_FORMAT = (TYPE = PARQUET);
4849
```
4950

50-
验证 Parquet 文件的创建
51+
验证 Parquet 文件是否已创建
5152

5253
```sql
5354
LIST @my_parquet_stage;
@@ -64,7 +65,7 @@ LIST @my_parquet_stage;
6465
└──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
6566
```
6667

67-
有关将数据卸载到 Stage 的更多详细信息,请参见 [COPY INTO location](/sql/sql-commands/dml/dml-copy-into-location)
68+
有关将数据卸载到 Stage 的更多详细信息,请参阅 [COPY INTO location](/sql/sql-commands/dml/dml-copy-into-location)
6869

6970
### 步骤 3:创建目标表
7071

@@ -78,7 +79,7 @@ CREATE TABLE books
7879

7980
### 步骤 4. 直接从 Parquet 复制
8081

81-
要直接从 Parquet 文件将数据复制到表中,请使用以下 SQL 命令:
82+
要将数据直接从 Parquet 文件复制到表中,请使用以下 SQL 命令:
8283

8384
```sql
8485
COPY INTO books
@@ -97,9 +98,9 @@ COPY INTO books
9798
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
9899
```
99100

100-
### 步骤 4(可选)。使用 SELECT 复制数据
101+
### 步骤 4(选项)。使用 SELECT 复制数据
101102

102-
为了获得更多控制,例如在复制时转换数据,请使用 SELECT 语句。有关更多信息,请参见 [`SELECT from Parquet`](../04-transform/00-querying-parquet.md)
103+
为了更好地控制,例如在复制时转换数据,请使用 SELECT 语句。了解更多信息,请参阅 [`SELECT from Parquet`](../04-transform/00-querying-parquet.md)
103104

104105
```sql
105106
COPY INTO books (title, author)

docs/cn/guides/40-load-data/03-load-semistructured/01-load-csv.md

Lines changed: 11 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -1,11 +1,11 @@
11
---
2-
title: 将 CSV 文件加载到 Databend
2+
title: 将 CSV 加载到 Databend
33
sidebar_label: CSV
44
---
55

66
## 什么是 CSV?
77

8-
CSV(逗号分隔值)是一种简单的文件格式,用于存储表格数据,例如电子表格或数据库。CSV 文件是纯文本文件,其中包含表格格式的数据,其中每一行在新行上表示,列由分隔符分隔
8+
CSV(逗号分隔值)是一种简单的文件格式,用于存储表格数据,例如电子表格或数据库。CSV 文件是纯文本文件,其中包含表格格式的数据,每行代表一个新行,列之间用分隔符分隔
99

1010
以下示例显示了一个包含两条记录的 CSV 文件:
1111

@@ -31,13 +31,14 @@ FROM { userStage | internalStage | externalStage | externalLocation }
3131
) ]
3232
```
3333

34-
有关语法的更多详细信息,请参见 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
34+
- 有关更多 CSV 文件格式选项,请参阅 [CSV 文件格式选项](/sql/sql-reference/file-format-options#csv-options)
35+
- 有关更多 COPY INTO table 选项,请参阅 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
3536

3637
## 教程:从 CSV 文件加载数据
3738

38-
### 步骤 1. 创建一个 Internal Stage
39+
### 步骤 1. 创建内部 Stage
3940

40-
创建一个 internal stage 来存储 CSV 文件。
41+
创建内部 Stage 以存储 CSV 文件。
4142

4243
```sql
4344
CREATE STAGE my_csv_stage;
@@ -87,7 +88,7 @@ CREATE TABLE books
8788

8889
### 步骤 4. 直接从 CSV 复制
8990

90-
要直接从 CSV 文件将数据复制到表中,请使用以下 SQL 命令:
91+
要直接从 CSV 文件复制数据到表中,请使用以下 SQL 命令:
9192

9293
```sql
9394
COPY INTO books
@@ -97,7 +98,7 @@ FILE_FORMAT = (
9798
TYPE = CSV,
9899
FIELD_DELIMITER = ',',
99100
RECORD_DELIMITER = '\n',
100-
SKIP_HEADER = 0, -- Skip the first line if it is a header, here we don't have a header
101+
SKIP_HEADER = 0, -- 如果第一行是标题,则跳过,这里我们没有标题
101102
COMPRESSION = AUTO
102103
);
103104
```
@@ -112,9 +113,9 @@ FILE_FORMAT = (
112113
└──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
113114
```
114115

115-
### 步骤 4(可选)。使用 SELECT 复制数据
116+
### 步骤 4(选项)。使用 SELECT 复制数据
116117

117-
为了获得更多控制,例如在复制时转换数据,请使用 SELECT 语句。有关更多信息,请参见 [`SELECT from CSV`](../04-transform/01-querying-csv.md)
118+
为了更好地控制,例如在复制时转换数据,请使用 SELECT 语句。了解更多信息,请参阅 [`SELECT from CSV`](../04-transform/01-querying-csv.md)
118119

119120
```sql
120121
COPY INTO books (title, author)
@@ -127,7 +128,7 @@ FILE_FORMAT = (
127128
TYPE = 'CSV',
128129
FIELD_DELIMITER = ',',
129130
RECORD_DELIMITER = '\n',
130-
SKIP_HEADER = 0, -- Skip the first line if it is a header, here we don't have a header
131+
SKIP_HEADER = 0, -- 如果第一行是标题,则跳过,这里我们没有标题
131132
COMPRESSION = 'AUTO'
132133
);
133134
```

docs/cn/guides/40-load-data/03-load-semistructured/02-load-tsv.md

Lines changed: 11 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -1,11 +1,11 @@
11
---
2-
title: Loading TSV into Databend
2+
title: TSV 文件加载到 Databend
33
sidebar_label: TSV
44
---
55

66
## 什么是 TSV?
77

8-
TSV(制表符分隔值)是一种用于存储表格数据的简单文件格式,例如电子表格或数据库。TSV 文件格式与 CSV 非常相似,记录由换行符分隔,每个字段由制表符分隔
8+
TSV(Tab Separated Values)是一种简单的文件格式,用于存储表格数据,例如电子表格或数据库。TSV 文件格式与 CSV 非常相似,记录之间用换行符分隔,每个字段用制表符分隔
99
以下示例显示了一个包含两条记录的 TSV 文件:
1010

1111
```text
@@ -28,13 +28,14 @@ FROM { userStage | internalStage | externalStage | externalLocation }
2828
) ]
2929
```
3030

31-
有关语法的更多详细信息,请参见 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
31+
- 有关 TSV 文件格式选项的更多信息,请参阅 [TSV 文件格式选项](/sql/sql-reference/file-format-options#tsv-options)
32+
- 有关 COPY INTO table 选项的更多信息,请参阅 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
3233

3334
## 教程:从 TSV 文件加载数据
3435

35-
### 步骤 1. 创建一个 Internal Stage
36+
### 步骤 1. 创建内部 Stage
3637

37-
创建一个 internal stage 来存储 TSV 文件。
38+
创建内部 Stage 以存储 TSV 文件。
3839

3940
```sql
4041
CREATE STAGE my_tsv_stage;
@@ -92,7 +93,7 @@ FROM @my_tsv_stage
9293
PATTERN = '.*[.]tsv'
9394
FILE_FORMAT = (
9495
TYPE = TSV,
95-
SKIP_HEADER = 0, -- 如果第一行是标题,则跳过第一行,这里我们没有标题
96+
SKIP_HEADER = 0, -- 如果是标题,则跳过第一行,这里我们没有标题
9697
COMPRESSION = AUTO
9798
);
9899
```
@@ -107,9 +108,9 @@ FILE_FORMAT = (
107108
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
108109
```
109110

110-
### 步骤 4(可选)。使用 SELECT 复制数据
111+
### 步骤 4(选项)。使用 SELECT 复制数据
111112

112-
为了获得更多控制,例如在复制时转换数据,请使用 SELECT 语句。 [`SELECT from TSV`](../04-transform/02-querying-tsv.md) 了解更多信息
113+
为了获得更多控制,例如在复制时转换数据,请使用 SELECT 语句。了解更多信息,请参阅 [`SELECT from TSV`](../04-transform/02-querying-tsv.md)
113114

114115
```sql
115116
COPY INTO books (title, author)
@@ -120,7 +121,7 @@ FROM (
120121
PATTERN = '.*[.]tsv'
121122
FILE_FORMAT = (
122123
TYPE = 'TSV',
123-
SKIP_HEADER = 0, -- 如果第一行是标题,则跳过第一行,这里我们没有标题
124+
SKIP_HEADER = 0, -- 如果是标题,则跳过第一行,这里我们没有标题
124125
COMPRESSION = 'AUTO'
125126
);
126-
```
127+
```

docs/cn/guides/40-load-data/03-load-semistructured/03-load-ndjson.md

Lines changed: 11 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -5,9 +5,9 @@ sidebar_label: NDJSON
55

66
## 什么是 NDJSON?
77

8-
NDJSON 构建于 JSON 之上,是 JSON 的严格子集。每一行必须包含一个单独的、自包含的有效 JSON 对象。
8+
NDJSON 构建于 JSON 之上,是 JSON 的严格子集。每行必须包含一个单独的、自包含的有效 JSON 对象。
99

10-
以下示例展示了一个包含两个 JSON 对象的 NDJSON 文件:
10+
以下示例显示了一个包含两个 JSON 对象的 NDJSON 文件:
1111

1212
```text
1313
{"title":"Title_0","author":"Author_0"}
@@ -16,7 +16,7 @@ NDJSON 构建于 JSON 之上,是 JSON 的严格子集。每一行必须包含
1616

1717
## 加载 NDJSON 文件
1818

19-
加载 NDJSON 文件的常见语法如下
19+
加载 NDJSON 文件的常用语法如下
2020

2121
```sql
2222
COPY INTO [<database>.]<table_name>
@@ -28,21 +28,22 @@ FROM { userStage | internalStage | externalStage | externalLocation }
2828
) ]
2929
```
3030

31-
有关语法的更多详细信息,请参见 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
31+
- 有关更多 NDJSON 文件格式选项,请参阅 [NDJSON 文件格式选项](/sql/sql-reference/file-format-options#ndjson-options)
32+
- 有关更多 COPY INTO table 选项,请参阅 [COPY INTO table](/sql/sql-commands/dml/dml-copy-into-table)
3233

3334
## 教程:从 NDJSON 文件加载数据
3435

35-
### 步骤 1. 创建一个内部 Stage
36+
### 步骤 1. 创建内部 Stage
3637

37-
创建一个内部 Stage 来存储 NDJSON 文件。
38+
创建内部 Stage 以存储 NDJSON 文件。
3839

3940
```sql
4041
CREATE STAGE my_ndjson_stage;
4142
```
4243

4344
### 步骤 2. 创建 NDJSON 文件
4445

45-
使用以下 SQL 语句生成一个 NDJSON 文件:
46+
使用以下 SQL 语句生成 NDJSON 文件:
4647

4748
```sql
4849
COPY INTO @my_ndjson_stage
@@ -84,7 +85,7 @@ CREATE TABLE books
8485

8586
### 步骤 4. 直接从 NDJSON 复制
8687

87-
要直接从 NDJSON 文件将数据复制到您的表中,请使用以下 SQL 命令:
88+
要将数据直接从 NDJSON 文件复制到表中,请使用以下 SQL 命令:
8889

8990
```sql
9091
COPY INTO books
@@ -105,9 +106,9 @@ FILE_FORMAT = (
105106
└──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
106107
```
107108

108-
### 步骤 4(可选)。使用 SELECT 复制数据
109+
### 步骤 4(选项)。使用 SELECT 复制数据
109110

110-
为了获得更多控制,例如在复制时转换数据,请使用 SELECT 语句。 [`SELECT from NDJSON`](../04-transform/03-querying-ndjson.md) 了解更多信息
111+
为了更好地控制,例如在复制时转换数据,请使用 SELECT 语句。了解更多信息,请参阅 [`SELECT from NDJSON`](../04-transform/03-querying-ndjson.md)
111112

112113
```sql
113114
COPY INTO books(title, author)

0 commit comments

Comments
 (0)