Skip to content

Commit df1b7f6

Browse files
AI Translate 51-ai-functions to Simplified-Chinese (#2576)
* [INIT] Start translation to Simplified-Chinese * 🌐 Translate 01-external-functions.md to Simplified-Chinese * 🌐 Translate 01-external-functions.md to Simplified-Chinese * 🌐 Translate 01-external-functions.md to Simplified-Chinese * 🌐 Translate 01-external-functions.md to Simplified-Chinese --------- Co-authored-by: github-actions[bot] <github-actions[bot]@users.noreply.github.com> Co-authored-by: Bohu <[email protected]>
1 parent e6d1cfb commit df1b7f6

File tree

5 files changed

+104
-86
lines changed

5 files changed

+104
-86
lines changed

.translation-init

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1 +1 @@
1-
Translation initialization: 2025-08-05T04:34:43.246797
1+
Translation initialization: 2025-08-05T06:10:48.524250
Lines changed: 28 additions & 25 deletions
Original file line numberDiff line numberDiff line change
@@ -1,63 +1,67 @@
1-
# 用于自定义 AI/ML 的外部函数
1+
---
2+
title: 使用外部函数实现自定义 AI/ML
3+
---
24

3-
对于高级 AI/ML 场景,Databend 支持外部函数,可以将您的数据与使用 Python 等语言编写的自定义 AI/ML 基础设施连接起来。
5+
# 使用外部函数实现自定义 AI/ML
46

5-
| 功能 | 描述 | 优势 |
7+
对于高级 AI/ML 场景,Databend 支持外部函数(External Function),可将您的数据与使用 Python 等语言编写的自定义 AI/ML 基础设施连接起来。
8+
9+
| 特性 | 描述 | 优势 |
610
|---------|-------------|----------|
7-
| **模型灵活性** | 使用开源模型或您内部的 AI/ML 基础设施 | • 自由选择任何模型<br/>• 利用现有的 ML 投资<br/>• 随时掌握最新的 AI 进展 |
8-
| **GPU 加速** | 在配备 GPU 的机器上部署外部函数服务器 |更快地进行深度学习模型推理<br/>• 处理更大的批量大小<br/>• 支持计算密集型工作负载 |
11+
| **模型灵活性** | 使用开源模型或您内部的 AI/ML 基础设施 | • 自由选择任何模型<br/>• 利用现有的 ML 投资<br/>• 紧跟最新的 AI 发展 |
12+
| **GPU 加速** | 在配备 GPU 的机器上部署外部函数服务器 |加快深度学习模型的推理速度<br/>• 处理更大的批处理大小<br/>• 支持计算密集型工作负载 |
913
| **自定义 ML 模型** | 部署和使用您自己的机器学习模型 | • 专有算法<br/>• 领域特定模型<br/>• 针对您的数据进行微调 |
10-
| **高级 AI 管道** | 使用专用库构建复杂的 AI 工作流程 |多步骤处理<br/>• 自定义转换<br/>• 与 ML 框架集成 |
11-
| **可扩展性** | 在 Databend 之外处理资源密集型 AI 操作 | • 独立扩展<br/>• 优化资源分配<br/>• 高吞吐量处理 |
14+
| **高级 AI Pipeline(流水线)** | 使用专业库构建复杂的 AI 工作流 |多步处理<br/>• 自定义转换<br/>• 与 ML 框架集成 |
15+
| **可扩展性** | 在 Databend 外部处理资源密集型 AI 操作 | • 独立扩展<br/>• 优化资源分配<br/>• 高吞吐量处理 |
1216

1317
## 实现概述
1418

15-
1. 使用您的 AI/ML 代码(带有 [databend-udf](https://pypi.org/project/databend-udf) 的 Python)创建一个外部服务器
16-
2. 使用 `CREATE FUNCTION` Databend 注册服务器
17-
3. 直接在 SQL 查询中调用您的 AI/ML 函数
19+
1. 使用您的 AI/ML 代码(Python 配合 [databend-udf](https://pypi.org/project/databend-udf))创建一个外部服务器
20+
2. 使用 `CREATE FUNCTION` Databend 中注册该服务器
21+
3. SQL 查询中直接调用您的 AI/ML 函数
1822

1923
## 示例:自定义 AI 模型集成
2024

2125
```python
22-
# Simple embedding UDF server demo
26+
# 简单的嵌入 UDF 服务器演示
2327
from databend_udf import udf, UDFServer
2428
from sentence_transformers import SentenceTransformer
2529

26-
# Load pre-trained model
27-
model = SentenceTransformer('all-mpnet-base-v2') # 768-dimensional vectors
30+
# 加载预训练模型
31+
model = SentenceTransformer('all-mpnet-base-v2') # 768 维向量
2832

2933
@udf(
3034
input_types=["STRING"],
3135
result_type="ARRAY(FLOAT)",
3236
)
3337
def ai_embed_768(inputs: list[str], headers) -> list[list[float]]:
34-
"""Generate 768-dimensional embeddings for input texts"""
38+
"""为输入文本生成 768 维嵌入"""
3539
try:
36-
# Process inputs in a single batch
40+
# 在单个批次中处理输入
3741
embeddings = model.encode(inputs)
38-
# Convert to list format
42+
# 转换为列表格式
3943
return [embedding.tolist() for embedding in embeddings]
4044
except Exception as e:
41-
print(f"Error generating embeddings: {e}")
42-
# Return empty lists in case of error
45+
print(f"生成嵌入时出错:{e}")
46+
# 如果出错,则返回空列表
4347
return [[] for _ in inputs]
4448

4549
if __name__ == '__main__':
46-
print("Starting embedding UDF server on port 8815...")
50+
print("正在端口 8815 上启动嵌入 UDF 服务器...")
4751
server = UDFServer("0.0.0.0:8815")
4852
server.add_function(ai_embed_768)
4953
server.serve()
5054
```
5155

5256
```sql
53-
-- Register the external function in Databend
57+
-- Databend 中注册外部函数
5458
CREATE OR REPLACE FUNCTION ai_embed_768 (STRING)
5559
RETURNS ARRAY(FLOAT)
5660
LANGUAGE PYTHON
5761
HANDLER = 'ai_embed_768'
5862
ADDRESS = 'https://your-ml-server.example.com';
5963

60-
-- Use the custom embedding in queries
64+
-- 在查询中使用自定义嵌入
6165
SELECT
6266
id,
6367
title,
@@ -70,8 +74,7 @@ ORDER BY similarity ASC
7074
LIMIT 5;
7175
```
7276

73-
有关设置外部函数的详细说明,请参阅 [外部函数](/guides/query/external-function)
74-
75-
## 开始使用
77+
## 后续步骤
7678

77-
[Databend Cloud](https://databend.com) 上通过免费试用体验这些 AI 功能。
79+
1. **[外部函数指南](/guides/query/external-function)** - 详细的设置说明
80+
2. **[Databend Cloud](https://databend.cn)** - 免费试用 AI 函数
Lines changed: 17 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,19 @@
1-
# Databend AI 和 ML
1+
# Databend 中的 AI 函数
22

3-
Databend 提供了两种 AI 和 ML 集成方法:
3+
Databend 通过外部函数(External Function)提供 AI 和 ML 功能,允许您集成自定义 AI 模型并利用先进的 ML 基础设施,同时确保数据隐私与可控性。
44

5-
| 方法 | 特性 | 使用场景 |
6-
|----------|----------|-----------|
7-
| **[外部函数](01-external-functions.md)***推荐* | • 自定义模型<br/>• GPU 部署<br/>• 自定义管道<br/>• 数据隐私 | • 专业领域<br/>• 高性能<br/>• 隐私要求 |
8-
| **[内置函数](02-built-in-functions.md)** | • 文本补全<br/>• 嵌入<br/>• Vector 操作<br/>• 零设置 | • 快速原型设计<br/>• 通用 NLP<br/>• 简单实现 |
5+
## 外部函数(External Function)- 推荐方案
6+
7+
外部函数(External Function)能够将您的数据与自定义 AI/ML 基础设施连接,为 AI 工作负载提供最大的灵活性和性能。
8+
9+
| 特性 | 优势 |
10+
|---------|----------|
11+
| **自定义模型** | 使用任何开源或专有的 AI/ML 模型 |
12+
| **GPU 加速** | 部署在配备 GPU 的机器上以加快推理速度 |
13+
| **数据隐私** | 将数据保留在您的基础设施内 |
14+
| **可扩展性** | 独立扩展与资源优化 |
15+
| **灵活性** | 支持任何编程语言和 ML 框架 |
16+
17+
## 快速入门
18+
19+
**[外部函数指南](01-external-functions.md)** - 学习如何通过实践示例和实施指导创建并部署自定义 AI 函数。

docs/cn/release-notes/94-v1.2.0.md

Lines changed: 22 additions & 22 deletions
Original file line numberDiff line numberDiff line change
@@ -1,50 +1,50 @@
11
---
2-
title: v1.2 系列版本的新特性
2+
title: v1.2 系列版本新功能
33
sidebar_label: v1.2
4-
description: Databend v1.2 系列的发布说明
4+
description: Databend v1.2 系列版本发布说明
55
---
66

7-
Databend v1.2 2023 年 6 月 29 日正式发布!感谢所有参与的社区伙伴以及为 Databend 做出贡献的每一个人
7+
Databend v1.2 已于 2023 年 6 月 29 日正式发布!感谢所有参与的社区伙伴,以及为让 Databend 变得更好而做出贡献的每一个人
88

9-
要了解更多关于此版本的信息,请参阅这篇 [博客文章](https://www.databend.com/blog/databend-changelog-1-2) 以获取详细信息。您也可以在 [GitHub](https://github.com/databendlabs/databend/releases/tag/v1.2.0-nightly) 上找到此版本的完整更新日志。
9+
要了解有关此版本的更多信息,请参阅这篇[博客文章](https://www.databend.cn/blog/databend-changelog-1-2)以获取详细信息。您还可以在 [GitHub](https://github.com/databendlabs/databend/releases/tag/v1.2.0-nightly) 上找到此版本的完整更新日志。
1010

1111
## 新功能与增强
1212

1313
- [新数据类型:`BITMAP`](/sql/sql-reference/data-types/bitmap)
1414
- [使用列位置直接查询 CSV/TSV/NDJSON 文件](/sql/sql-commands/query-syntax/query-select#column-position)
15-
- [新哈希表:提升哈希连接性能](https://github.com/databendlabs/databend/pull/11140)
16-
- [AI 函数](/sql/sql-functions/ai-functions/)
15+
- [新哈希表:提升哈希连接(Hash Join)性能](https://github.com/databendlabs/databend/pull/11140)
16+
- [AI 函数](/guides/ai-functions/) - 用于自定义 AI/ML 集成的外部函数
1717

18-
## 企业级功能
18+
## 企业版功能
1919

20-
- [计算列](/sql/sql-commands/ddl/table/ddl-create-table#computed-columns)
20+
- [计算列(Computed Columns)](/sql/sql-commands/ddl/table/ddl-create-table#computed-columns)
2121
- [VACUUM TABLE](/sql/sql-commands/ddl/table/vacuum-table)
2222
- 无服务器后台服务
2323

24-
## 不断壮大的生态系统
24+
## 不断发展的生态系统
2525

2626
- [`databend` 绑定到 Python](https://pypi.org/project/databend/)
2727
- [BendSQL - Databend 原生命令行工具](/guides/sql-clients/bendsql)
2828
- 数据集成与商业智能:
2929
- Apache DolphinScheduler
3030
- [Apache Flink CDC](/guides/load-data/load-db/flink-cdc)
31-
- [Tableau](https://www.databend.com/blog/2023-06-01-tableau)
31+
- [Tableau](https://www.databend.cn/blog/2023-06-01-tableau)
3232

3333
## 新贡献者
3434

35-
- @neil4dong[#11043](https://github.com/databendlabs/databend/pull/11043) 中首次贡献
36-
- @JackTan25[#11290](https://github.com/databendlabs/databend/pull/11290) 中首次贡献
37-
- @Mehrbod2002[#11367](https://github.com/databendlabs/databend/pull/11367) 中首次贡献
38-
- @DongHaowen[#11362](https://github.com/databendlabs/databend/pull/11362) 中首次贡献
39-
- @silver-ymz[#11487](https://github.com/databendlabs/databend/pull/11487) 中首次贡献
40-
- @Jake-00[#11503](https://github.com/databendlabs/databend/pull/11503) 中首次贡献
41-
- @gitccl[#11507](https://github.com/databendlabs/databend/pull/11507) 中首次贡献
42-
- @ZhengLin-Li[#11563](https://github.com/databendlabs/databend/pull/11563) 中首次贡献
43-
- @jonahgao[#11718](https://github.com/databendlabs/databend/pull/11718) 中首次贡献
44-
- @akoshchiy[#11783](https://github.com/databendlabs/databend/pull/11783) 中首次贡献
35+
- @neil4dong[#11043](https://github.com/databendlabs/databend/pull/11043) 中做出了他们的首次贡献
36+
- @JackTan25[#11290](https://github.com/databendlabs/databend/pull/11290) 中做出了他们的首次贡献
37+
- @Mehrbod2002[#11367](https://github.com/databendlabs/databend/pull/11367) 中做出了他们的首次贡献
38+
- @DongHaowen[#11362](https://github.com/databendlabs/databend/pull/11362) 中做出了他们的首次贡献
39+
- @silver-ymz[#11487](https://github.com/databendlabs/databend/pull/11487) 中做出了他们的首次贡献
40+
- @Jake-00[#11503](https://github.com/databendlabs/databend/pull/11503) 中做出了他们的首次贡献
41+
- @gitccl[#11507](https://github.com/databendlabs/databend/pull/11507) 中做出了他们的首次贡献
42+
- @ZhengLin-Li[#11563](https://github.com/databendlabs/databend/pull/11563) 中做出了他们的首次贡献
43+
- @jonahgao[#11718](https://github.com/databendlabs/databend/pull/11718) 中做出了他们的首次贡献
44+
- @akoshchiy[#11783](https://github.com/databendlabs/databend/pull/11783) 中做出了他们的首次贡献
4545

4646
## 立即试用 Databend!
4747

48-
点击 [这里](https://github.com/databendlabs/databend/releases/tag/v1.2.0-nightly) 打开 GitHub 上的发布页面,然后选择并下载适合您平台的版本。
48+
点击[此处](https://github.com/databendlabs/databend/releases/tag/v1.2.0-nightly)打开 GitHub 上的发布页面,然后选择并下载适合您平台的版本。
4949

50-
要部署 Databend,请遵循 [部署指南](/guides/deploy)
50+
要部署 Databend,请遵循[部署指南](/guides/deploy)

docs/cn/sql-reference/20-sql-functions/index.md

Lines changed: 36 additions & 32 deletions
Original file line numberDiff line numberDiff line change
@@ -2,68 +2,72 @@
22
title: SQL 函数参考
33
---
44

5-
本页按类别提供了 Databend 中所有可用 SQL 函数的参考
5+
Databend 为所有类型的数据处理提供了全面的 SQL 函数。函数按重要性和使用频率进行组织
66

7-
## 核心 SQL 函数
7+
## 核心数据函数
88

99
| 类别 | 描述 |
1010
|----------|-------------|
11-
| [数值函数](./04-numeric-functions/index.md) | 用于数值数据处理和分析的数学运算 |
12-
| [字符串函数](./06-string-functions/index.md) | 用于数据处理的文本操作和模式匹配运算 |
13-
| [日期和时间函数](./05-datetime-functions/index.md) | 用于时序数据分析的日期和时间操作 |
14-
| [聚合函数](./07-aggregate-functions/index.md) | 对多行数据执行计算的函数 |
15-
| [窗口函数](./08-window-functions/index.md) | 对与当前行相关的一组行进行操作的函数 |
11+
| [数值函数](./04-numeric-functions/index.md) | 数学运算和计算 |
12+
| [字符串函数](./06-string-functions/index.md) | 文本操作和字符串处理 |
13+
| [日期和时间函数](./05-datetime-functions/index.md) | 日期、时间和时态操作 |
14+
| [时间间隔函数](./05-interval-functions/index.md) | 时间单位转换和时间间隔创建 |
15+
| [转换函数](./02-conversion-functions/index.md) | 类型转换和数据格式转换 |
16+
| [条件函数](./03-conditional-functions/index.md) | 逻辑和控制流操作 |
1617

17-
## 数据类型函数
18+
## 分析函数
1819

1920
| 类别 | 描述 |
2021
|----------|-------------|
21-
| [转换函数](./02-conversion-functions/index.md) | 不同数据类型之间的类型转换和强制转换操作 |
22-
| [结构化和半结构化函数](./10-semi-structured-functions/index.md) | 用于处理 JSON、数组、对象、映射和其他结构化数据类型的函数 |
22+
| [聚合函数](./07-aggregate-functions/index.md) | 跨多行的统计计算 |
23+
| [窗口函数](./08-window-functions/index.md) | 使用窗口操作进行高级分析 |
24+
| [位图函数](./01-bitmap-functions/index.md) | 高性能位图操作和分析 |
2325

24-
## 逻辑和控制函数
26+
## 半结构化数据
2527

2628
| 类别 | 描述 |
2729
|----------|-------------|
28-
| [条件函数](./03-conditional-functions/index.md) | 基于逻辑的数据转换和流控制函数 |
29-
| [间隔函数](./05-interval-functions/index.md) | 创建和操作用于日期计算的时间间隔 |
30+
| [半结构化函数](./10-semi-structured-functions/index.md) | JSON、数组、对象和嵌套数据处理 |
3031

31-
## 系统和元数据函数
32+
## AI 与搜索
3233

3334
| 类别 | 描述 |
3435
|----------|-------------|
35-
| [表函数](./17-table-functions/index.md) | 以表的形式返回结果集的函数 |
36-
| [系统函数](./16-system-functions/index.md) | 用于访问系统信息和管理的函数 |
37-
| [上下文函数](./15-context-functions/index.md) | 用于访问会话和环境信息的函数 |
36+
| [向量函数](./11-vector-functions/index.md) | 向量相似度和距离计算 |
37+
| [搜索函数](./10-search-functions/index.md) | 全文搜索和相关性评分 |
38+
39+
## 数据管理
40+
41+
| 类别 | 描述 |
42+
|----------|-------------|
43+
| [表函数](./17-table-functions/index.md) | 文件检查、数据生成和系统信息 |
44+
| [字典函数](./19-dictionary-functions/index.md) | 实时外部数据源查询(MySQL、Redis) |
45+
| [序列函数](./18-sequence-functions/index.md) | 自增序列值生成 |
3846

39-
## 专业分析函数
47+
## 空间函数
4048

4149
| 类别 | 描述 |
4250
|----------|-------------|
4351
| [地理函数](./09-geo-functions/index.md) | 地理坐标和 H3 地理空间操作 |
44-
| [几何函数](./09-geometry-functions/index.md) | 几何形状操作和空间计算 |
45-
| [搜索函数](./10-search-functions/index.md) | 全文搜索功能和文本相关性 |
52+
| [几何函数](./09-geometry-functions/index.md) | 几何形状和空间计算 |
4653

47-
## AI 和向量函数
54+
## 安全与完整性
4855

4956
| 类别 | 描述 |
5057
|----------|-------------|
51-
| [AI 函数](./11-ai-functions/index.md) | 自然语言处理和 AI 功能 |
52-
| [向量函数](./11-vector-functions/index.md) | 向量相似度和距离计算 |
58+
| [哈希函数](./12-hash-functions/index.md) | 数据哈希和完整性验证 |
59+
| [UUID 函数](./13-uuid-functions/index.md) | 通用唯一标识符生成 |
60+
| [IP 地址函数](./14-ip-address-functions/index.md) | 网络地址操作和验证 |
5361

54-
## 数据完整性函数
62+
## 系统函数
5563

5664
| 类别 | 描述 |
5765
|----------|-------------|
58-
| [哈希函数](./12-hash-functions/index.md) | 数据哈希和指纹算法 |
59-
| [UUID 函数](./13-uuid-functions/index.md) | 通用唯一标识符的生成和处理 |
60-
| [IP 地址函数](./14-ip-address-functions/index.md) | IP 地址操作和转换 |
61-
| [位图函数](./01-bitmap-functions/index.md) | 位级运算和操作 |
66+
| [系统函数](./16-system-functions/index.md) | 系统信息和管理操作 |
67+
| [上下文函数](./15-context-functions/index.md) | 当前会话、用户和数据库信息 |
6268

63-
## 实用函数
69+
## 开发工具
6470

6571
| 类别 | 描述 |
6672
|----------|-------------|
67-
| [序列函数](./18-sequence-functions/index.md) | 序列生成和操作 |
68-
| [字典函数](./19-dictionary-functions/index.md) | 外部数据源集成 |
69-
| [测试函数](./19-test-functions/index.md) | 用于测试和开发目的的函数 |
73+
| [测试函数](./19-test-functions/index.md) | 测试和调试工具 |

0 commit comments

Comments
 (0)