Skip to content

Commit f12d044

Browse files
Update documentation: Refined title in prompt engineering section, added detailed guidelines for prompt design, and removed outdated model acquisition content.
1 parent 1effff1 commit f12d044

File tree

2 files changed

+203
-16
lines changed

2 files changed

+203
-16
lines changed

docs/docs/机器学习/大语言模型部署/提示词工程.md

Lines changed: 173 additions & 8 deletions
Original file line numberDiff line numberDiff line change
@@ -1,6 +1,6 @@
11
---
22
sidebar_position: 3
3-
title: 🚧提示词工程
3+
title: 提示词工程
44
---
55

66
## 提示词工程
@@ -9,17 +9,182 @@ title: 🚧提示词工程
99

1010
提示词工程有一套通用的方法论,但是基于不同的模型效果会有所不同,现在的模型更新迭代又很快,因此需要牢记原理,在实践中不断调整自己对提示词的理解。推荐文档:[https://www.promptingguide.ai/zh](https://www.promptingguide.ai/zh)
1111

12+
### 提示词要素
1213

14+
1. **任务描述**:简明清晰地描述任务。
15+
2. **上下文信息**:提供相关背景信息提升准确性。
16+
3. **示例输入/输出**:为模型提供具体案例指导生成内容。
17+
4. **输出格式要求**:通过明确格式控制输出结构。
1318

14-
### 练习
19+
---
20+
21+
### 设计提示的通用技巧
22+
23+
1. **清晰性**:使用准确的语言表达需求。
24+
2. **分解任务**:将复杂任务拆分为多个步骤。
25+
3. **逐步引导**:通过示例或分步推理帮助模型理解任务。
26+
4. **动态调整**:根据输出效果优化提示内容。
27+
28+
---
29+
30+
### 提示技术
31+
32+
#### 零样本提示(Zero-shot Prompting)
33+
**示例**:
34+
```
35+
将以下句子翻译为英语:
36+
我喜欢学习提示工程。
37+
```
38+
39+
#### 少样本提示(Few-shot Prompting)
40+
**示例**:
41+
```
42+
示例:
43+
输入:天气如何?
44+
输出:今天的天气是晴天。
45+
46+
输入:有什么新闻?
47+
输出:今天的新闻是股票市场上涨。
48+
49+
任务:
50+
输入:我们什么时候出发?
51+
输出:
52+
```
53+
54+
#### 链式思考提示(Chain-of-Thought, CoT)
55+
**示例**:
56+
```
57+
问题:如果有10个橙子,卖掉了3个,又买了5个,现在有多少个橙子?
58+
请逐步说明计算过程并给出答案。
59+
```
60+
61+
#### 自我一致性(Self-consistency)
62+
**示例**:
63+
```
64+
问题:一个人有50元,他花了30元买书,又花了10元买文具,还剩多少钱?
65+
请给出答案并解释理由。
66+
```
67+
68+
#### 生成知识提示(Knowledge Generation Prompting)
69+
**示例**:
70+
```
71+
请为以下主题生成一段背景知识:量子计算的基本原理。
72+
```
73+
74+
#### Prompt Chaining
75+
**示例**:
76+
```
77+
请总结以下文章的主要内容:
78+
[文章文本]
79+
```
80+
```
81+
根据以上总结,请生成一段详细解释。
82+
```
83+
84+
#### 思维树提示(Tree-of-Thought, ToT)
85+
**示例**:
86+
```
87+
一个人开车去A地需要40分钟,走路需要2小时。他选择开车出发,但在半路遇到堵车,延误了30分钟。他用了多长时间到达A地?
88+
请给出所有可能的推理路径并选择答案。
89+
```
90+
91+
#### 检索增强生成(Retrieval-Augmented Generation, RAG)
92+
**示例**:
93+
```
94+
根据以下文档内容回答问题:
95+
[检索内容]
96+
问题:量子计算的优势是什么?
97+
```
98+
99+
#### 自动推理并使用工具(ART)
100+
**示例**:
101+
```
102+
请计算3的5次方是多少?
103+
如果需要,可以调用计算器。
104+
```
105+
106+
#### Reflexion
107+
**示例**:
108+
```
109+
问题:5的平方是多少?
110+
模型第一次输出:20
111+
模型反思:答案不对,因为5*5=25
112+
最终答案:25
113+
```
114+
115+
---
116+
117+
### 高阶提示技术
118+
119+
#### 自动提示工程师
120+
**示例**:
121+
```
122+
模型:请为以下任务生成高效的提示:
123+
任务:将200条用户评论按情感分类为正面或负面。
124+
```
125+
126+
#### Active-Prompt
127+
**示例**:
128+
```
129+
当前任务是识别文本中的关键实体:
130+
第一步,识别所有专有名词;
131+
第二步,判断其是否为人名。
132+
```
15133

16-
| 目标 | 数据 | 期望结果 | 推荐提示词 |
17-
| ---------------- | ---- | -------- | ---------- |
18-
| 提取地点 | 数据 | | <details><summary>点击查看</summary>提示词内容1</details> |
19-
| 提取地点 | 数据 | | <details><summary>点击查看</summary>提示词内容2</details> |
20-
| 指定返回指定格式 | 数据 | | <details><summary>点击查看</summary>提示词内容3</details> |
21-
| 指定返回指定格式 | 数据 | | <details><summary>点击查看</summary>提示词内容4</details> |
134+
#### 方向性刺激提示
135+
**示例**:
136+
```
137+
如果我是一个市场分析师,我会如何描述近期经济趋势?
138+
请从分析师角度回答问题。
139+
```
140+
141+
#### Program-Aided Language Models
142+
**示例**:
143+
```
144+
编写Python代码计算圆的面积:
145+
输入:半径为3
146+
输出:
147+
```
148+
149+
#### ReAct框架
150+
**示例**:
151+
```
152+
问题:世界上最高的山是什么?
153+
行动:查询数据库
154+
思考:我需要确认山的名称和高度。
155+
最终答案:
156+
```
157+
158+
#### Reflexion
159+
**示例**:
160+
```
161+
第一次尝试:模型输出错误原因分析;
162+
第二次尝试:修正提示后生成正确结果。
163+
```
164+
165+
#### 多模态思维链提示方法
166+
**示例**:
167+
```
168+
根据以下图片生成描述:
169+
[插入图片]
170+
描述应包含颜色、位置和物体。
171+
```
22172

173+
#### 基于图的提示
174+
**示例**:
175+
```
176+
以下是社会关系图:
177+
- Alice -> Bob (朋友)
178+
- Bob -> Charlie (同事)
179+
任务:找出Alice与Charlie之间的关系。
180+
```
181+
182+
#### meta-prompting
183+
**示例**:
184+
```
185+
任务:设计一个提示来解释meta-prompting的概念。
186+
提示应包括定义和应用场景。
187+
```
23188

24189
## 安全挑战
25190

Lines changed: 30 additions & 8 deletions
Original file line numberDiff line numberDiff line change
@@ -1,13 +1,13 @@
11
---
22
sidebar_position: 1
3-
title: 🚧模型获取
3+
title: 模型社区
44
---
55

66
## 开源社区
77

88
大模型社区是指围绕大型深度学习模型(如 GPT 系列、BERT、T5 等)构建的开放协作平台和生态系统。这些社区由研究人员、开发者、数据科学家、工程师及爱好者组成,他们共同致力于大模型的研究、开发、优化和应用。
99

10-
现在模型非常多,各有千秋,且更新迭代非常快。下面的表格列出了部分公司及其z主要大模型代号
10+
现在模型非常多,各有千秋,且更新迭代非常快。下面的表格列出了部分公司及其主要大模型代号
1111

1212
| **公司名称** | **大模型代号** |
1313
| ----------------------------- | ------------------- |
@@ -99,14 +99,36 @@ while True:
9999
print(response)
100100
```
101101

102-
## 商用接口
102+
### 模型常见后缀
103103

104-
接口大同小异,这里列举一个国内的接口与一个国外的接口用作示例
104+
大部分模型基本有代号、模型类型和参数大小三部分组成,例如:`Qwen2.5-Coder-3B`,其中`Qwen2.5`为代号,`Coder`为模型类型,`3B`为参数大小
105105

106-
### OpenAI
106+
#### 模型类型
107107

108-
地址:[https://openai.com/](https://openai.com/)
108+
- `Instruct`:指令优化
109+
- `Fine-tuned`:领域微调
110+
- `Base`:基础模型
111+
- `Chat`:对话优化
112+
- `RAG`:检索增强生成
113+
- `Sparse`:稀疏模型
114+
- `Dense`:密集模型
115+
- `Multimodal`:多模态输入
116+
- `Enhanced` / `Extended`:功能改进或扩展
117+
- `Lite` / `Compact`:轻量化模型
118+
- `Instruction-following (IF)`:指令执行优化
119+
- `Code` / `Coder`:代码优化
120+
- `Knowledge`:知识问答优化
121+
- `Custom` / `Domain-Specific`:定制领域模型
122+
- `Aligned`:人类反馈对齐(通过使用人类反馈调整和优化后的模型)
109123

110-
### 百度
124+
#### 模型微调后缀
111125

112-
地址:[https://cloud.baidu.com/](https://cloud.baidu.com/)
126+
- `GGUF`:高效二进制通用量化格式
127+
- `AWQ`:微调后量化:适应不同场景
128+
- `GPTQ`:分组量化:精度换速度
129+
130+
#### 量化精度
131+
132+
- INT8 (8-bit Integer):INT8通过将模型权重量化为8位整数,显著减少存储和计算需求,适用于大部分推理任务,但会带来一定的精度损失。
133+
- INT4 (4-bit Integer):INT4进一步减少存储和计算需求,能提供更快的推理速度和更低的内存占用,但精度损失更大,且支持较为有限。
134+
- FP16 (16-bit Floating Point):FP16通过使用16位浮点数减少存储需求,精度损失较小,但计算开销高于INT8和INT4,适合精度要求较高的任务。

0 commit comments

Comments
 (0)