有关输入拆分计算的问题 #2284
有关输入拆分计算的问题
#2284
Replies: 2 comments 2 replies
-
是的。 |
Beta Was this translation helpful? Give feedback.
2 replies
-
我的理解是,拆分是为了在长文本和短文本一起推理时,为了缩短短文本的prefil阶段的时间进行的 不是这个作用吗?
…---- 回复的原邮件 ----
| 发件人 | Li ***@***.***> |
| 日期 | 2024年08月12日 23:40 |
| 收件人 | ***@***.***> |
| 抄送至 | ***@***.***>***@***.***> |
| 主题 | Re: [InternLM/lmdeploy] 有关输入拆分计算的问题 (Discussion #2284) |
需要拆分的都是一次 forward 跑不完的,不会出现一次 forward 有两个请求要拆分的情况
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
最近在学习LMDeploy v0.5.1 的代码,发现LlamaBatch的Initialize函数中有一段如下
这里是表示 partial 的 seq 只能有一个吗
Beta Was this translation helpful? Give feedback.
All reactions