Pixiu 2026 work plan #858
Replies: 3 comments
-
|
静态 LDS(传统) static_resources:
listeners:
- name: listener_0
address:
socket_address:
address: 0.0.0.0
port_value: 8080特点: ✅ 动态 LDS(你问的这个) dynamic_resources:
lds_config:
ads: {}Pixiu 启动后: |
Beta Was this translation helpful? Give feedback.
-
|
发展演进这块不用太担心,这块不管是文档还是设计其实我整理很平滑的了,比如在任务里面有一个流量管理,我虽然只实现了 http的,其实是一个很好的功能例子,后面继续 triple 的,第二个是安全的,第三个是可观测,ai 网关的等等,其实都是 dubbogopixiusample 里面的内容,说到底就是对 gateway api 继续扩展 后面我还要支持一个热更新,就是 prometheus 的这种,因为 pixiu 用的是静态文件,所以重启 pixiu proxy 才能刷新configmap 生效;还有 pixiu helm charts 等等 pixiu 现在没有用 ingress 对象,但和 ingress 一样,甚至更好,在文档里面也提到了 ingress 只能用 annotation 扩展,gateway 是可以自定义 api 扩展的,可以自由发挥 |
Beta Was this translation helpful? Give feedback.
-
|
Please let me try the token computing functions |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
随着 1.1.0 的发布(https://mp.weixin.qq.com/s/u42e_NKe8T6ayhFaxHR48Q),Pixiu 还面临如下问题:
1 AI 能力需要继续推进
一个是AI推理面演进还缺的能力以及kv-cache卸载到offload需要的指标项, 一个是关于成本统计这块,目下各模型的统计规格都不一致,可以参考如下文档:
1.1 Dubbo-Go-Pixiu AI 推理建设详细落地方案 Dubbo-Go-Pixiu AI 推理建设详细落地方案 #859
1.2 LLM 推理 KV Cache 分布式缓存方案 LLM 推理 KV Cache 分布式缓存方案 #860
1.3 token 计算
去年开源之夏sentinel-go尝试做基于token预估的token限流的时候,有同学调研了一下token的计算方式。除了tiktoken-go之外,发现部分厂商其实也有提供api来支持计算token。之前测算过对于部分厂商tiktoken-go的计算结果和实际token结果会有一定差异,直接通过厂商api去计算token也可以作为一种更精确的实现考量哈。
下面是之前调研的一些厂商提供的api:
Beta Was this translation helpful? Give feedback.
All reactions