Skip to content

Latest commit

 

History

History
53 lines (32 loc) · 5.19 KB

File metadata and controls

53 lines (32 loc) · 5.19 KB

关键词

AI、RAG[1]、FIT、FEL、Waterflow、Elsa、插件化、响应式、背压[2]

摘要

本技术白皮书旨在从比较高的层次介绍玉简AI编程平台。首先,本文档简要介绍了 AI 编程平台的主要目标和功能,以及目标受众。然后,本文档又图文并茂的阐述了 AI 编程平台的系统架构,包括总结架构、设计原则和工作原理。接着,本文档按照从底层到上层的顺序,详细说明了 AI 编程平台不同部分的核心原理,分别是 FIT 函数平台、Waterflow 流调度平台和 Elsa 图形编辑平台。基于这 3 层平台,本文档还介绍了如何构建模块化 RAG 和智能体的最佳实践,并给出了相关应用示例和开发者资源。最后,对整个玉简 AI 编程平台进行总结。通过这些内容,本技术白皮书为广大用户提供了全面而详尽的阐述,可以更好的理解并使用玉简 AI 编程平台。

缩略语清单

Abbreviations 缩略语 Full spelling 英文全名 Chinese explanation 中文解释
RAG Retrieval-Augmented Generation 检索增强生成,一种通过结合检索到的相关信息来生成文本的技术。
LLM Large Language Model 大语言模型,指参数数量庞大、能够处理大规模自然语言文本的深度学习模型。
FIT Future Intregration Technology 一种新型的多语言编程框架技术,提供了插件式开发、聚散部署[3]、热插拔等丰富特性。
FEL FIT Expression for LLM 基于FIT技术的大模型原语,旨在简化与大型机器学习模型交互的复杂性,提高构建大模型应用的效率。
BPM[4] Business Process Management 业务流程管理,一种管理方法论,旨在优化组织内的业务流程,提高效率和质量。
FaaS Function as a Service 函数即服务,一种云计算模型,开发人员可以在无需管理服务器的情况下部署单个功能。
RDMA[5] Remote Direct Memory Access 远程直接内存访问,一种网络通信技术,允许计算机系统通过网络直接读取或写入远程计算机的内存,而无需涉及CPU或操作系统。
DSL[6] Domain-Specific Language 领域特定语言,一种针对特定领域或问题领域设计的编程语言,旨在简化特定任务的开发和实现。
OCR Optical Character Recognition 光学字符识别,一种用于将印刷或手写的文本转换为机器可读的数据的技术。

附录

术语表

背压,共享内存, single request, multi response, workflow, reactive programming, genericable, fitable, 插件化开发,聚散部署, 多语言融合编程, 无限水流,有界流/无界流,component ui, configuration ui,runtime ui, agent,rag,多源热数据,多流交互,守候者线程,FEL

参考文献

[1] Lewis P, Perez E, Piktus A, et al. Retrieval-augmented generation for knowledge-intensive nlp tasks[J]. Advances in Neural Information Processing Systems, 2020, 33: 9459-9474.

[2] Nurkiewicz T, Christensen B. Reactive programming with RxJava: creating asynchronous, event-based applications[M]. " O'Reilly Media, Inc.", 2016.

[3] Van Steen M, Tanenbaum A. Distributed systems principles and paradigms[J]. Network, 2002, 2(28): 1.

[4] Mendling J, Weber I, Aalst W V D, et al. Blockchains for business process management-challenges and opportunities[J]. ACM Transactions on Management Information Systems (TMIS), 2018, 9(1): 1-16.

[5] Kaur G, Bala M. Rdma over converged ethernet: A review[J]. International Journal of Advances in Engineering & Technology, 2013, 6(4): 1890.

[6] HAGE J. Language Implementation Patterns: Create your own Domain-Specific and General Programming Languages[J]. Journal of Functional Programming,2011,21(2).

[7] Akidau T, Chernyak S, Lax R. Streaming systems: the what, where, when, and how of large-scale data processing[M]. " O'Reilly Media, Inc.", 2018.

[8] Kleppmann M. Designing data-intensive applications: The big ideas behind reliable, scalable, and maintainable systems[M]. " O'Reilly Media, Inc.", 2017.

[9] Goetz B. Java concurrency in practice[M]. Pearson Education, 2006.

[10] Opyrchal L, Prakash A. Efficient object serialization in Java[C]//Proceedings. 19th IEEE International Conference on Distributed Computing Systems. Workshops on Electronic Commerce and Web-based Applications. Middleware. IEEE, 1999: 96-101.

[11] Stefanov S. React: up & running[M]. " O'Reilly Media, Inc.", 2021.

[12] Gamma E, Helm R, Johnson R E, et al. 设计模式: 可复用面向对象软件的基础[M]. Ji xie gong ye chu ban she, 2019.