-
-
Notifications
You must be signed in to change notification settings - Fork 59
Open
Description
1).项目名称:paper burner X
2).项目地址:https://github.com/Feather-2/paper-burner-x
3).项目简介 (100 字以内):
开源、即开即用的浏览器AI工作站,支持多格式导入导出与批量高效翻译;面向研究人员和深度学习者,致力整合到单一、流畅的体验中。
内置前端Agentic RAG,结合全局结构与检索工具,自主多步推理,胜任长文精读与信息提取。
4).推荐原因:
希望这个工具能成为研究人员和知识工作者的得力助手,欢迎试用和提出宝贵意见!
5)项目图片:
6)其他项目细节:
- 前端 Agent 驱动的智能检索: 我们在前端实现了一个 Agentic RAG 系统。通过赋予 AI 全局的文章结构 和一系列工具(如
grep,vector search,fetch等等),AI 能够自主决策、多步推理,并在长文本中实现复杂的分析和信息提取任务。 - 高性能批量处理: 支持多种文档格式(PDF/DOCX/EPUB 等)和代码库的直接导入。利用并发 OCR 和翻译,并结合术语库(支持数万词条快速匹配),显著提升了文献处理效率。
- 高可扩展性与本地化: 目前所有数据均在浏览器本地,支持用户接入自定义 AI 模型端点,并提供了配套的 OCR Server 和 Docker 部署选项(开发中),让用户未来可以实现完全离线的本地化使用。
在线体验: https://paperburner.viwoplus.site/
具体介绍
一体化的文档处理引擎
我们为工具打造了一个强大的“入口”,使其能够轻松消化各种来源的知识。
- 广泛的格式支持: 能够处理 PDF、DOCX、PPTX、EPUB、Markdown 甚至代码注释等多种格式,并支持导出为 DOCX、MD 等常用格式。
- 智能导入与处理: 不仅支持本地文件上传,更可一键从 GitHub 仓库或任意 URL 导入内容,自动完成解析。PDF可以使用OCR (支持mineru/doc2x等) 与翻译引擎,并实现保留原文格式翻译功能(基于mineru,目前优化中,并会支持更多模型)。
- 术语备择库: 进行了性能优化,支持一次性导入数万条术语并进行快速匹配。
- 支持自定义模型端点,可以支持检测、多key、快捷导出等机制,使用灵活。
为深度阅读优化的交互体验
- 沉浸式对照阅读: 提供智能对齐的段落级原译文对照、文档结构目录(TOC)、高亮与标注功能,先进行无障碍的阅读,再进行AI总结。
- 增强学术内容展示: 针对学术场景,特别优化了复杂公式的渲染。
- 结构化信息提取: 内置了“文献矩阵”等实用工具,能够将非结构化的论文内容,智能提取为清晰的结构化数据,方便进行横向对比和分析。
不止于问答:前端 Agent 驱动的智能分析
- 我们在纯前端环境中,实现了一个长文本Agent。少量文本下,将使用全量的策略;而当提供长文本时候,使用长文本Agent。
- 赋予 AI 全局视野: 我们为 AI 构建了“分层意群/地图”,让它在处理长文本时拥有对全文结构的整体认知。
- 为 AI 配备工具箱: 我们给予 AI 一系列工具,如精确匹配的
grep、向量搜索vector search、内容抓取fetch等。AI 会根据你的问题,自主分析并决定调用哪种工具组合来寻找最佳答案。
- 上述皆在纯前端实现,浏览器打开即用
项目正在活跃地迭代
- 完全本地化部署: 正在开发Docker 部署方案,还提供了可自托管的 OCR Server,最终目标是让用户可以完全在离线环境中使用全部功能。
- 从单文档到多文档: 下一个里程碑是将能力从分析单篇文献,扩展到处理多篇文献,并基于此开发能自动生成文献综述的 综述 Agent,成为真正的 AI 研究助理。
基于AGPL 3.0开源
本项目基于baoyudu/paper-burner (该项目是基于mistral ocr的pdf极简翻译工具),并已在原始项目上进行了重构和各方面极多内容的扩充。
避免和Paper Burner原项目名称产生重复,为示尊重和区分,该分支项目改名Paper Burner X。
Metadata
Metadata
Assignees
Labels
No labels