Skip to content

【开源自荐】Paper burner X,专为深度阅读设计!一个即开即用的AI 文档处理、翻译与分析工作站 #92

@Feather-2

Description

@Feather-2

1).项目名称:paper burner X

2).项目地址:https://github.com/Feather-2/paper-burner-x

3).项目简介 (100 字以内):

开源、即开即用的浏览器AI工作站,支持多格式导入导出与批量高效翻译;面向研究人员和深度学习者,致力整合到单一、流畅的体验中。
内置前端Agentic RAG,结合全局结构与检索工具,自主多步推理,胜任长文精读与信息提取。

4).推荐原因:

希望这个工具能成为研究人员和知识工作者的得力助手,欢迎试用和提出宝贵意见!

5)项目图片:

Image Image Image Image Image Image Image Image

6)其他项目细节:

  • 前端 Agent 驱动的智能检索: 我们在前端实现了一个 Agentic RAG 系统。通过赋予 AI 全局的文章结构 和一系列工具(如 grep, vector search, fetch等等),AI 能够自主决策、多步推理,并在长文本中实现复杂的分析和信息提取任务。
  • 高性能批量处理: 支持多种文档格式(PDF/DOCX/EPUB 等)和代码库的直接导入。利用并发 OCR 和翻译,并结合术语库(支持数万词条快速匹配),显著提升了文献处理效率。
  • 高可扩展性与本地化: 目前所有数据均在浏览器本地,支持用户接入自定义 AI 模型端点,并提供了配套的 OCR Server 和 Docker 部署选项(开发中),让用户未来可以实现完全离线的本地化使用。

在线体验: https://paperburner.viwoplus.site/

具体介绍

一体化的文档处理引擎

我们为工具打造了一个强大的“入口”,使其能够轻松消化各种来源的知识。

  • 广泛的格式支持: 能够处理 PDF、DOCX、PPTX、EPUB、Markdown 甚至代码注释等多种格式,并支持导出为 DOCX、MD 等常用格式。
  • 智能导入与处理: 不仅支持本地文件上传,更可一键从 GitHub 仓库或任意 URL 导入内容,自动完成解析。PDF可以使用OCR (支持mineru/doc2x等) 与翻译引擎,并实现保留原文格式翻译功能(基于mineru,目前优化中,并会支持更多模型)。
  • 术语备择库: 进行了性能优化,支持一次性导入数万条术语并进行快速匹配。
  • 支持自定义模型端点,可以支持检测、多key、快捷导出等机制,使用灵活。

为深度阅读优化的交互体验

  • 沉浸式对照阅读: 提供智能对齐的段落级原译文对照、文档结构目录(TOC)、高亮与标注功能,先进行无障碍的阅读,再进行AI总结。
  • 增强学术内容展示: 针对学术场景,特别优化了复杂公式的渲染。
  • 结构化信息提取: 内置了“文献矩阵”等实用工具,能够将非结构化的论文内容,智能提取为清晰的结构化数据,方便进行横向对比和分析。

不止于问答:前端 Agent 驱动的智能分析

  • 我们在纯前端环境中,实现了一个长文本Agent。少量文本下,将使用全量的策略;而当提供长文本时候,使用长文本Agent。
  • 赋予 AI 全局视野: 我们为 AI 构建了“分层意群/地图”,让它在处理长文本时拥有对全文结构的整体认知。
  • 为 AI 配备工具箱: 我们给予 AI 一系列工具,如精确匹配的 grep、向量搜索 vector search、内容抓取 fetch 等。AI 会根据你的问题,自主分析并决定调用哪种工具组合来寻找最佳答案。
  • 上述皆在纯前端实现,浏览器打开即用

项目正在活跃地迭代

  • 完全本地化部署: 正在开发Docker 部署方案,还提供了可自托管的 OCR Server,最终目标是让用户可以完全在离线环境中使用全部功能。
  • 从单文档到多文档: 下一个里程碑是将能力从分析单篇文献,扩展到处理多篇文献,并基于此开发能自动生成文献综述的 综述 Agent,成为真正的 AI 研究助理。

基于AGPL 3.0开源

本项目基于baoyudu/paper-burner (该项目是基于mistral ocr的pdf极简翻译工具),并已在原始项目上进行了重构和各方面极多内容的扩充。
避免和Paper Burner原项目名称产生重复,为示尊重和区分,该分支项目改名Paper Burner X。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions