Skip to content

Latest commit

 

History

History
623 lines (455 loc) · 27 KB

File metadata and controls

623 lines (455 loc) · 27 KB

ReCodeAgent - Codex Base

Core Paper: ReCode: Unify Plan and Action for Universal Granularity Control (arXiv:2510.23564v2)

项目状态: 架构设计完成,准备进行 Dev Cooking ENV 初始化和 dev-spec/specification-docs/ 研究&规划开发规格文档准备 Updated Date (date -u '+%Y-%m-%dT%H:%M:%SZ'): 2025-11-16T16:44:47Z


ReCodeAgent Project Objective: 通用 ReCode- Coding Tasks Agent 将 ReCode 论文产品化为高性能 Rust Core + Codex CLI 集成的递归代码生成系统. (且可扩展 RECODE 核心 as Outher Agent System-subagent for "Claude Code CLI (claude), etc.")

arXiv License Rust Codex CLI


📖 ReCodeAgent 项目概述

ReCode-Agent-Codex 是将学术论文 ReCode: Unify Plan and Action for Universal Granularity Control 产品化的研究项目,采用 Hybrid C 架构:Rust Orchestrator + Codex CLI Executor,实现从固定粒度决策到动态粒度控制的通用编程代理。

🚀 v0.1.0 快速开始(5天冲刺)

当前状态: ✅ 架构设计完成,技术方案就绪,准备实施

关键里程碑:

  • 📅 Nov 18 (Day 1): 完整JSONL事件解析(13+类型)
  • 📅 Nov 19 (Day 2): 真实ALFWorld环境执行
  • 📅 Nov 20 (Day 3): 端到端递归编排
  • 📅 Nov 22 (Day 5): v0.1.0-alpha发布

开始实施:

# 1. 环境准备(Pre-Day 1)
pip install alfworld gym  # use (uv)
alfworld-download
codex exec --json "echo test"  # 验证Codex CLI

# 2. 创建Rust项目
cargo new recode-core --bin
cd recode-core

# 3. 参考实施路线
# 查看: dev-spec/roadmap/ROADMAP_V2_2025111602.md
# 差距修复: dev-spec/architecture/CRITICAL_GAPS_FIX_v0.1.0.md

ReCodeAgent 核心价值

  • 🔄 递归代码生成: 占位符函数自动展开为可执行代码
  • 高性能 Rust Core: 10-100x 性能提升(树遍历、AST 解析、并发调度)
  • 🔌 Codex CLI 集成: 通过 codex exec --json 调用 LLM,使用 ~/.codex/auth.json 认证
  • 🛠️ 工具生态集成: 文件编辑、命令执行、MCP 工具调用
  • 🔒 生产级可靠性: 类型安全、内存高效、沙箱隔离、JSONL 事件流解析
  • 🌍 通用编程能力: 从学术环境扩展到真实代码库操作
  • 关键差距已解决: 5个架构缺陷已有完整技术方案

RECODE Core Methodology

PRELIMINARY

LLM-based AI-Agent 的决策过程

我们将基于 LLM-based AI-Agent 与其环境之间的交互建模为一个简化的决策过程:

$\mathcal{M} = \langle \mathcal{S}, \mathcal{A}, \mathcal{O}, T, R \rangle$

其中:

  • $\mathcal{S}$ : 状态空间;
  • $\mathcal{A}$ : 原始动作空间;
  • $\mathcal{O}$ : 观察空间;
  • $T: \mathcal{S} \times \mathcal{A} \rightarrow \mathcal{S}$ : 转移函数;
  • $R: \mathcal{S} \times \mathcal{A} \rightarrow \mathbb{R}$ : 奖励函数

在每个步骤中, AI-Agent 接收一个观察 $o \in \mathcal{O}$ 并生成决策, 这些决策最终转化为可执行的原始动作 $a \in \mathcal{A}$ .

超越原始动作空间, 我们引入计划空间 $\mathcal{P}$ , 它包含无法直接执行但必须被细化为一系列原始动作或中间子计划的意图目标, 且粒度更粗. 我们将决策空间定义为 $\mathcal{D} = \mathcal{A} \cup \mathcal{P}$ , 代表 AI-Agent 在不同粒度下可能产生的所有输出.

当前的 AI-Agent 范式通常在预定义, 固定的决策空间内操作. ReAct Agent 直接从预先确定的动作集 $\mathcal{A}$ 中选择, 而基于 Planner-based 的 Agent 则在相同的固定 $\mathcal{A}$ 上生成序列, 或依赖手动指定的计划模板. 这一限制从根本上限制了适应性, 因为 AI-Agent 无法动态生成适应未预见情境的自适应的新决策.

Figure2 Figure 2

Decision Granularity 现实世界的任务需要在不同的粒度上做出决策. 在 $\mathcal{A}$ 中的细粒度决策对应于可以立即执行的原始操作, 例如 run('crack egg'), 而在 $\mathcal{P}$ 中的粗粒度决策代表需要分解的高层意图, 例如 prepare_breakfast().

The granularity forms a natural hierarchy 粒度形成了一个自然的层次结构. 以早餐准备为例, 决策 "准备早餐""煮鸡蛋" 更粗, 而 "煮鸡蛋" 又比 "打鸡蛋" 更粗. 每个层级包含更广泛的目标和更长的时间范围. 最细的层级由可执行的基本动作组成, 而最粗的层级代表完整的 "TASK-SPECIFICATION" 任务规范.

基于 "计划本质上是在不同抽象层次上的高级行为" 这一观点, ReCode 在单一的代码表示中统一了所有粒度的决策. $\mathcal{P}$ 中的高级计划采用 "placeholder functions" 占位符函数的形式, "recursively refined" 递归地细化为更细粒度的组件, 直到达到可执行的原始动作 $\mathcal{A}$ . 这种表达方式使 AI-Agent 能够根据给定的上下文, 动态生成 "plans or actions", 在适当的粒度上进行决策, 有效地创建出一个 无限的决策空间.

METHOD OVERVIEW

我们介绍 ReCode -- 一种基于大型语言模型(LLM)的 AI-Agent 范式, 采用递归代码生成, 实现对决策粒度的全局控制. 这一范式首先 unifying plan and action 将计划和行动统一为相同的表示形式, 使整个决策过程能够通过单一, 一致的操作实现. 这种统一自然而然地形成了一个树状结构, 其中最高层的任务可以递归地分解, 直到得到可执行的叶子节点. 这种构建和执行决策树 executing a decision tree 的动态过程如图 Figure2 \ref{fig:method}所示.

Unify Plan and Action (统一计划与行动): ReCode 的核心洞察是 "PLANS and ACTIONS" 计划和行动, 尽管表面不同, 但可以统一为一个可执行的代码表示. 这一统一解决了当前基于大模型的 AI-Agent 中的一个根本限制: 抽象规划与具体原始动作之间的僵硬分离, 这限制了灵活的决策粒度控制.

我们将计划和行动都表示为 Python function calls. 这为 AI-Agent 的策略 policy 建立了一个共同的计算基础. 行动 actions 是可执行的, 由环境指定的, 可以直接与环境交互, 比如 run('click the submit button'). 计划 plans 则表现为未实现的占位符函数 unimplemented placeholder functions, 这些函数封装了需要进一步展开的子目标 sub-goals, 例如 prepare_breakfast()get_ingredients(). 例如, 高级计划 prepare_breakfast() 可以被 policy 展开成包含其他计划的代码块 code block, 如 get_ingredients()cook_meal(). 它们又会被递归拆解, 直到最终转化为一系列原始动作 primitive actions, 比如 run('open refrigerator')run('turn on stove').

Recursive Code Generation (递归代码生成): 基于这种统一的表示 unified representation, ReCode 通过递归生成和执行循环 recursive generation and execution loop 来运行, 详见算法 \ref{alg:recode}. 该过程从基于规则的文本到代码转换 rule-based text-to-code transformation 开始, 将任务指令 task instruction 和初始观察 initial observation 转换为占位符函数, 即根节点 root node. 然后 AI-Agent 的策略模型 policy model $\pi$ 将当前节点展开为子代码块 child code block.

执行器 executor 按顺序处理生成的代码块. 当遇到原始动作 primitive action 时, 执行器直接在环境中执行它. 当遇到占位符函数 placeholder function 时, 执行器触发展开 expansion, 通过将此占位符作为新的当前节点再次调用 ReCode 来实现. 决策树 decision tree 在这个过程中增长, 逐步将任务分解为更详细的计划, 直到所有叶子节点 leaf nodes 都是可执行的原始动作.

当生成的代码块仅包含原始动作时, 递归终止. 然后执行返回到前一个更粗粒度的层级. 这个过程持续进行, 直到初始的顶层占位符被完全解析, 使 AI-Agent 能够在粒度级别之间无缝导航. 策略 policy 自适应地确定何时保持抽象规划 abstract planning 以及何时提交具体动作 concrete actions, 仅基于当前决策上下文 decision context, 而无需显式的粒度监督 granularity supervision. 由此产生的执行轨迹 execution trace 形成了一个分层决策树 hierarchical decision tree, 捕获了从战略规划 strategic planning 到原始执行 primitive execution 的完整推理过程.

[算法 \ref{alg:recode}]: ReCode 算法

Algorithm 1: The ReCode Algorithm

输入: 任务 T, 策略 π, 环境 E, 当前节点 c
过程 ReCode(T, π, E, c):
    if c is None:                      // 初始化
        o_0 ← Reset(E)                 // 重置环境并获取初始观察
        c ← Text2Code(T, o_0)          // 将任务转换为根占位符
    end if

    code block ← π(c)                  // 为当前占位符生成子代码

    for each child code unit u in code block:
        if IsPrimitive(u):             // 原始动作
            Execute(u, E)              // 在环境中执行
        else:                          // 占位符函数
            ReCode(T, π, E, u)         // 递归展开
        end if
    end for
end procedure

RECODE IMPLEMENTATION DETAILS (实现细节)

将 ReCode 范式从理论应用到实践需要几个关键的工程努力, 以确保稳健且稳定的 AI-Agent 性能.

Task Initialization (任务初始化): ReCode 的起点是将自然语言任务指令 natural language task instruction 转换为根占位符函数 root placeholder function. 我们采用一种简单的基于规则的方法 rule-based method, 直接将任务指令和初始观察作为字符串参数封装在预定义模板中, 例如 solve(instruction, observation). 这种任务无关的方法 task-agnostic approach 将解释和分解任务的全部责任委托给学习到的策略模型 learned policy model, 迫使其从原始输入中发展核心规划能力 core planning capabilities, 并增强跨不同任务和环境的泛化能力 generalization.

Context Management (上下文管理): ReCode 通过在整个任务执行过程中持久化的统一变量命名空间 unified variable namespace 来实现上下文管理 context management. 在展开占位符函数时, 系统将所有当前提供的变量及其值序列化为结构化文本描述 structured text description, 并将其作为上下文注入到提示 prompt 中. 在执行生成的代码块后, 新创建或修改的变量会在这个共享命名空间 shared namespace 中更新. 这种设计创建了一个分层信息流 hierarchical information flow, 其中子任务 sub-tasks 可以访问由调用堆栈 call stack 任何级别的父任务 parent tasks 建立的上下文. 关键的是, 策略模型只看到当前变量状态 current variable state, 而不是完整的执行历史 full execution history. 这强制执行显式状态管理 explicit state management. 模型必须学会有意识地将重要信息保存到变量中以供将来使用. 例如, 将动作的输出捕获为 obs = run('go to cabinet 1') 允许后续检查 obs 变量. 这种方法在保持简洁且相关的上下文的同时, 引导模型进行结构化和深思熟虑的规划 structured and deliberate planning.

Error Handling and Recursion Control (错误处理和递归控制): 为确保稳健执行, ReCode 解决了两个实际挑战. 首先, LLMs 生成的代码容易出现语法或运行时错误 syntax or runtime errors. 我们在推理期间采用自我纠正循环 self-correction loop. 在执行失败时, 系统会使用原始占位符和错误回溯 error traceback 作为附加上下文重新调用策略 policy, 允许其在单个轨迹内从瞬态生成失败中恢复. 其次, 无界递归 unbounded recursion 可能导致无限循环或过深的分解树. 我们为基准任务设置了最大递归深度 maximum recursion depth 为 10, 这是在经验最优深度之上选择的保守上界 conservative upper bound (在第~\ref{sec:infer_result}节中), 在规划复杂性与保证终止之间取得平衡.


🏗️ ReCodeAgent 架构设计

┌───────────────────────────────────────────────┐
│  CLI Layer (Rust)                             │
│  - recode solve "task"                        │
│  - clap CLI + tracing logs                    │
└───────────────────────────────────────────────┘
                    ↓
┌───────────────────────────────────────────────┐
│  OrchestratorEngine (Rust DFS 引擎)           │
│  - async fn run() → Result<ExecutionTree>     │
│  - DFS 树遍历 (<1ms for 1000 nodes)           │
│  - ExecutionContext 状态管理                  │
└───────────────────────────────────────────────┘
                    ↓
┌───────────────────────────────────────────────┐
│  CodexExecutor (Codex CLI 集成)               │
│  - spawn("codex", ["exec", "--json"])         │
│  - ~/.codex/auth.json OR CODEX_API_KEY        │
│  - JSONL event streaming parser               │
└───────────────────────────────────────────────┘
                    ↓
┌───────────────────────────────────────────────┐
│  Infrastructure                               │
│  - Codex CLI (LLM 调用 + 工具执行)            │
│  - tokio (异步运行时)                         │
│  - tree-sitter (AST 解析)                     │
│  - serde_json (JSONL 序列化)                  │
└───────────────────────────────────────────────┘

ReCodeAgent 关键技术创新

  1. 零成本抽象: Rust 编译时优化,DFS 遍历 <1ms (1000 节点)
  2. Codex CLI 集成: 直接控制子进程,无需 TypeScript SDK 依赖
  3. 类型安全状态机: 编译期检查 NodeState 转换
  4. 高性能 AST 解析: tree-sitter 比 Python AST 快 10-50x
  5. 并发调度: Tokio 支持大规模并发 LLM 调用 (5-15x faster)

📚 ReCodeAgent 文档导航

ReCodeAgent v0.1.0 核心文档

文档 描述 状态
GAPS_RESOLUTION_SUMMARY.md v0.1.0 关键差距解决总览(5天冲刺) ✅ 最新
dev-spec/architecture/RECODE_ARCHITECTURE_V0.1.0.md 官方架构规范 (2025-11-22目标) ✅ 最新
dev-spec/roadmap/ROADMAP_V2_2025111602.md 5天DEV Cooking周期实施路线 ✅ 最新
dev-spec/architecture/CRITICAL_GAPS_FIX_v0.1.0.md 5个关键差距技术修复方案 ✅ 最新

文档内容速查

GAPS_RESOLUTION_SUMMARY.md - v0.1.0 执行总览:

  • ✅ 5个关键差距状态表(全部已解决)
  • ✅ OKR验证指标(100%达成)
  • ✅ 5天实施检查清单
  • ✅ 验收门控标准

RECODE_ARCHITECTURE_V0.1.0.md - 官方架构规范:

  • 📖 完整JSONL事件解析(13+类型)
  • 📖 真实环境执行(ALFWorld IPC桥接)
  • 📖 集成式编排器(DFS + PythonExecutor)
  • 📖 性能目标(<1ms DFS, <50ms AST)
  • 📖 Rust代码完整骨架

ROADMAP_V2_2025111602.md - 5天DEV Cooking:

  • 🚀 Day 1: 持久化线程 + 完整JSONL解析
  • 🚀 Day 2: 真实run()IPC桥 + ALFWorld适配器
  • 🚀 Day 3: AST解析 + 编排器集成
  • 🚀 Day 4: 性能优化验证
  • 🚀 Day 5: 测试 + CI + v0.1.0-alpha发布

CRITICAL_GAPS_FIX_v0.1.0.md - 技术修复方案:

  • 🔧 G1: Unix套接字IPC实现(run()真实执行)
  • 🔧 G2: 13+事件类型完整覆盖(62%→100%)
  • 🔧 G3: 时间线对齐(5天冲刺确认)
  • 🔧 G4: 真实ALFWorld子进程适配器
  • 🔧 G5: PythonExecutor集成到process_node()

其他资源


🚀 快速开始

前置要求

  • Rust 1.75+ (安装: curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh)
  • Codex CLI (安装: 参考 Codex 文档)
  • Codex API Key 或 ~/.codex/auth.json

1. 创建 Rust 项目

cd /Users/arthur/DL/ReCode
cargo new recode-core --bin
cd recode-core

2. 配置 Cargo.toml

[package]
name = "recode-core"
version = "0.1.0"
edition = "2021"

[dependencies]
tokio = { version = "1.35", features = ["full"] }
clap = { version = "4.4", features = ["derive"] }
serde = { version = "1.0", features = ["derive"] }
serde_json = "1.0"
anyhow = "1.0"
uuid = { version = "1.6", features = ["v4", "serde"] }
chrono = { version = "0.4", features = ["serde"] }
tree-sitter = "0.20"
tree-sitter-python = "0.20"
tracing = "0.1"
tracing-subscriber = "0.3"

[dev-dependencies]
criterion = "0.5"

3. 创建目录结构

mkdir -p src/{orchestrator,tree,codex,analysis,cache}
mkdir -p tests/{integration,fixtures}
mkdir -p benches

4. 验证 Codex CLI 安装

which codex
codex --version

# 检查认证
ls -la ~/.codex/auth.json
# 或设置环境变量
export CODEX_API_KEY="your-api-key"

5. 实现核心模块(按优先级)

参考 IMPLEMENTATION_ROADMAP.md Phase 1:

  • src/tree/node.rs - CodeNode 数据结构
  • src/tree/traversal.rs - DFS 迭代器
  • src/codex/executor.rs - Codex CLI 调用
  • src/orchestrator/engine.rs - 核心引擎
  • tests/integration/simple_task.rs - 集成测试

6. 构建和测试

cargo build                 # 构建项目
cargo test                  # 运行测试
cargo clippy                # 代码检查
cargo bench                 # 性能基准测试

💡 使用示例

示例 1: 简单文件操作

import { RecodeCodexAgent } from 'recode-agent-codex';

const agent = new RecodeCodexAgent({
  threadOptions: {
    sandboxMode: 'workspace-write',
    workingDirectory: './my-project',
  },
  maxDepth: 8,
});

const result = await agent.solve(
  "在 src/utils.ts 中实现一个防抖函数",
  { observation: "当前 src/utils.ts 为空文件" }
);

console.log('生成代码:', result.tree.nodes);
console.log('执行动作:', result.actions);

预期执行树:

solve(instruction, observation)
├─ read_file("src/utils.ts")
├─ implement_debounce_function()
│  ├─ define_function_signature()
│  └─ implement_timer_logic()
└─ write_file("src/utils.ts", content)

示例 2: 递归任务分解

const result = await agent.solve(
  "实现一个 TODO 应用的完整后端",
  {
    tech: "Node.js + Express + SQLite",
    features: ["创建任务", "标记完成", "删除任务"],
  }
);

// 执行树(深度 4):
// solve()
// ├─ setup_project_structure()
// ├─ implement_database()
// │  ├─ define_schema()
// │  └─ create_migrations()
// ├─ implement_api_routes()
// │  ├─ implement_create_todo()
// │  ├─ implement_update_todo()
// │  └─ implement_delete_todo()
// └─ write_tests()

示例 3: 流式执行

for await (const event of agent.solveStreamed("实现快速排序算法")) {
  switch (event.type) {
    case 'node.started':
      console.log(`▶ ${event.node.code}`);
      break;
    case 'node.expanded':
      console.log(`  ↳ ${event.children.length} 个子任务`);
      break;
    case 'tree.completed':
      console.log(`✅ 完成! 总节点: ${event.tree.nodes.size}`);
      break;
  }
}

📊 v0.1.0 实施进度(5天DEV Cooking)

✅ Pre-Day 1: 环境准备 (4小时)

  • 安装ALFWorld: pip install alfworld gym; alfworld-download
  • 验证Codex CLI: codex exec --json "echo test"
  • 测试Unix套接字IPC原型
  • 创建Rust项目结构

验收: Codex JSONL输出可解析,ALFWorld可启动

🔄 Day 1: 持久化线程 + 完整事件解析 (12小时)

  • CodexThreadManager支持thread_id持久化
  • 扩展RawCodexEvent到13+事件类型
  • 添加mcp_tool_call、web_search、todo_list项
  • ExecutionContext变量/动作/观察追踪
  • 门控测试: cargo test test_all_event_types_captured

可交付: 100%事件捕获(vs 12.5%基线)

🔄 Day 2: 真实环境执行 (10小时)

  • Unix套接字IPC桥(Python ↔ Rust)
  • PythonExecutor集成EnvironmentAdapter
  • ALFWorld子进程适配器
  • NeedExpansion检测(NameError)
  • 门控测试: cargo test test_real_alfworld_task_completion

可交付: 真实ALFWorld任务完成,确定性观察

🔄 Day 3: AST解析 + 编排器集成 (12小时)

  • AstCodeSplitter(tree-sitter)
  • 将PythonExecutor连接到process_node()
  • NeedExpansion错误 → 触发递归展开
  • ExecutionContext更新流
  • 门控测试: cargo test test_dfs_executes_real_code

可交付: 端到端递归执行(DFS + 真实代码执行)

🔄 Day 4: 性能验证 (10小时)

  • DFS遍历基准测试(目标: <1ms)
  • AST解析基准测试(目标: <50ms)
  • 内存剖析(目标: <50MB)
  • 如需优化性能热点

可交付: 性能基准通过(或10ms宽松目标)

🔄 Day 5: 测试 + CI + 发布 (10小时)

  • 15+集成测试通过
  • CI/CD流水线(GitHub Actions)
  • API文档生成
  • CHANGELOG.md
  • 最终门控: cargo test --all && cargo bench && cargo clippy
  • 标记v0.1.0-alpha发布

可交付: v0.1.0-alpha生产就绪


🎯 v0.1.0 里程碑

里程碑 验收标准 目标日期 状态
Pre-Day 1 ALFWorld + Codex CLI环境就绪 Nov 17 🔄 进行中
Day 1 门控 100% JSONL事件捕获验证 Nov 18 📝 待开始
Day 2 门控 真实ALFWorld任务完成 Nov 19 📝 待开始
Day 3 门控 端到端DFS递归执行 Nov 20 📝 待开始
Day 5 发布 v0.1.0-alpha标记 Nov 22 📝 待开始

Day 1 完成标志

cargo test test_all_event_types_captured
# ✅ test test_all_event_types_captured ... ok
#    - thread.started: captured ✓
#    - turn.started: captured ✓
#    - item.completed (13+ types): captured ✓
#    - Event coverage: 100% (vs 12.5% baseline)

Day 2 完成标志

cargo test test_real_alfworld_task_completion
# ✅ test test_real_alfworld_task_completion ... ok
#    - ALFWorld subprocess spawned ✓
#    - Action: "go to cabinet 1" executed ✓
#    - Real observation received: "You arrive at loc 1..." ✓
#    - No mock responses detected ✓

Day 5 完成标志

cargo test --all && cargo bench && cargo clippy -- -D warnings
# ✅ All tests passed (15+ integration tests)
# ✅ DFS benchmark: 0.8ms (target: <1ms) ✓
# ✅ AST benchmark: 42ms (target: <50ms) ✓
# ✅ No clippy warnings ✓
git tag v0.1.0-alpha
# ✅ Release tagged: v0.1.0-alpha

🔬 技术栈

核心依赖 (Rust)

  • tokio - 异步运行时 (async/await)
  • serde / serde_json - 序列化 / JSONL 解析
  • clap - CLI 参数解析
  • anyhow - 错误处理
  • uuid - 节点 ID 生成
  • chrono - 时间戳

代码分析

  • tree-sitter - 高性能 AST 解析 (10-50x faster)
  • tree-sitter-python - Python 语法解析

开发工具

  • criterion - 性能基准测试
  • tracing - 结构化日志
  • cargo-clippy - 代码检查
  • cargo-fmt - 代码格式化

外部依赖

  • Codex CLI - LLM 调用与工具执行
  • ~/.codex/auth.json - 认证配置

📈 架构对比

维度 ReCode Demo recode-agent-codex
执行模型 单进程 exec() Codex SDK 子进程隔离
环境支持 仅模拟环境 (ALFWorld) 文件系统/REPL/Codex 工具
状态管理 Executor 内存变量 序列化到 Python 脚本
工具生态 run(action) 文件编辑/命令/MCP/Web搜索
安全性 ❌ 无沙箱 ✅ 沙箱 + 审批策略
可观测性 日志文件 事件流 + 可视化
生产就绪 ❌ 学术原型 ✅ 企业级可靠性

🧪 测试策略

单元测试(>80% 覆盖率)

  • CodeNode / ExecutionContext 状态管理
  • RecodeOrchestrator DFS 遍历逻辑
  • CodeParser 代码解析与分割
  • DirectPythonExecutionBridge 执行桥接

集成测试

  • 简单代码执行(变量追踪)
  • NeedExpansion 检测
  • 递归展开(3层深度)
  • 错误恢复与重试

性能测试

  • 单步执行延迟 <2s
  • 递归展开延迟 <5s/层
  • 内存占用 <500MB(10层树)

📝 License

MIT - 查看 LICENSE 文件了解详情。


🙏 致谢

本项目基于以下研究与工具:


Links

相关链接:


最后更新 (date -u '+%Y-%m-%dT%H:%M:%SZ'): 2025-11-16T15:41:02Z 版本: v0.1.0-alpha (准备中) 状态: ✅ 5天DEV Cooking周期 - 就绪实施 (Nov 18-22, 2025)