zenEnglish 项目上下文

最后更新：2026年1月17日

项目概述

项目名称： zenEnglish
产品类型： 考研复试英语口语AI智能体（微信小程序 + Web）
一句话定位： 面向西安高校考研生的「院校/专业定制型复试英语口语AI导师」

核心价值主张

更对口：西交电气/西工大航宇/西电通信/西外翻硕等专业专用题库
更像复试：模拟"你真正会遇到的导师"——本校导师风格 + 专业追问
更省时间：用15-30天，刷够10-20场高还原模拟，所有弱点一目了然

目标用户

主目标人群： 西安及周边高校考研学生（含一战/二战、自考跨考）
目标院校优先： 西交大、西工大、西电、西外、西北大、西财、西邮等

商业目标（首年）

在西安本地实现 $20万+ 年经常性收入（ARR）
累积 2,000+ 月活用户，免费转付费转化率 ≥ 5%
打通 3–5 家本地考研机构的 B 端合作试点

文档结构

文件	说明	状态
PRD.md	产品需求文档（V1.0）	完成
HLD.md	高阶设计文档（V1.0）	完成
LLD.md	低层设计文档（V1.0）	完成

文档说明

PRD.md：包含产品定义、市场分析、功能规划、收费设计、里程碑规划等
HLD.md：包含系统架构设计、技术选型、核心模块设计、竞品技术分析等
LLD.md：包含详细数据库设计、API接口规范、消息格式、数据结构等

技术栈

后端技术栈

组件	技术选型	版本
开发语言	Python	3.12+
API框架	FastAPI	0.104+
ORM	SQLAlchemy	2.0+
数据库迁移	Alembic	1.13+
数据验证	Pydantic	2.5+
ASGI服务器	uvicorn	0.24+
缓存	Redis	7.0+
消息队列	RabbitMQ	3.12+
异步任务	Celery	5.3+

AI技术栈

组件	技术选型	说明
ASR	Whisper / Faster-Whisper	开源、高准确率
ASR优化	中文口音微调	针对中国考生优化
LLM	Qwen2.5 / DeepSeek	开源、中文友好
LLM编排	LangChain + LangGraph	Agent工作流
TTS	VITS / Edge-TTS	高质量语音合成
评分算法	GOP + DNN-HMM	音素级评分
向量模型	text2vec / BGE	文本向量化

前端技术栈

组件	技术选型	版本
跨平台框架	uni-app	3.0+
前端框架	Vue 3	3.3+
类型系统	TypeScript	5.0+
UI组件库	Vant	4.0+
状态管理	Pinia	2.1+
HTTP客户端	Axios	1.6+

数据库技术栈

组件	技术选型	用途
MySQL	8.0+	关系型数据存储
MongoDB	6.0+	非结构化数据存储（对话记录）
Redis	7.0+	缓存、会话、限流
Milvus	2.3+	向量数据库（语义搜索）

DevOps技术栈

组件	技术选型	版本
容器化	Docker	24.0+
容器编排	Kubernetes	1.28+
负载均衡	Nginx	1.24+
API网关	Kong	3.4+
监控	Prometheus	2.47+
可视化	Grafana	10.0+
日志	ELK Stack	8.10+
对象存储	MinIO / 阿里云OSS	音频/文件存储

系统架构

整体架构

客户端层 → API网关层 → 业务服务层 → AI服务层 → 数据层

核心服务

服务名称	端口	职责
用户服务	8001	用户注册/登录、用户信息管理
题库服务	8002	题库管理、导师风格、题目推荐
练习服务	8003	练习会话管理、实时交互
评分服务	8004	多维度评分、发音诊断
报告服务	8005	学习报告生成、报告导出
支付服务	8006	订单管理、支付处理
通知服务	8007	消息推送、通知管理
统计服务	8008	数据统计、分析
订阅服务	8009	订阅管理、权限控制
ASR服务	9001	语音识别
TTS服务	9002	语音合成
LLM服务	9003	大语言模型调用
Agent编排	9004	Agent工作流管理
评分引擎	9005	评分算法执行
纠错引擎	9006	语法纠错

核心功能

1. 基础功能层（MVP必须，部分免费）

语音交互基础能力（ASR + TTS）
通用复试流程模拟（自我介绍、家庭、专业背景、研究兴趣、职业规划等）
基础评分与纠错（发音、流利度、词汇多样性、语法准确性）
练习记录与基础错题本

2. 进阶功能层（竞品对齐，收费为主）

压力渐进式训练模式（温和/正常/高压）
突发追问引擎（基于回答关键词生成追问）
发音诊断与可视化（音素级发音评估）
学术表达增强（输出更学术的优化回答）
学习报告（每日小结、周度报告、PDF导出）

3. 本地化差异化功能层（核心护城河，付费主力）

西安高校/专业定制题库（学校级-学院级-专业级）
导师风格数字孪生（学术深挖型/实践导向型/友好交流型/刻板高压型）
西安特化发音训练模块（/l/–/n/混淆、/θ/ /ð/发音问题）
目标院校匹配度评分
西安复试时间线与训练计划

核心流程

用户注册/登录流程

用户打开小程序
点击"微信一键登录"
小程序调用wx.login()获取code
前端将code发送到后端
后端调用微信API获取openid和session_key
后端查询用户是否存在并返回JWT token
前端存储token，跳转到首页

练习流程

创建会话 → 选择模式（通用/院校定制）→ 选择压力等级
开始练习 → AI提问 → 用户录音 → ASR转写 → LLM评分 → TTS反馈
循环提问 → 根据回答生成追问
结束练习 → 生成报告

评分流程

接收用户音频
ASR转写为文本
发音评分（GOP算法）
流利度评分（语速、停顿、语流长度）
词汇评分（LLM分析，词汇多样性）
语法评分（LLM分析，语法错误、句式多样性）
院校匹配度评分（仅院校定制模式）
综合评分（加权计算）

数据库设计

MySQL核心表

表名	说明
users	用户表
questions	题目表
tutor_styles	导师风格表
practice_sessions	练习会话表
practice_turns	练习轮次表
scoring_records	评分记录表
phoneme_errors	发音错误表
reports	报告表
orders	订单表
institutions	机构表
institution_students	机构学生表

MongoDB集合

集合名	说明
conversations	对话记录集合
university_knowledge	院校知识库集合

API接口规范

基础路径

https://api.zenenglish.com/api/v1

统一响应格式

{
  "code": 0,
  "message": "success",
  "data": {},
  "timestamp": "2026-01-17T10:30:00Z",
  "request_id": "uuid"
}

核心接口

接口	方法	说明
/auth/wechat/login	POST	微信登录
/user/profile	GET	获取用户信息
/user/profile	PUT	更新用户信息
/questions	GET	获取题目列表
/questions/recommend	GET	获取推荐题目
/practice/sessions	POST	创建练习会话
/practice/sessions/{id}/ws	WS	WebSocket实时交互
/practice/sessions/{id}	GET	获取会话详情
/practice/records	GET	获取练习记录

收费模式

C端收费结构

免费版（长期）
- 每日1场通用模拟
- 基础评分 + 最近3天记录
- 部分话题样例答案预览
冲刺包（主打产品）
- 15天冲刺：¥88
- 30天冲刺：¥168
年度会员：¥258–¥298
- 所有已支持院校通用题库
- 所有进阶功能 + 报告导出

B端合作模式

机构按学员数季付费：约¥50/生/季
或按项目整体报价（提供专属Branding + 内嵌机构Logo）

里程碑规划

阶段	时间	主要目标	关键交付
MVP	1–2个月	跑通通用模拟 + 评分闭环	小程序上线，通用题库，基础评分与记录
迭代一	3–4个月	上线西安高校定制 + 冲刺包付费	3所重点院校题库，高压模式，学习报告，支付
迭代二	5–6个月	拓展院校与专业 + B端试点	西安主流院校覆盖，机构后台，首批合作机构
后续	6个月+	复制到其他城市/场景	全国更多院校通用版，四六级/职场场景

核心指标（KPI）

用户指标

MAU ≥ 2,000
免费→付费转化率 ≥ 5%
7日留存 ≥ 40%，30日留存 ≥ 25%

收入指标

年收入（ARR）≥ ¥200,000
单用户平均客单价：¥150–¥200

体验与口碑

用户主观满意度（NPS）≥ 60
重大服务中断 < 0.1%

竞品对比

功能模块	可栗口语	咕噜口语	星空外语	zenEnglish
ASR	Whisper/Faster-Whisper	自研深度学习引擎	自研深度学习引擎	Whisper + 中文口音优化
LLM	OpenAI GPT系列	DeepSeek-R1	DeepSeek-R1	Qwen/DeepSeek + 院校知识库
评分维度	4维度	4维度 + 音素级	4维度 + 音素级	4维度 + 院校匹配度
场景覆盖	通用场景	15000+场景	15000+场景	西安高校定制场景
压力模式	基础压力模式	3级压力模式	3级压力模式	3级压力模式 + 导师风格
定价	¥98-398	¥98-398	¥98-398	¥88-298

项目约定

代码规范

后端：遵循PEP 8规范
前端：遵循ESLint + Prettier规范
数据库：使用下划线命名法（snake_case）
API：使用RESTful风格

提交规范

feat: 新功能
fix: 修复bug
docs: 文档更新
style: 代码格式调整
refactor: 重构
test: 测试相关
chore: 构建/工具相关

分支策略

main: 主分支，保持稳定
develop: 开发分支
feature/*: 功能分支
hotfix/*: 紧急修复分支

重要提醒

本地化优先：所有功能设计优先考虑西安高校的本地化需求
院校/专业深度定制：这是项目的核心差异化优势，需要重点投入
成本控制：使用开源模型（Qwen、Whisper）降低成本
快速迭代：基于LangChain/LangGraph快速构建Agent系统
用户体验：确保AI响应速度 <200ms，提供流畅的交互体验

常用命令

后端开发

# 启动开发服务器
uvicorn main:app --reload --host 0.0.0.0 --port 8001

# 运行数据库迁移
alembic upgrade head

# 创建新的迁移
alembic revision --autogenerate -m "description"

# 运行测试
pytest tests/

# 代码格式化
black .
isort .

前端开发

# 安装依赖
npm install

# 启动开发服务器
npm run dev:h5

# 构建生产版本
npm run build:h5

# 代码检查
npm run lint
npm run lint:fix

Docker

# 构建镜像
docker build -t zenenglish/api:latest .

# 运行容器
docker run -p 8001:8001 zenenglish/api:latest

# 查看日志
docker logs -f zenenglish-api

联系信息

如有问题或需要帮助，请参考：

PRD.md：产品相关问题
HLD.md：架构设计相关问题
LLD.md：技术实现相关问题

FilesExpand file tree

IFLOW.md

Latest commit

History

IFLOW.md

File metadata and controls

zenEnglish 项目上下文

项目概述

核心价值主张

目标用户

商业目标（首年）

文档结构

文档说明

技术栈

后端技术栈

AI技术栈

前端技术栈

数据库技术栈

DevOps技术栈

系统架构

整体架构

核心服务

核心功能

1. 基础功能层（MVP必须，部分免费）

2. 进阶功能层（竞品对齐，收费为主）

3. 本地化差异化功能层（核心护城河，付费主力）

核心流程

用户注册/登录流程

练习流程

评分流程

数据库设计

MySQL核心表

MongoDB集合

API接口规范

基础路径

统一响应格式

核心接口

收费模式

C端收费结构

B端合作模式

里程碑规划

核心指标（KPI）

用户指标

收入指标

体验与口碑

竞品对比

项目约定

代码规范

提交规范

分支策略

重要提醒

常用命令

后端开发

前端开发

Docker

联系信息