最后更新:2026年1月17日
项目名称: zenEnglish
产品类型: 考研复试英语口语AI智能体(微信小程序 + Web)
一句话定位: 面向西安高校考研生的「院校/专业定制型复试英语口语AI导师」
- 更对口:西交电气/西工大航宇/西电通信/西外翻硕等专业专用题库
- 更像复试:模拟"你真正会遇到的导师"——本校导师风格 + 专业追问
- 更省时间:用15-30天,刷够10-20场高还原模拟,所有弱点一目了然
- 主目标人群: 西安及周边高校考研学生(含一战/二战、自考跨考)
- 目标院校优先: 西交大、西工大、西电、西外、西北大、西财、西邮等
- 在西安本地实现 $20万+ 年经常性收入(ARR)
- 累积 2,000+ 月活用户,免费转付费转化率 ≥ 5%
- 打通 3–5 家本地考研机构的 B 端合作试点
| 文件 |
说明 |
状态 |
| PRD.md |
产品需求文档(V1.0) |
完成 |
| HLD.md |
高阶设计文档(V1.0) |
完成 |
| LLD.md |
低层设计文档(V1.0) |
完成 |
- PRD.md:包含产品定义、市场分析、功能规划、收费设计、里程碑规划等
- HLD.md:包含系统架构设计、技术选型、核心模块设计、竞品技术分析等
- LLD.md:包含详细数据库设计、API接口规范、消息格式、数据结构等
| 组件 |
技术选型 |
版本 |
| 开发语言 |
Python |
3.12+ |
| API框架 |
FastAPI |
0.104+ |
| ORM |
SQLAlchemy |
2.0+ |
| 数据库迁移 |
Alembic |
1.13+ |
| 数据验证 |
Pydantic |
2.5+ |
| ASGI服务器 |
uvicorn |
0.24+ |
| 缓存 |
Redis |
7.0+ |
| 消息队列 |
RabbitMQ |
3.12+ |
| 异步任务 |
Celery |
5.3+ |
| 组件 |
技术选型 |
说明 |
| ASR |
Whisper / Faster-Whisper |
开源、高准确率 |
| ASR优化 |
中文口音微调 |
针对中国考生优化 |
| LLM |
Qwen2.5 / DeepSeek |
开源、中文友好 |
| LLM编排 |
LangChain + LangGraph |
Agent工作流 |
| TTS |
VITS / Edge-TTS |
高质量语音合成 |
| 评分算法 |
GOP + DNN-HMM |
音素级评分 |
| 向量模型 |
text2vec / BGE |
文本向量化 |
| 组件 |
技术选型 |
版本 |
| 跨平台框架 |
uni-app |
3.0+ |
| 前端框架 |
Vue 3 |
3.3+ |
| 类型系统 |
TypeScript |
5.0+ |
| UI组件库 |
Vant |
4.0+ |
| 状态管理 |
Pinia |
2.1+ |
| HTTP客户端 |
Axios |
1.6+ |
| 组件 |
技术选型 |
用途 |
| MySQL |
8.0+ |
关系型数据存储 |
| MongoDB |
6.0+ |
非结构化数据存储(对话记录) |
| Redis |
7.0+ |
缓存、会话、限流 |
| Milvus |
2.3+ |
向量数据库(语义搜索) |
| 组件 |
技术选型 |
版本 |
| 容器化 |
Docker |
24.0+ |
| 容器编排 |
Kubernetes |
1.28+ |
| 负载均衡 |
Nginx |
1.24+ |
| API网关 |
Kong |
3.4+ |
| 监控 |
Prometheus |
2.47+ |
| 可视化 |
Grafana |
10.0+ |
| 日志 |
ELK Stack |
8.10+ |
| 对象存储 |
MinIO / 阿里云OSS |
音频/文件存储 |
客户端层 → API网关层 → 业务服务层 → AI服务层 → 数据层
| 服务名称 |
端口 |
职责 |
| 用户服务 |
8001 |
用户注册/登录、用户信息管理 |
| 题库服务 |
8002 |
题库管理、导师风格、题目推荐 |
| 练习服务 |
8003 |
练习会话管理、实时交互 |
| 评分服务 |
8004 |
多维度评分、发音诊断 |
| 报告服务 |
8005 |
学习报告生成、报告导出 |
| 支付服务 |
8006 |
订单管理、支付处理 |
| 通知服务 |
8007 |
消息推送、通知管理 |
| 统计服务 |
8008 |
数据统计、分析 |
| 订阅服务 |
8009 |
订阅管理、权限控制 |
| ASR服务 |
9001 |
语音识别 |
| TTS服务 |
9002 |
语音合成 |
| LLM服务 |
9003 |
大语言模型调用 |
| Agent编排 |
9004 |
Agent工作流管理 |
| 评分引擎 |
9005 |
评分算法执行 |
| 纠错引擎 |
9006 |
语法纠错 |
- 语音交互基础能力(ASR + TTS)
- 通用复试流程模拟(自我介绍、家庭、专业背景、研究兴趣、职业规划等)
- 基础评分与纠错(发音、流利度、词汇多样性、语法准确性)
- 练习记录与基础错题本
- 压力渐进式训练模式(温和/正常/高压)
- 突发追问引擎(基于回答关键词生成追问)
- 发音诊断与可视化(音素级发音评估)
- 学术表达增强(输出更学术的优化回答)
- 学习报告(每日小结、周度报告、PDF导出)
- 西安高校/专业定制题库(学校级-学院级-专业级)
- 导师风格数字孪生(学术深挖型/实践导向型/友好交流型/刻板高压型)
- 西安特化发音训练模块(/l/–/n/混淆、/θ/ /ð/发音问题)
- 目标院校匹配度评分
- 西安复试时间线与训练计划
- 用户打开小程序
- 点击"微信一键登录"
- 小程序调用wx.login()获取code
- 前端将code发送到后端
- 后端调用微信API获取openid和session_key
- 后端查询用户是否存在并返回JWT token
- 前端存储token,跳转到首页
- 创建会话 → 选择模式(通用/院校定制)→ 选择压力等级
- 开始练习 → AI提问 → 用户录音 → ASR转写 → LLM评分 → TTS反馈
- 循环提问 → 根据回答生成追问
- 结束练习 → 生成报告
- 接收用户音频
- ASR转写为文本
- 发音评分(GOP算法)
- 流利度评分(语速、停顿、语流长度)
- 词汇评分(LLM分析,词汇多样性)
- 语法评分(LLM分析,语法错误、句式多样性)
- 院校匹配度评分(仅院校定制模式)
- 综合评分(加权计算)
| 表名 |
说明 |
| users |
用户表 |
| questions |
题目表 |
| tutor_styles |
导师风格表 |
| practice_sessions |
练习会话表 |
| practice_turns |
练习轮次表 |
| scoring_records |
评分记录表 |
| phoneme_errors |
发音错误表 |
| reports |
报告表 |
| orders |
订单表 |
| institutions |
机构表 |
| institution_students |
机构学生表 |
| 集合名 |
说明 |
| conversations |
对话记录集合 |
| university_knowledge |
院校知识库集合 |
https://api.zenenglish.com/api/v1
{
"code": 0,
"message": "success",
"data": {},
"timestamp": "2026-01-17T10:30:00Z",
"request_id": "uuid"
}
| 接口 |
方法 |
说明 |
| /auth/wechat/login |
POST |
微信登录 |
| /user/profile |
GET |
获取用户信息 |
| /user/profile |
PUT |
更新用户信息 |
| /questions |
GET |
获取题目列表 |
| /questions/recommend |
GET |
获取推荐题目 |
| /practice/sessions |
POST |
创建练习会话 |
| /practice/sessions/{id}/ws |
WS |
WebSocket实时交互 |
| /practice/sessions/{id} |
GET |
获取会话详情 |
| /practice/records |
GET |
获取练习记录 |
-
免费版(长期)
- 每日1场通用模拟
- 基础评分 + 最近3天记录
- 部分话题样例答案预览
-
冲刺包(主打产品)
-
年度会员:¥258–¥298
- 所有已支持院校通用题库
- 所有进阶功能 + 报告导出
- 机构按学员数季付费:约¥50/生/季
- 或按项目整体报价(提供专属Branding + 内嵌机构Logo)
| 阶段 |
时间 |
主要目标 |
关键交付 |
| MVP |
1–2个月 |
跑通通用模拟 + 评分闭环 |
小程序上线,通用题库,基础评分与记录 |
| 迭代一 |
3–4个月 |
上线西安高校定制 + 冲刺包付费 |
3所重点院校题库,高压模式,学习报告,支付 |
| 迭代二 |
5–6个月 |
拓展院校与专业 + B端试点 |
西安主流院校覆盖,机构后台,首批合作机构 |
| 后续 |
6个月+ |
复制到其他城市/场景 |
全国更多院校通用版,四六级/职场场景 |
- MAU ≥ 2,000
- 免费→付费转化率 ≥ 5%
- 7日留存 ≥ 40%,30日留存 ≥ 25%
- 年收入(ARR)≥ ¥200,000
- 单用户平均客单价:¥150–¥200
- 用户主观满意度(NPS)≥ 60
- 重大服务中断 < 0.1%
| 功能模块 |
可栗口语 |
咕噜口语 |
星空外语 |
zenEnglish |
| ASR |
Whisper/Faster-Whisper |
自研深度学习引擎 |
自研深度学习引擎 |
Whisper + 中文口音优化 |
| LLM |
OpenAI GPT系列 |
DeepSeek-R1 |
DeepSeek-R1 |
Qwen/DeepSeek + 院校知识库 |
| 评分维度 |
4维度 |
4维度 + 音素级 |
4维度 + 音素级 |
4维度 + 院校匹配度 |
| 场景覆盖 |
通用场景 |
15000+场景 |
15000+场景 |
西安高校定制场景 |
| 压力模式 |
基础压力模式 |
3级压力模式 |
3级压力模式 |
3级压力模式 + 导师风格 |
| 定价 |
¥98-398 |
¥98-398 |
¥98-398 |
¥88-298 |
- 后端:遵循PEP 8规范
- 前端:遵循ESLint + Prettier规范
- 数据库:使用下划线命名法(snake_case)
- API:使用RESTful风格
- feat: 新功能
- fix: 修复bug
- docs: 文档更新
- style: 代码格式调整
- refactor: 重构
- test: 测试相关
- chore: 构建/工具相关
- main: 主分支,保持稳定
- develop: 开发分支
- feature/*: 功能分支
- hotfix/*: 紧急修复分支
- 本地化优先:所有功能设计优先考虑西安高校的本地化需求
- 院校/专业深度定制:这是项目的核心差异化优势,需要重点投入
- 成本控制:使用开源模型(Qwen、Whisper)降低成本
- 快速迭代:基于LangChain/LangGraph快速构建Agent系统
- 用户体验:确保AI响应速度 <200ms,提供流畅的交互体验
# 启动开发服务器
uvicorn main:app --reload --host 0.0.0.0 --port 8001
# 运行数据库迁移
alembic upgrade head
# 创建新的迁移
alembic revision --autogenerate -m "description"
# 运行测试
pytest tests/
# 代码格式化
black .
isort .
# 安装依赖
npm install
# 启动开发服务器
npm run dev:h5
# 构建生产版本
npm run build:h5
# 代码检查
npm run lint
npm run lint:fix
# 构建镜像
docker build -t zenenglish/api:latest .
# 运行容器
docker run -p 8001:8001 zenenglish/api:latest
# 查看日志
docker logs -f zenenglish-api
如有问题或需要帮助,请参考:
- PRD.md:产品相关问题
- HLD.md:架构设计相关问题
- LLD.md:技术实现相关问题