Skip to content
/ douyin Public

抖音爬虫——采集账号主页、喜欢、收藏、音乐原声、话题、搜索、合集、作品、关注、粉丝等公开数据。

License

Notifications You must be signed in to change notification settings

erma0/douyin

Repository files navigation

douyin

✨DouyinCrawler

English | Tiếng Việt | 简体中文

❤️开源不易,欢迎star⭐

📢声明

本项目初衷为学习python爬虫、命令行调用Aria2python实现WebUI的案例,后用于尝试体验AI编程(前端及前后端交互部分纯AI生成),应用程序功能为获取抖音平台上公开的信息,仅用于测试和学习研究,禁止用于商业用途或任何非法用途。

任何用户直接或间接使用、传播本仓库内容时责任自负,本仓库的贡献者不对该等行为产生的任何后果负责。

如果相关方认为该项目的代码可能涉嫌侵犯其权利,请及时联系我删除相关代码

使用本仓库的内容即表示您同意本免责声明的所有条款和条件。如果你不接受以上的免责声明,请立即停止使用本项目。


🏠项目地址

https://github.com/erma0/douyin

🍬功能特性

📊 数据采集

  • ✅ 单个作品数据
  • ✅ 用户主页作品
  • ✅ 用户喜欢作品(需目标开放权限)
  • ✅ 用户收藏作品(需目标开放权限)
  • ✅ 话题挑战作品
  • ✅ 合集作品
  • ✅ 音乐原声作品
  • ✅ 关键词搜索作品
  • ✅ 关注用户(仅cli模式,需目标开放权限)
  • ✅ 粉丝用户(仅cli模式,需目标开放权限)

🎯 应用特性

  • 🔄 增量采集:智能增量采集用户主页作品
  • ⬇️ 批量下载:集成 Aria2,支持视频/图片批量下载
  • 🎨 多种模式:GUI 桌面应用 / Web 服务 / cli命令行
  • 🌐 RESTful API:v2.0 提供完整的 HTTP API
  • 🔧 跨平台支持:Windows / macOS / Linux

📸 界面展示

软件界面

🚀快速开始

环境要求

📍测试环境:Win10 x64 + Python 3.12 + Node.js 22.13.0 + uv 0.9+

Windows 用户

Releases 下载,解压后运行 DouyinCrawler.exe

Web 服务(Docker / 全平台)

# Docker(推荐)
docker compose up -d

# 或手动启动
uv sync 
cd frontend && pnpm install && pnpm build && cd ..
python -m backend.server

浏览器访问 http://localhost:8000

命令行(cli模式)

python -m backend.cli -u https://www.douyin.com/user/xxx -l 20

📖 详细使用说明请查看 USAGE.md

🔨构建和打包

# 交互式菜单
.\quick-start.ps1

# 或直接打包
.\scripts\build\pyinstaller.ps1

脚本目录结构:

scripts/
├── build/          # 打包脚本 (PyInstaller / Nuitka)
├── setup/          # 环境配置 (uv / aria2)
└── dev.ps1         # 开发环境构建

📊 技术栈

  • 后端: Python 3.12, FastAPI, PyWebView
  • 前端: React 18, TypeScript, Vite
  • 下载: Aria2
  • 打包: PyInstaller / Nuitka

Star History

Star History Chart

About

抖音爬虫——采集账号主页、喜欢、收藏、音乐原声、话题、搜索、合集、作品、关注、粉丝等公开数据。

Topics

Resources

License

Stars

Watchers

Forks

Contributors 3

  •  
  •  
  •