You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
> If you want to quickly get started and learn the usage of this project, source code architectural design, learn programming technology, or want to understand the source code design of MediaCrawlerPro, you can check out my paid knowledge column.
WandouHTTP - Self-operated tens of millions IP resource pool, IP purity ≥99.8%, daily high-frequency IP updates, fast response, stable connection, supports multiple business scenarios, customizable on demand, register to get 10000 free IPs.
259
+
</a>
238
260
239
261
---
240
262
241
-
## ⭐ Star Trend Chart
242
-
243
-
If this project helps you, please give a ⭐ Star to support and let more people see MediaCrawler!
244
-
245
-
[](https://star-history.com/#NanmiCoder/MediaCrawler&Date)
TikHub.io provides 900+ highly stable data interfaces, covering 14+ mainstream domestic and international platforms including TK, DY, XHS, Y2B, Ins, X, etc. Supports multi-dimensional public data APIs for users, content, products, comments, etc., with 40M+ cleaned structured datasets. Use invitation code <code>cfzyejV9</code> to register and recharge, and get an additional $2 bonus.
**Swiftproxy** - 90M+ global high-quality pure residential IPs, register to get free 500MB test traffic, dynamic traffic never expires!
253
-
> Exclusive discount code: **GHB5** Get 10% off instantly!
274
+
Thordata: Reliable and cost-effective proxy service provider. Provides stable, efficient and compliant global proxy IP services for enterprises and developers. Register now to get 1GB free residential proxy trial and 2000 serp-api calls.
-**News Crawler Open Source Project**: [NewsCrawlerCollection](https://github.com/NanmiCoder/NewsCrawlerCollection)
293
+
294
+
295
+
## ⭐ Star Trend Chart
296
+
297
+
If this project helps you, please give a ⭐ Star to support and let more people see MediaCrawler!
298
+
299
+
[](https://star-history.com/#NanmiCoder/MediaCrawler&Date)
<summary>🖥️ <strong>Interfaz de Operación Visual WebUI</strong></summary>
156
+
157
+
MediaCrawler proporciona una interfaz de operación visual basada en web, permitiéndole usar fácilmente las funciones del rastreador sin línea de comandos.
158
+
159
+
#### Iniciar Servicio WebUI
160
+
161
+
```shell
162
+
# Iniciar servidor API (puerto predeterminado 8080)
163
+
uv run uvicorn api.main:app --port 8080 --reload
164
+
165
+
# O iniciar usando método de módulo
166
+
uv run python -m api.main
167
+
```
168
+
169
+
Después de iniciar exitosamente, visite `http://localhost:8080` para abrir la interfaz WebUI.
170
+
171
+
#### Características de WebUI
172
+
173
+
- Configuración visual de parámetros del rastreador (plataforma, método de login, tipo de rastreo, etc.)
174
+
- Vista en tiempo real del estado de ejecución del rastreador y logs
175
+
- Vista previa y exportación de datos
176
+
177
+
#### Vista Previa de la Interfaz
178
+
179
+
<imgsrc="docs/static/images/img_8.png"alt="Vista Previa de Interfaz WebUI">
180
+
181
+
</details>
182
+
152
183
<details>
153
184
<summary>🔗 <strong>Usando gestión de entorno venv nativo de Python (No recomendado)</strong></summary>
154
185
@@ -207,75 +238,45 @@ python main.py --help
207
238
208
239
## 💾 Almacenamiento de Datos
209
240
210
-
Soporta múltiples métodos de almacenamiento de datos:
211
-
-**Archivos CSV**: Soporta guardar en CSV (bajo el directorio `data/`)
212
-
-**Archivos JSON**: Soporta guardar en JSON (bajo el directorio `data/`)
213
-
-**Almacenamiento en Base de Datos**
214
-
- Use el parámetro `--init_db` para la inicialización de la base de datos (cuando use `--init_db`, no se necesitan otros argumentos opcionales)
215
-
-**Base de Datos SQLite**: Base de datos ligera, no requiere servidor, adecuada para uso personal (recomendado)
216
-
1. Inicialización: `--init_db sqlite`
217
-
2. Almacenamiento de Datos: `--save_data_option sqlite`
218
-
-**Base de Datos MySQL**: Soporta guardar en la base de datos relacional MySQL (la base de datos debe crearse con anticipación)
219
-
1. Inicialización: `--init_db mysql`
220
-
2. Almacenamiento de Datos: `--save_data_option db` (el parámetro db se mantiene por compatibilidad con actualizaciones históricas)
241
+
MediaCrawler soporta múltiples métodos de almacenamiento de datos, incluyendo CSV, JSON, Excel, SQLite y bases de datos MySQL.
221
242
243
+
📖 **Para instrucciones de uso detalladas, por favor vea: [Guía de Almacenamiento de Datos](docs/data_storage_guide.md)**
222
244
223
-
### Ejemplos de Uso:
224
-
```shell
225
-
# Inicializar la base de datos SQLite (cuando use '--init_db', no se necesitan otros argumentos opcionales)
226
-
uv run main.py --init_db sqlite
227
-
# Usar SQLite para almacenar datos (recomendado para usuarios personales)
# Usar MySQL para almacenar datos (el parámetro db se mantiene por compatibilidad con actualizaciones históricas)
234
-
uv run main.py --platform xhs --lt qrcode --type search --save_data_option db
235
-
```
236
-
237
-
---
238
245
239
246
[🚀 ¡Lanzamiento Mayor de MediaCrawlerPro 🚀! ¡Más características, mejor diseño arquitectónico!](https://github.com/MediaCrawlerPro)
240
247
241
-
## 🤝 Comunidad y Soporte
242
248
243
249
### 💬 Grupos de Discusión
244
250
-**Grupo de Discusión WeChat**: [Haga clic para unirse](https://nanmicoder.github.io/MediaCrawler/%E5%BE%AE%E4%BF%A1%E4%BA%A4%E6%B5%81%E7%BE%A4.html)
251
+
-**Cuenta de Bilibili**: [Sígueme](https://space.bilibili.com/434377496), compartiendo conocimientos de tecnología de IA y rastreo
245
252
246
-
### 📚 Documentación y Tutoriales
247
-
-**Documentación en Línea**: [Documentación Completa de MediaCrawler](https://nanmicoder.github.io/MediaCrawler/)
248
-
-**Tutorial de Rastreador**: [Tutorial Gratuito CrawlerTutorial](https://github.com/NanmiCoder/CrawlerTutorial)
249
-
250
-
251
-
# Otras preguntas comunes pueden verse en la documentación en línea
252
-
>
253
-
> La documentación en línea incluye métodos de uso, preguntas comunes, unirse a grupos de discusión del proyecto, etc.
254
-
> [Documentación en Línea de MediaCrawler](https://nanmicoder.github.io/MediaCrawler/)
255
-
>
256
-
257
-
# Servicios de Conocimiento del Autor
258
-
> Si quiere comenzar rápidamente y aprender el uso de este proyecto, diseño arquitectónico del código fuente, aprender tecnología de programación, o quiere entender el diseño del código fuente de MediaCrawlerPro, puede revisar mi columna de conocimiento pagado.
259
253
260
-
[Introducción de la Columna de Conocimiento Pagado del Autor](https://nanmicoder.github.io/MediaCrawler/%E7%9F%A5%E8%AF%86%E4%BB%98%E8%B4%B9%E4%BB%8B%E7%BB%8D.html)
254
+
### 💰 Exhibición de Patrocinadores
261
255
256
+
<ahref="https://h.wandouip.com">
257
+
<imgsrc="docs/static/images/img_8.jpg">
258
+
<br>
259
+
WandouHTTP - Pool de recursos IP auto-operado de decenas de millones, pureza de IP ≥99.8%, actualizaciones de IP de alta frecuencia diarias, respuesta rápida, conexión estable, soporta múltiples escenarios de negocio, personalizable según demanda, regístrese para obtener 10000 IPs gratis.
260
+
</a>
262
261
263
262
---
264
263
265
-
## ⭐ Gráfico de Tendencia de Estrellas
266
-
267
-
¡Si este proyecto te ayuda, por favor da una ⭐ Estrella para apoyar y que más personas vean MediaCrawler!
268
-
269
-
[](https://star-history.com/#NanmiCoder/MediaCrawler&Date)
TikHub.io proporciona 900+ interfaces de datos altamente estables, cubriendo 14+ plataformas principales nacionales e internacionales incluyendo TK, DY, XHS, Y2B, Ins, X, etc. Soporta APIs de datos públicos multidimensionales para usuarios, contenido, productos, comentarios, etc., con 40M+ conjuntos de datos estructurados limpios. Use el código de invitación <code>cfzyejV9</code> para registrarse y recargar, y obtenga $2 adicionales de bonificación.
**Swiftproxy** - ¡90M+ IPs residenciales puras de alta calidad globales, regístrese para obtener 500MB de tráfico de prueba gratuito, el tráfico dinámico nunca expira!
277
-
> Código de descuento exclusivo: **GHB5** ¡Obtenga 10% de descuento instantáneamente!
275
+
Thordata: Proveedor de servicios de proxy confiable y rentable. Proporciona servicios de IP proxy global estables, eficientes y conformes para empresas y desarrolladores. Regístrese ahora para obtener 1GB de prueba gratuita de proxy residencial y 2000 llamadas serp-api.
-**Preguntas Frecuentes**: [Documentación Completa de MediaCrawler](https://nanmicoder.github.io/MediaCrawler/)
292
+
-**Tutorial de Rastreador para Principiantes**: [Tutorial Gratuito CrawlerTutorial](https://github.com/NanmiCoder/CrawlerTutorial)
293
+
-**Proyecto de Código Abierto de Rastreador de Noticias**: [NewsCrawlerCollection](https://github.com/NanmiCoder/NewsCrawlerCollection)
294
+
295
+
296
+
## ⭐ Gráfico de Tendencia de Estrellas
297
+
298
+
¡Si este proyecto te ayuda, por favor da una ⭐ Estrella para apoyar y que más personas vean MediaCrawler!
299
+
300
+
[](https://star-history.com/#NanmiCoder/MediaCrawler&Date)
287
301
288
302
289
303
## 📚 Referencias
290
304
305
+
-**Repositorio de Firma Xiaohongshu**: [Repositorio de firma xhs de Cloxl](https://github.com/Cloxl/xhshow)
291
306
-**Cliente Xiaohongshu**: [Repositorio xhs de ReaJason](https://github.com/ReaJason/xhs)
292
307
-**Reenvío de SMS**: [Repositorio de referencia SmsForwarder](https://github.com/pppscn/SmsForwarder)
293
308
-**Herramienta de Penetración de Intranet**: [Documentación oficial de ngrok](https://ngrok.com/docs/)
0 commit comments