Skip to content

Commit 752ba54

Browse files
update readme and add manual
1 parent e46b061 commit 752ba54

17 files changed

+2204
-401
lines changed

README.md

Lines changed: 24 additions & 21 deletions
Original file line numberDiff line numberDiff line change
@@ -1,22 +1,20 @@
11
# AI首席情报官(Wiseflow)
22

3-
**[English](README_EN.md) | [日本語](README_JP.md) | [한국어](README_KR.md) | [Deutsch](README_DE.md) | [Français](README_FR.md)**
3+
**[English](README_EN.md) | [日本語](README_JP.md) | [한국어](README_KR.md) | [Deutsch](README_DE.md) | [Français](README_FR.md) | [العربية](README_AR.md)**
44

55
🚀 **使用大模型从海量信息、各类信源中每日挖掘你真正感兴趣的信息!**
66

77
我们缺的不是信息,而是从海量信息中过滤噪音,从而让有价值的信息显露出来
88

99
## 🔥🔥🔥 Wiseflow 4.0 版本正式发布!
1010

11-
https://github.com/user-attachments/assets/de7d802f-8bd0-496a-86a9-80da25264f94
11+
https://github.com/user-attachments/assets/2c52c010-6ae7-47f4-bc1c-5880c4bd76f3
1212

1313
(在线服务目前因为技术原因,尚未切换到4.0核心,我们正在加速升级中)
1414

15-
在长达三个月的等待后,我们终于迎来了 wiseflow 4.0 版本的正式发布!
15+
在长达三个月的等待后,我们终于迎来了 wiseflow 4.0 版本的正式发布!该版本带来了全新的 4.x 架构,引入了对社交媒体信源的支持,并带来了诸多新特性。
1616

17-
该版本带来了全新的4.x 架构,引入了对社交媒体信源的支持,并带来了诸多新特性。
18-
19-
🌟 4.x 内置 WIS Crawler(基于 Crawl4ai,MediaCrawler 和 Nodriver 深度重构整合),已经可以完美支持网页和社交媒体,4.0 版本先行提供对微博和快手平台的支持,后续计划陆续新增的平台包括:
17+
4.x 内置 WIS Crawler(基于 Crawl4ai,MediaCrawler 和 Nodriver 深度重构整合),除网页外,还提供了对社交媒体信源的支持,4.0 版本先行提供对微博和快手的支持,后续计划陆续新增的平台包括:
2018
微信公众号、小红书、抖音、b站、知乎……
2119

2220
4.x 架构带来的其他新特性包括:
@@ -47,7 +45,7 @@ https://github.com/user-attachments/assets/de7d802f-8bd0-496a-86a9-80da25264f94
4745
……… 同时期待感兴趣的开发者加入我们,共同打造人人可用的 AI 首席情报官!
4846

4947

50-
## 🚀 快速开始
48+
## 🌟 快速开始
5149

5250
**只需三步即可开始使用!**
5351

@@ -69,41 +67,46 @@ powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
6967
git clone https://github.com/TeamWiseFlow/wiseflow.git
7068
```
7169

72-
🌟 上述操作会完成 uv 的安装,pocketbase 的安装请参考 [pocketbase docs](https://pocketbase.io/docs/)
70+
上述操作会完成 uv 的安装,pocketbase 的安装请参考 [pocketbase docs](https://pocketbase.io/docs/)
7371

7472
也可以尝试使用 install_pocketbase.sh (for MacOS/Linux) 或 install_pocketbase.ps1 (for Windows) 来安装。
7573

7674
### 📥 参考 env_sample 配置 .env 文件
7775

78-
在 wiseflow 文件夹(项目根目录)参考 env_sample 创建 .env 文件,并填入相关设定信息
76+
在 wiseflow 文件夹(项目根目录)参考 env_sample 创建 .env 文件,并填入相关设定信息。
77+
78+
4.x 版本无需用户在.env 中提供 pocketbase 的账密,也不限定 pocketbase 的版本, 同时我们也暂时取消了 Secondary Model 的设定, 因此你其实最少仅需四个参数即可完成配置:
79+
80+
- LLM_API_KEY="" # LLM 服务的 key (任何提供 OpenAI 格式 API 的模型服务商均可,本地使用 ollama 部署则无需设置)
81+
- LLM_API_BASE="https://api.siliconflow.cn/v1" # LLM 服务接口地址
82+
- JINA_API_KEY="" # 搜索引擎服务的 key (推荐 Jina,个人使用甚至无需注册即可申请)
83+
- PRIMARY_MODEL="Qwen3-14B" # 推荐 Qwen3-14B 或同量级思考模型
7984

80-
### 🚀 起飞!
85+
### 🚀 起飞!
8186

8287
- for MacOS/Linux:
8388

8489
```bash
8590
cd wiseflow
91+
uv venv # 仅第一次执行需要
92+
uv sync # 仅第一次执行需要
93+
python -m playwright install --with-deps chromium # 仅第一次执行需要
94+
chmod +x run.sh # 仅第一次执行需要
8695
./run.sh
8796
```
8897

89-
(注意:可能需要先执行 `chmod +x run.sh` 赋予执行权限)
90-
9198
- for Windows:
9299

93100
```bash
94101
cd wiseflow
102+
uv venv # 仅第一次执行需要
103+
uv sync # 仅第一次执行需要
104+
python -m playwright install --with-deps chromium # 仅第一次执行需要
105+
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser # 仅第一次执行需要
95106
.\run.ps1
96107
```
97108

98-
(注意:可能需要先执行 `Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser` 赋予执行权限)
99-
100-
如果遇到无法启动虚拟浏览器的问题,可以执行如下命令:
101-
102-
```bash
103-
python -m playwright install --with-deps chromium
104-
```
105-
106-
详细使用教程请参考 [docs/manual.md](./docs/manual.md)
109+
详细使用教程请参考 [docs/manual/manual.md](./docs/manual/manual.md)
107110

108111
## 📚 如何在您自己的程序中使用 wiseflow 抓取出的数据
109112

README_AR.md

Lines changed: 148 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,148 @@
1+
# المساعد الذكي للمعلومات (Wiseflow)
2+
3+
**[English](README_EN.md) | [日本語](README_JP.md) | [한국어](README_KR.md) | [Deutsch](README_DE.md) | [Français](README_FR.md) | [简体中文](README.md)**
4+
5+
🚀 **استخدم الذكاء الاصطناعي لاستخراج المعلومات التي تهتم بها حقاً من مصادر متعددة يومياً!**
6+
7+
المشكلة ليست في نقص المعلومات، بل في كيفية تصفية الضوضاء من المعلومات الهائلة للكشف عن المعلومات القيمة
8+
9+
## 🔥🔥🔥 الإصدار 4.0 من Wiseflow متوفر الآن!
10+
11+
https://github.com/user-attachments/assets/2c52c010-6ae7-47f4-bc1c-5880c4bd76f3
12+
13+
(الخدمة عبر الإنترنت غير متوفرة حالياً بسبب أسباب تقنية، نحن نعمل على تسريع الترقية)
14+
15+
بعد انتظار دام ثلاثة أشهر، نحن سعداء بإطلاق الإصدار 4.0 من Wiseflow! هذا الإصدار يجلب هيكلية جديدة 4.x، مع دعم لمنصات التواصل الاجتماعي وميزات جديدة متعددة.
16+
17+
الإصدار 4.x يتضمن WIS Crawler (مبني على Crawl4ai و MediaCrawler و Nodriver)، ويوفر دعم لمنصات التواصل الاجتماعي بالإضافة إلى صفحات الويب. الإصدار 4.0 يدعم حالياً منصتي Weibo و Kuaishou، مع خطط لإضافة المزيد من المنصات مثل:
18+
WeChat Official Accounts و Xiaohongshu و Douyin و Bilibili و Zhihu...
19+
20+
ميزات جديدة أخرى في هيكلية 4.x تشمل:
21+
22+
- هيكلية جديدة تستخدم المزامنة وخيوط المعالجة بشكل مختلط، مما يرفع كفاءة المعالجة (مع تقليل استهلاك الذاكرة)؛
23+
- ورث قدرات dispatcher من Crawl4ai 0.6.3، مما يوفر إدارة ذاكرة أكثر دقة؛
24+
- دمج عميق بين Pre-Process من الإصدار 3.9 و Markdown Generation من Crawl4ai، مما يمنع المعالجة المكررة؛
25+
- تحسين دعم مصادر RSS؛
26+
- تحسين هيكل ملفات المشروع، أكثر وضوحاً ومتوافقاً مع معايير مشاريع Python المعاصرة؛
27+
- استخدام uv لإدارة التبعيات، وتحسين ملف requirement.txt؛
28+
- تحسين سكريبتات التشغيل (مع دعم Windows)، مما يجعل "التشغيل بنقرة واحدة" حقيقة؛
29+
- تحسين عملية التكوين والنشر، البرنامج الخلفي لم يعد يعتمد على خدمة pocketbase، لذلك لا حاجة لتوفير بيانات اعتماد pocketbase في ملف .env، ولا يوجد قيود على إصدار pocketbase.
30+
31+
## 🧐 'البحث العميق' مقابل 'البحث الواسع'
32+
33+
أطلقنا على منتج Wiseflow مصطلح "البحث الواسع"، وهذا مقابل "البحث العميق" الشائع حالياً.
34+
35+
"البحث العميق" يتضمن تخطيطاً ديناميكياً لمسار البحث بواسطة LLM لاستكشاف صفحات مختلفة وجمع معلومات كافية للإجابة على سؤال محدد أو إنتاج تقرير. لكن في بعض الأحيان، نحن لا نبحث عن إجابة لسؤال محدد ولا نحتاج إلى استكشاف عميق، بل نحتاج فقط إلى جمع معلومات واسعة (مثل جمع معلومات الصناعة، معلومات الخلفية، معلومات العملاء، إلخ). في هذه الحالات، يكون الاتساع أكثر أهمية. رغم أن "البحث العميق" يمكنه تحقيق هذه المهمة، إلا أنه مثل استخدام مدفع لقتل بعوضة - غير فعال ومكلف. Wiseflow هو الأداة المثالية لمثل هذه السيناريوهات.
36+
37+
## ✋ ما الذي يجعل Wiseflow مختلفاً عن برامج الزحف المدعومة بالذكاء الاصطناعي الأخرى؟
38+
39+
- قدرة على الحصول على المعلومات من جميع المنصات، بما في ذلك صفحات الويب ومنصات التواصل الاجتماعي (حالياً يدعم Weibo و Kuaishou) ومصادر RSS ومحركات البحث؛
40+
- ليس مجرد جمع، بل تحليل وتصفية تلقائية، ويعمل بشكل جيد مع نموذج ذكاء اصطناعي بحجم 14b فقط؛
41+
- مصمم للمستخدم العادي (وليس للمطورين)، جاهز للاستخدام "من الصندوق"؛
42+
- استقرار وموثوقية عالية من خلال التطوير المستمر، وكفاءة معالجة متوازنة بين موارد النظام والسرعة؛
43+
- (مستقبلاً) قدرة على اكتشاف "المعلومات الخفية" المخفية في المعلومات المجمعة من خلال وحدة insight
44+
45+
……… نتطلع إلى انضمام المطورين المهتمين إلينا لبناء المساعد الذكي للمعلومات للجميع!
46+
47+
## 🌟 البدء السريع
48+
49+
**ثلاث خطوات فقط للبدء!**
50+
51+
### 📋 تحميل كود المصدر وتثبيت uv و pocketbase
52+
53+
- لنظام MacOS/Linux:
54+
55+
```bash
56+
curl -LsSf https://astral.sh/uv/install.sh | sh
57+
git clone https://github.com/TeamWiseFlow/wiseflow.git
58+
```
59+
60+
- لنظام Windows:
61+
62+
**يجب على مستخدمي Windows تحميل أداة git bash مسبقاً وتنفيذ الأوامر التالية في bash [رابط تحميل bash](https://git-scm.com/downloads/win)**
63+
64+
```bash
65+
powershell -c "irm https://astral.sh/uv/install.ps1 | iex"
66+
git clone https://github.com/TeamWiseFlow/wiseflow.git
67+
```
68+
69+
يمكنك أيضاً استخدام install_pocketbase.sh (لنظام MacOS/Linux) أو install_pocketbase.ps1 (لنظام Windows) للتثبيت.
70+
71+
### 📥 تكوين ملف .env
72+
73+
في مجلد wiseflow (المجلد الرئيسي للمشروع)، قم بإنشاء ملف .env بناءً على env_sample وإدخال المعلومات المطلوبة.
74+
75+
الإصدار 4.x لا يتطلب من المستخدم توفير بيانات اعتماد pocketbase في ملف .env، ولا يحد من إصدار pocketbase. كما ألغينا مؤقتاً إعداد Secondary Model، لذلك تحتاج فقط إلى أربعة معلمات أساسية:
76+
77+
- LLM_API_KEY="" # مفتاح خدمة LLM (يمكن استخدام أي مزود خدمة يوفر واجهة برمجة تطبيقات بتنسيق OpenAI، لا حاجة للإعداد عند استخدام ollama محلياً)
78+
- LLM_API_BASE="https://api.siliconflow.cn/v1" # عنوان واجهة خدمة LLM
79+
- JINA_API_KEY="" # مفتاح خدمة محرك البحث (نوصي بـ Jina، يمكن حتى للمستخدمين الشخصيين التقديم دون تسجيل)
80+
- PRIMARY_MODEL="Qwen3-14B" # نوصي بـ Qwen3-14B أو نموذج تفكير بنفس المستوى
81+
82+
### 🚀 ابدأ!
83+
84+
- لنظام MacOS/Linux:
85+
86+
```bash
87+
cd wiseflow
88+
uv venv # فقط يحتاج إلى التنفيذ في المرة الأولى
89+
python -m playwright install --with-deps chromium # فقط يحتاج إلى التنفيذ في المرة الأولى
90+
chmod +x run.sh # فقط يحتاج إلى التنفيذ في المرة الأولى
91+
./run.sh
92+
```
93+
94+
- لنظام Windows:
95+
96+
```bash
97+
cd wiseflow
98+
uv venv # فقط يحتاج إلى التنفيذ في المرة الأولى
99+
python -m playwright install --with-deps chromium # فقط يحتاج إلى التنفيذ في المرة الأولى
100+
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser # فقط يحتاج إلى التنفيذ في المرة الأولى
101+
.\run.ps1
102+
```
103+
104+
للحصول على دليل استخدام مفصل، يرجى الرجوع إلى [docs/manual/manual_ar.md](./docs/manual/manual_ar.md)
105+
106+
## 📚 كيفية استخدام البيانات المجمعة من Wiseflow في برنامجك الخاص
107+
108+
يتم تخزين جميع البيانات المجمعة في pocketbase مباشرة، لذلك يمكنك الوصول إلى البيانات مباشرة من خلال قاعدة بيانات pocketbase.
109+
110+
PocketBase كقاعدة بيانات خفيفة الوزن شائعة الاستخدام، يتوفر حالياً SDK بلغات Go/Javascript/Python وغيرها.
111+
112+
ستقوم الخدمة عبر الإنترنت قريباً بإطلاق sync api، لدعم مزامنة نتائج الزحف عبر الإنترنت محلياً، لبناء "قاعدة معرفة ديناميكية" وغيرها، ابقوا على اطلاع:
113+
114+
- عنوان الخدمة عبر الإنترنت: https://www.aiqingbaoguan.com/
115+
- أمثلة استخدام API للخدمة عبر الإنترنت: https://github.com/TeamWiseFlow/wiseflow_plus
116+
117+
118+
## 🛡️ الترخيص
119+
120+
هذا المشروع مفتوح المصدر بموجب [Apache2.0](LICENSE).
121+
122+
للتعاون التجاري، يرجى الاتصال بـ **البريد الإلكتروني: zm.zhao@foxmail.com**
123+
124+
- يرجى من العملاء التجاريين الاتصال بنا للتسجيل، النسخة المفتوحة المصدر مجانية للأبد.
125+
126+
## 📬 معلومات الاتصال
127+
128+
لأي أسئلة أو اقتراحات، يرجى ترك تعليق في [issue](https://github.com/TeamWiseFlow/wiseflow/issues).
129+
130+
## 🤝 هذا المشروع مبني على المشاريع المفتوحة المصدر التالية:
131+
132+
- Crawl4ai (Open-source LLM Friendly Web Crawler & Scraper) https://github.com/unclecode/crawl4ai
133+
- MediaCrawler (xhs/dy/wb/ks/bilibili/zhihu crawler) https://github.com/NanmiCoder/MediaCrawler
134+
- NoDriver (Providing a blazing fast framework for web automation, webscraping, bots and any other creative ideas...) https://github.com/ultrafunkamsterdam/nodriver
135+
- Pocketbase (Open Source realtime backend in 1 file) https://github.com/pocketbase/pocketbase
136+
- Feedparser (Parse feeds in Python) https://github.com/kurtmckee/feedparser
137+
138+
تأثر تطوير هذا المشروع بـ [GNE](https://github.com/GeneralNewsExtractor/GeneralNewsExtractor) و [AutoCrawler](https://github.com/kingname/AutoCrawler) و [SeeAct](https://github.com/OSU-NLP-Group/SeeAct).
139+
140+
## الاقتباس
141+
142+
إذا استخدمت أو استشهدت بجزء أو كل من هذا المشروع في عملك، يرجى تضمين المعلومات التالية:
143+
144+
```
145+
Author:Wiseflow Team
146+
https://github.com/TeamWiseFlow/wiseflow
147+
Licensed under Apache2.0
148+
```

0 commit comments

Comments
 (0)