-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathrun_github_trending.sh
More file actions
446 lines (368 loc) · 11.2 KB
/
run_github_trending.sh
File metadata and controls
446 lines (368 loc) · 11.2 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
#!/bin/bash
# GitHub 热门项目自动获取和报告生成脚本
# 作者: GitHub Trending Reporter
# 版本: 1.0.0
set -e # 遇到错误立即退出
# 配置变量
SCRIPT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")" && pwd)"
DATA_DIR="${SCRIPT_DIR}/data"
REPORTS_DIR="${SCRIPT_DIR}/reports"
LOGS_DIR="${SCRIPT_DIR}/logs"
CONFIG_FILE="${SCRIPT_DIR}/config.conf"
# 默认配置
DEFAULT_LANGUAGE=""j
DEFAULT_TIME_RANGE="daily"
DEFAULT_COUNT=10
DEFAULT_TOKEN=""
DEFAULT_AUTO_COMMIT=false
# 颜色输出
RED='\033[0;31m'
GREEN='\033[0;32m'
YELLOW='\033[1;33m'
BLUE='\033[0;34m'
NC='\033[0m' # No Color
# 日志函数
log() {
echo -e "${GREEN}[$(date '+%Y-%m-%d %H:%M:%S')]${NC} $1" >&2
}
warn() {
echo -e "${YELLOW}[$(date '+%Y-%m-%d %H:%M:%S')] WARNING:${NC} $1" >&2
}
error() {
echo -e "${RED}[$(date '+%Y-%m-%d %H:%M:%S')] ERROR:${NC} $1" >&2
}
info() {
echo -e "${BLUE}[$(date '+%Y-%m-%d %H:%M:%S')] INFO:${NC} $1" >&2
}
# 帮助信息
show_help() {
cat << EOF
GitHub 热门项目自动获取和报告生成工具
用法: $0 [选项]
选项:
-l, --language LANG 指定编程语言 (如: python, javascript, go)
-t, --time-range RANGE 时间范围 (daily, weekly, monthly, yearly, triennial)
-c, --count COUNT 获取项目数量 (默认: 10)
-o, --output DIR 输出目录 (默认: reports)
--token TOKEN GitHub Personal Access Token
--title TITLE 报告标题
--auto-commit 自动提交到 Git 仓库
--schedule 设置定时任务
-h, --help 显示帮助信息
示例:
$0 -l python -t weekly -c 20
$0 --language javascript --count 15 --auto-commit
$0 --daemon
配置文件:
配置文件位置: ${CONFIG_FILE}
可以在配置文件中设置默认值,命令行参数优先级更高。
环境变量:
GITHUB_TOKEN GitHub Personal Access Token
GITHUB_TRENDING_CONFIG 配置文件路径
EOF
}
# 创建必要目录
create_directories() {
for dir in "$DATA_DIR" "$REPORTS_DIR" "$LOGS_DIR"; do
if [[ ! -d "$dir" ]]; then
mkdir -p "$dir"
log "创建目录: $dir"
fi
done
}
# 加载配置文件
load_config() {
if [[ -f "$CONFIG_FILE" ]]; then
log "加载配置文件: $CONFIG_FILE"
source "$CONFIG_FILE"
else
log "配置文件不存在,使用默认配置"
fi
}
# 创建默认配置文件
create_default_config() {
cat > "$CONFIG_FILE" << EOF
# GitHub 热门项目获取配置文件
# 所有设置都可以通过命令行参数覆盖
# 基本设置
LANGUAGE="$DEFAULT_LANGUAGE"
TIME_RANGE="$DEFAULT_TIME_RANGE"
COUNT=$DEFAULT_COUNT
GITHUB_TOKEN="$DEFAULT_TOKEN"
# 报告设置
REPORT_TITLE="热门项目报告"
AUTO_COMMIT=$DEFAULT_AUTO_COMMIT
# Git 设置 (当 AUTO_COMMIT=true 时)
GIT_REMOTE="origin"
GIT_BRANCH="main"
GIT_COMMIT_MESSAGE="📊 Update GitHub trending report"
# 日志设置
LOG_LEVEL="INFO"
LOG_RETENTION_DAYS=30
EOF
log "已创建默认配置文件: $CONFIG_FILE"
}
# 检查依赖
check_dependencies() {
local deps=("python3" "git")
local missing_deps=()
for dep in "${deps[@]}"; do
if ! command -v "$dep" &> /dev/null; then
missing_deps+=("$dep")
fi
done
if [[ ${#missing_deps[@]} -gt 0 ]]; then
error "缺少依赖: ${missing_deps[*]}"
error "请安装缺少的依赖后重试"
exit 1
fi
# 检查 Python 模块
if ! python3 -c "import requests, json" &> /dev/null; then
warn "Python requests 模块未安装,尝试自动安装..."
pip3 install requests || {
error "无法安装 requests 模块,请手动安装: pip3 install requests"
exit 1
}
fi
}
# 获取项目数据
fetch_data() {
local language="$1"
local time_range="$2"
local count="$3"
local token="$4"
local timestamp=$(date +"%Y%m%d_%H%M%S")
local data_file="${DATA_DIR}/github_trending_${timestamp}.json"
local log_file="${LOGS_DIR}/fetch_${timestamp}.log"
log "开始获取 GitHub 热门项目数据..."
info "语言: ${language:-全部}"
info "时间范围: $time_range"
info "数量: $count"
local cmd="python3 ${SCRIPT_DIR}/github_fetcher.py"
cmd="$cmd --time-range $time_range --count $count --output $data_file"
if [[ -n "$language" ]]; then
cmd="$cmd --language $language"
fi
if [[ -n "$token" ]]; then
cmd="$cmd --token $token"
fi
# 执行获取命令
if eval "$cmd" > "$log_file" 2>&1; then
log "数据获取完成: $data_file"
echo "$data_file"
else
error "数据获取失败,查看日志: $log_file"
cat "$log_file"
exit 1
fi
}
# 生成报告
generate_report() {
local data_file="$1"
local title="$2"
local language="$3"
local time_range="$4"
log "生成报告: $data_file title: $title language: $language time_range: $time_range ..."
if [[ ! -f "$data_file" ]]; then
error "数据文件不存在: $data_file"
exit 1
fi
local date=$(date +"%Y%m%d")
local lang_label=${language:-"all"}
local report_file="${REPORTS_DIR}/3ziye-${date}-${lang_label}.md"
local log_file="${LOGS_DIR}/report_${date}_${lang_label}.log"
log "开始生成 Markdown 报告..."
local cmd="python3 ${SCRIPT_DIR}/markdown_generator.py"
cmd="$cmd $data_file --output $report_file --title '$title' --language '$lang_label' --time-range '$time_range'"
if eval "$cmd" > "$log_file" 2>&1; then
log "报告生成完成: $report_file"
echo "$report_file"
else
error "报告生成失败,查看日志: $log_file"
cat "$log_file"
exit 1
fi
}
# Git 提交
git_commit_report() {
local report_file="$1"
if [[ ! -f "$report_file" ]]; then
error "报告文件不存在: $report_file"
return 1
fi
log "提交报告到 Git 仓库..."
# 检查是否在 Git 仓库中
if ! git rev-parse --git-dir > /dev/null 2>&1; then
warn "当前目录不是 Git 仓库,跳过自动提交"
return 0
fi
# 添加文件
git add "$report_file"
git add "$DATA_DIR"
# 检查是否有变更
if git diff --cached --quiet; then
warn "没有变更需要提交"
return 0
fi
# 提交
local commit_message="${GIT_COMMIT_MESSAGE:-📊 Update GitHub trending report} - $(date '+%Y-%m-%d %H:%M')"
if git commit -m "$commit_message"; then
log "Git 提交完成"
# 推送到远程
if [[ -n "${GIT_REMOTE:-}" ]] && [[ -n "${GIT_BRANCH:-}" ]]; then
if git push "${GIT_REMOTE}" "${GIT_BRANCH}"; then
log "推送到远程仓库完成"
else
warn "推送到远程仓库失败"
fi
fi
else
error "Git 提交失败"
return 1
fi
}
# 清理旧文件
cleanup_old_files() {
local retention_days="${LOG_RETENTION_DAYS:-30}"
log "清理超过 ${retention_days} 天的旧文件..."
# 清理日志文件
find "$LOGS_DIR" -name "*.log" -mtime +${retention_days} -delete 2>/dev/null || true
# 清理旧的数据文件 (保留最近的10个)
ls -t "${DATA_DIR}"/github_trending_*.json 2>/dev/null | tail -n +11 | xargs rm -f 2>/dev/null || true
log "文件清理完成"
}
# 设置定时任务
setup_schedule() {
local cron_entry="${SCHEDULE_CRON:-0 9 * * *} $SCRIPT_DIR/$0 --daemon"
log "设置定时任务..."
# 检查是否已存在
if crontab -l 2>/dev/null | grep -q "$SCRIPT_DIR/$0"; then
warn "定时任务已存在"
return 0
fi
# 添加到 crontab
(crontab -l 2>/dev/null; echo "$cron_entry") | crontab -
log "定时任务设置完成: $cron_entry"
}
# 主要处理流程
run_pipeline() {
log "run_pipeline..."
local language="$1"
local time_range="$2"
local count="$3"
local token="$4"
local title="$5"
local start_time=$(date +%s)
log "========== 开始执行 GitHub 热门项目获取流程 =========="
# 获取数据
log "获取数据"
local data_file
data_file=$(fetch_data "$language" "$time_range" "$count" "$token")
# 生成报告
log "生成报告"
local report_file
report_file=$(generate_report "$data_file" "$title" "$language" "$time_range")
# 自动提交
log "自动提交"
if [[ "${AUTO_COMMIT:-false}" == "true" ]]; then
git_commit_report "$report_file"
fi
local end_time=$(date +%s)
local duration=$((end_time - start_time))
log "========== 流程执行完成,耗时: ${duration}秒 =========="
log "📄 报告文件: $report_file"
}
# 解析命令行参数
parse_args() {
local language=""
local time_range="daily"
local count=10
local token=""
local date=$(date +"%Y%m%d")
local lang_label="all"
local title="热点项目-${date}-${lang_label}"
local auto_commit=false
local schedule_mode=false
while [[ $# -gt 0 ]]; do
case $1 in
-l|--language)
language="$2"
lang_label=${language:-"all"}
# 如果没有指定标题,则使用动态生成的标题
if [[ "$title" == "热点项目-$(date +"%Y%m%d")-all" ]]; then
title="热点项目-$(date +"%Y%m%d")-${lang_label}"
fi
shift 2
;;
-t|--time-range)
time_range="$2"
shift 2
;;
-c|--count)
count="$2"
shift 2
;;
--token)
token="$2"
shift 2
;;
--title)
title="$2"
shift 2
;;
--auto-commit)
auto_commit=true
shift
;;
-h|--help)
show_help
exit 0
;;
*)
error "未知参数: $1"
show_help
exit 1
;;
esac
done
# 环境变量覆盖
token="${token:-${GITHUB_TOKEN:-}}"
if [[ "$schedule_mode" == "true" ]]; then
setup_schedule
exit 0
fi
# 设置全局变量
AUTO_COMMIT="$auto_commit"
# 执行主流程
run_pipeline "$language" "$time_range" "$count" "$token" "$title"
}
# 主函数
main() {
# 创建必要目录
log "创建必要目录"
create_directories
# 检查依赖
log "检查依赖"
check_dependencies
# 创建默认配置文件 (如果不存在)
log "创建默认配置文件 (如果不存在)"
if [[ ! -f "$CONFIG_FILE" ]]; then
create_default_config
fi
# 加载配置
log "加载配置"
load_config
# 解析参数并执行
log "解析参数并执行"
if [[ $# -eq 0 ]]; then
# 无参数时显示帮助
show_help
exit 0
fi
parse_args "$@"
}
# 信号处理
trap 'error "脚本被中断"; exit 130' INT
trap 'error "脚本被终止"; exit 143' TERM
# 执行主函数
main "$@"