Skip to content

Conversation

ks6088ts
Copy link
Member

What this PR does / why we need it

  • add YouTube scraper

Which issue(s) this PR fixes:

Fixes #76

Does this introduce a breaking change?

[ ] Yes
[x] No

Pull Request Type

What kind of change does this Pull Request introduce?

[ ] Bugfix
[x] Feature
[ ] Code style update (formatting, local variables)
[ ] Refactoring (no functional changes, no api changes)
[ ] Documentation content changes
[ ] Other... Please describe:

How to Test

❯ uv run python scripts/agent_operator.py news-summarizer-agent --urls "https://www.youtube.com/watch?v=k6DM-sgYu8M" --scraper YouTubeTranscript

2025-08-13 07:19:08,075 [    INFO] {
  "title": "GPT-5、Deep Research、エージェントの実用化とデータ中心の改良に関するOpenAI対談",
  "date": "不明",
  "summary": "OpenAIのポストトレーニング担当者がGPT-5の狙いと進歩を語り、特にフロントエンドを含むコーディングと創作支援で大幅に実用性が向上し、価格設定も含め幅広いユーザーや新規スタートアップの活用を後押しすると強調した。幻覚や過度な迎合の抑制は高品質データと報酬設計、逐次思考による強化学習で改善され、既存の外部ベンチマークは飽和しつつあるため、用途起点の内部評価と実使用データで山登りする方針や、知識更新に向けたミッドトレーニングの活用が述べられた。Deep Researchやエージェントは包括的ブラウジングとコンピュータ操作で長時間・非同期の実務を代行する方向に進みつつも、現実的なRL環境や多様なタスクデータ、ユーザー承認を伴う安全な行動設計が今後のボトルネックかつ重点領域だとした。",
  "keywords": [
    "GPT-5",
    "コーディング",
    "フロントエンド",
    "創作支援",
    "実用性",
    "価格設定",
    "幻覚抑制",
    "報酬設計",
    "強化学習",
    "逐次思考",
    "評価(Evals)",
    "ミッドトレーニング",
    "Deep Research",
    "エージェント",
    "ブラウジング",
    "コンピュータ操作",
    "RL環境",
    "タスクデータ",
    "安全性",
    "非同期処理"
  ],
  "score": 97
} (agent_operator.py:199)
ORGANIZATION=<organization-name>
REPOSITORY=<repository-name>

git clone [email protected]:$ORGANIZATION/$REPOSITORY.git
cd $REPOSITORY
  • Test the code
make ci-test

What to Check

Verify that the following are valid

  • ...

Additional Information

@ks6088ts ks6088ts merged commit f852dd1 into main Aug 12, 2025
5 checks passed
@ks6088ts ks6088ts deleted the feature/issue-76_youtube-scraper branch August 12, 2025 23:08
@ks6088ts ks6088ts restored the feature/issue-76_youtube-scraper branch August 14, 2025 00:37
@ks6088ts ks6088ts deleted the feature/issue-76_youtube-scraper branch August 14, 2025 00:37
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

Successfully merging this pull request may close these issues.

add youtube scraper to news summarizer agent
1 participant