Skip to content

Latest commit

 

History

History
245 lines (167 loc) · 23 KB

File metadata and controls

245 lines (167 loc) · 23 KB

🌐 Language: English | 日本語

gstack

「12月からコードをほとんど1行も手で書いていない。これは本当に大きな変化だ」 — Andrej Karpathy、No Priorsポッドキャスト、2026年3月

Karpathyのこの発言を聞いたとき、「どうやって?」と思った。一人で20人分のチームと同じ成果を出すにはどうすればいいのか。Peter SteinbergerはOpenClaw(GitHubスター247K)を、実質一人でAIエージェントを使って作り上げた。革命はもう始まっている。適切なツールさえあれば、たった一人のビルダーが従来のチームを超えるスピードで開発できる。

私はGarry TanY CombinatorのPresident & CEOだ。Coinbase、Instacart、Ripplingをはじめ、ガレージで1〜2人だった頃から数千のスタートアップと関わってきた。YC以前は、Palantirの初期メンバーとしてエンジニア/PM/デザイナーを兼任し、Posterous(後にTwitterが買収)を共同創業し、YCの内部SNSであるBookfaceを構築した。

gstackが私の答えだ。 20年間プロダクトを作り続けてきたが、今の自分は過去最高のペースでコードを書いている。直近60日間で60万行以上の本番コード(うち35%がテスト)、1日あたり1万〜2万行。それもYCをフルタイムで経営しながら、パートタイムでだ。3プロジェクトにまたがる直近の /retro 結果はこうだ:1週間で140,751行追加、362コミット、純増約115K行

2026年 — コントリビューション1,237件、さらに増加中:

GitHub contributions 2026 — 1,237 contributions, massive acceleration in Jan-Mar

2013年 — YCでBookfaceを構築していた頃(772件):

GitHub contributions 2013 — 772 contributions building Bookface at YC

同じ人間。違う時代。違いはツールだ。

gstackはそのやり方そのものだ。 Claude Codeを仮想エンジニアリングチームに変える。プロダクトを根本から再考するCEO、アーキテクチャを固めるエンジニアリングマネージャー、AIの雑な出力を見抜くデザイナー、本番で発火するバグを見つけるレビュアー、実際のブラウザを開いて検証するQAリード、OWASP+STRIDEの監査を行うセキュリティオフィサー、PRを仕上げるリリースエンジニア。20人の専門家と8つのパワーツール。すべてスラッシュコマンド、すべてMarkdown、すべて無料、MITライセンス。

これは私のオープンソースのソフトウェアファクトリーだ。毎日使っている。このツールはすべての人に開かれるべきだと思うから公開する。

フォークして、改良して、自分のものにしてほしい。無料のOSSを批判したいなら好きにすればいいが、まず試してからにしてくれ。

こんな人に向いている:

  • 創業者やCEO — 特に、まだ自分でコードを書きたい技術系のリーダー
  • Claude Code初心者 — 白紙のプロンプトの代わりに、構造化されたロールを提供
  • テックリードやスタッフエンジニア — すべてのPRに対して厳格なレビュー、QA、リリース自動化を実現

クイックスタート

  1. gstackをインストール(30秒 — 下記参照)
  2. /office-hours を実行 — 作りたいものを説明する
  3. /plan-ceo-review を機能アイデアに対して実行する
  4. /review を変更があるブランチに対して実行する
  5. /qa をステージングURLに対して実行する
  6. ここで止める。自分に合うかどうか、わかるはずだ。

インストール — 30秒

必要なもの: Claude CodeGitBun v1.0+、Node.js(Windows限定)

ステップ1:マシンにインストール

Claude Codeを開いて以下を貼り付ける。あとはClaudeがやってくれる。

gstackをインストール:git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup を実行し、CLAUDE.mdに「gstack」セクションを追加して、Web閲覧にはすべてgstackの/browseスキルを使い、mcp__claude-in-chrome__*ツールは使用しないこと、利用可能なスキル一覧(/office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review, /design-consultation, /review, /ship, /land-and-deploy, /canary, /benchmark, /browse, /qa, /qa-only, /design-review, /setup-browser-cookies, /setup-deploy, /retro, /investigate, /document-release, /codex, /cso, /autoplan, /careful, /freeze, /guard, /unfreeze, /gstack-upgrade)を記載する。その後、チームメイトも使えるよう現在のプロジェクトにgstackを追加するか確認する。

ステップ2:リポジトリに追加してチームメイトと共有(任意)

このプロジェクトにgstackを追加:cp -Rf ~/.claude/skills/gstack .claude/skills/gstack && rm -rf .claude/skills/gstack/.git && cd .claude/skills/gstack && ./setup を実行し、プロジェクトのCLAUDE.mdに「gstack」セクションを追加して、Web閲覧にはすべてgstackの/browseスキルを使い、mcp__claude-in-chrome__*ツールは使用しないこと、利用可能なスキル一覧(/office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review, /design-consultation, /review, /ship, /land-and-deploy, /canary, /benchmark, /browse, /qa, /qa-only, /design-review, /setup-browser-cookies, /setup-deploy, /retro, /investigate, /document-release, /codex, /cso, /careful, /freeze, /guard, /unfreeze, /gstack-upgrade)を記載し、gstackのスキルが動作しない場合は cd .claude/skills/gstack && ./setup でバイナリのビルドとスキル登録を行うよう案内する。

実ファイルがリポジトリにコミットされる(サブモジュールではない)ので、git clone するだけで動く。すべて .claude/ 内に収まる。PATHへの追加もバックグラウンドプロセスも一切不要。

Codex、Gemini CLI、Cursor

gstackはSKILL.md標準をサポートするあらゆるエージェントで動作する。スキルは .agents/skills/ に配置され、自動検出される。

1つのリポジトリにインストール:

git clone https://github.com/garrytan/gstack.git .agents/skills/gstack
cd .agents/skills/gstack && ./setup --host codex

.agents/skills/gstack からsetupを実行した場合、生成されたCodexスキルは同じリポジトリ内の隣接ディレクトリにインストールされ、~/.codex/skills には書き込まれない。

ユーザーアカウント全体に一度だけインストール:

git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host codex

setup --host codex はランタイムルートを ~/.codex/skills/gstack に作成し、生成されたCodexスキルをトップレベルにリンクする。ソースリポジトリのチェックアウトからのスキル重複検出を回避するためだ。

setupにインストール済みのエージェントを自動検出させることもできる:

git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host auto

Codex互換ホスト向けには、.agents/skills/gstack からのリポジトリローカルインストールと ~/.codex/skills/gstack からのユーザーグローバルインストールの両方をサポートしている。28のスキルすべてがサポート対象のすべてのエージェントで動作する。フックベースのセーフティスキル(careful、freeze、guard)は、Claude以外のホストではインラインのセーフティアドバイザリー文を使用する。

動作例

あなた: カレンダーのデイリーブリーフィングアプリを作りたい。
あなた: /office-hours
Claude: [痛みの本質を掘り下げる — 仮定ではなく具体的な事例を聞く]

あなた: 複数のGoogleカレンダー、情報が古いイベント、間違った場所。
        準備に時間がかかりすぎるし、結果も十分じゃない…

Claude: ちょっと待ってください。フレーミングを見直しましょう。
        あなたは「デイリーブリーフィングアプリ」と言いました。
        でも実際に説明したのは、パーソナルな「チーフ・オブ・スタッフAI」です。
        [自分でも気づいていなかった5つの機能を抽出]
        [4つの前提に異議 — 同意、反論、調整のいずれかで応答]
        [3つの実装アプローチと工数見積もりを提示]
        推奨:明日出荷できる最小のウェッジから始めましょう。実際の
        使用から学ぶのです。完全なビジョンは3ヶ月のプロジェクト —
        まずは本当に使えるデイリーブリーフィングから。
        [設計ドキュメントを作成 → 後続のスキルに自動的に引き継がれる]

あなた: /plan-ceo-review
        [設計ドキュメントを読み、スコープに異議を唱え、10セクションのレビューを実行]

あなた: /plan-eng-review
        [データフロー、ステートマシン、エラーパスのASCII図]
        [テストマトリクス、障害モード、セキュリティ懸念]

あなた: プラン承認。プランモード終了。
        [11ファイルにわたり2,400行を生成。約8分。]

あなた: /review
        [自動修正] 2件。[要確認] 競合状態 → 修正を承認。

あなた: /qa https://staging.myapp.com
        [実際のブラウザを開き、フローを操作し、バグを発見して修正]

あなた: /ship
        テスト: 42 → 51(+9件追加)。PR: github.com/you/app/pull/42

あなたは「デイリーブリーフィングアプリ」と言った。エージェントは「チーフ・オブ・スタッフAIを作ろうとしている」と返した。機能要望ではなく、あなたの「痛み」に耳を傾けたからだ。8つのコマンドで、エンドツーエンド。これはコパイロットではない。チームだ。

スプリント

gstackはツールの寄せ集めではなく、プロセスだ。スキルはスプリントと同じ順序で実行される:

考える → 計画する → 作る → レビューする → テストする → 出荷する → 振り返る

各スキルは次のスキルに引き継がれる。/office-hours が書いた設計ドキュメントを /plan-ceo-review が読む。/plan-eng-review が書いたテスト計画を /qa が実行する。/review が見つけたバグの修正を /ship が検証する。すべてのステップが前のステップの成果を知っているから、何も取りこぼさない。

スキル 担当する専門家 役割
/office-hours YC Office Hours ここから始める。コードを書く前にプロダクトを再構築する6つの問い。フレーミングへの異議申し立て、前提への挑戦、実装の代替案を提示。設計ドキュメントはすべての後続スキルに引き継がれる。
/plan-ceo-review CEO / 創業者 問題を根本から考え直す。リクエストの中に隠れている「10つ星プロダクト」を見つける。4つのモード:拡張、選択的拡張、スコープ維持、縮小。
/plan-eng-review エンジニアリングマネージャー アーキテクチャ、データフロー、図、エッジケース、テストを確定させる。隠れた前提を表面化させる。
/plan-design-review シニアデザイナー 各デザインの軸を0-10で評価し、10点の状態を説明した上で、そこに到達するようプランを編集する。AIスロップ検知機能付き。インタラクティブ — デザイン上の選択ごとにAskUserQuestionを実行。
/design-consultation デザインパートナー デザインシステムをゼロから構築する。市場調査を行い、クリエイティブなリスクを提案し、リアルなプロダクトモックアップを生成する。
/review スタッフエンジニア CIは通るが本番で爆発するバグを見つける。自明なものは自動修正。完全性のギャップを指摘。
/investigate デバッガー 体系的な根本原因調査。鉄則:調査なくして修正なし。データフローを追跡し、仮説を検証し、3回失敗したら止まる。
/design-review コードも書けるデザイナー /plan-design-reviewと同じ監査を行い、見つけた問題をその場で修正する。アトミックコミット、ビフォー/アフターのスクリーンショット付き。
/qa QAリード アプリをテストし、バグを見つけ、アトミックコミットで修正し、再検証する。すべての修正に対して回帰テストを自動生成。
/qa-only QAレポーター /qaと同じ手法だが、レポートのみ。コード変更なしの純粋なバグレポート。
/cso 最高セキュリティ責任者 OWASP Top 10 + STRIDEの脅威モデリング。ノイズゼロ:17の偽陽性除外、信頼度8/10以上のゲート、独立した所見検証。各所見に具体的なエクスプロイトシナリオを含む。
/ship リリースエンジニア mainと同期、テスト実行、カバレッジ監査、プッシュ、PR作成。テストフレームワークがなければブートストラップする。
/land-and-deploy リリースエンジニア PRをマージし、CIとデプロイを待ち、本番環境の正常性を確認する。「承認済み」から「本番で検証済み」まで1コマンド。
/canary SRE デプロイ後のモニタリングループ。コンソールエラー、パフォーマンスの劣化、ページ障害を監視する。
/benchmark パフォーマンスエンジニア ページロード時間、Core Web Vitals、リソースサイズのベースラインを計測する。すべてのPRでビフォー/アフターを比較。
/document-release テクニカルライター 出荷した内容に合わせてすべてのプロジェクトドキュメントを更新する。古くなったREADMEを自動検出。
/retro エンジニアリングマネージャー チーム対応の週次レトロスペクティブ。メンバーごとの内訳、シッピングストリーク、テスト健全性の推移、成長機会。/retro global はすべてのプロジェクトとAIツール(Claude Code、Codex、Gemini)にまたがって実行。
/browse QAエンジニア 実際のChromiumブラウザ、実際のクリック、実際のスクリーンショット。1コマンドあたり約100ms。
/setup-browser-cookies セッションマネージャー 実際のブラウザ(Chrome、Arc、Brave、Edge)からヘッドレスセッションにCookieをインポート。認証済みページのテストが可能。
/autoplan レビューパイプライン 1コマンドで完全にレビュー済みのプランを生成。CEO → デザイン → エンジニアリングレビューを、組み込まれた判断原則に基づいて自動実行。テイスト(感性的な判断)が必要な箇所のみ承認を求める。

パワーツール

スキル 機能
/codex セカンドオピニオン — OpenAI Codex CLIによる独立したコードレビュー。3つのモード:レビュー(合否ゲート)、アドバーサリアルチャレンジ、オープンコンサルテーション。/review/codex の両方を実行した場合、クロスモデル分析を実施。
/careful セーフティガードレール — 破壊的なコマンド(rm -rf、DROP TABLE、force-push)の実行前に警告。「be careful」と言えば有効化。任意の警告をオーバーライド可能。
/freeze 編集ロック — ファイル編集を1つのディレクトリに制限。デバッグ中にスコープ外の意図しない変更を防止。
/guard フルセーフティ/careful + /freeze を1コマンドで。本番作業時の最大安全モード。
/unfreeze ロック解除/freeze の制限を解除する。
/setup-deploy デプロイ設定/land-and-deploy 用のワンタイムセットアップ。プラットフォーム、本番URL、デプロイコマンドを自動検出。
/gstack-upgrade セルフアップデーター — gstackを最新版に更新する。グローバル/ベンダーインストールを検出し、両方を同期し、差分を表示。

全スキルの詳細解説・実例・設計思想はこちら →

パラレルスプリント

gstackは1つのスプリントでも十分に機能する。10個同時に走らせると、さらに面白くなる。

Conductorは複数のClaude Codeセッションを並列で実行する。それぞれが独立したワークスペースで動作する。1つのセッションが /office-hours、別のセッションが /review、3つ目がフィーチャーの実装、4つ目が /qa を実行。すべて同時にだ。並列処理を可能にしているのはスプリントの構造だ。プロセスがなければ、10のエージェントは10の混乱の元にしかならない。プロセスがあれば、各エージェントは何をすべきか、いつ止まるべきかを正確に把握している。


無料、MITライセンス、オープンソース。プレミアムティアなし、ウェイトリストなし。

自分のソフトウェアの作り方をオープンソースにした。フォークして自分のものにしてほしい。

採用中。 1日10K行以上のコードを書き、gstackの品質を高めたい方へ。 YCで一緒に働きませんか — ycombinator.com/software 極めて競争力のある給与とエクイティ。サンフランシスコ、ドッグパッチ地区。

ドキュメント

ドキュメント 内容
スキル詳細解説 全スキルの設計思想、実例、ワークフロー(Greptile連携含む)
ビルダー哲学 ビルダーの哲学:Boil the Lake、Search Before Building、3層の知識モデル
アーキテクチャ 設計上の意思決定とシステムの内部構造
ブラウザリファレンス /browse の全コマンドリファレンス
コントリビューティング 開発環境構築、テスト、コントリビューターモード、開発モード
変更履歴 各バージョンの変更点

プライバシーとテレメトリ

gstackにはオプトイン方式の使用状況テレメトリが含まれており、プロジェクトの改善に役立てている。仕組みは以下の通り:

  • デフォルトはオフ。 明示的に同意しない限り、何もどこにも送信されない。
  • 初回実行時、 匿名の使用状況データを共有するか確認される。断ることもできる。
  • 送信される情報(オプトインした場合): スキル名、所要時間、成功/失敗、gstackバージョン、OS。以上。
  • 送信されない情報: コード、ファイルパス、リポジトリ名、ブランチ名、プロンプト、その他ユーザーが生成したコンテンツ一切。
  • いつでも変更可能: gstack-config set telemetry off で即座にすべて無効化できる。

データはSupabase(オープンソースのFirebase代替)に保存される。スキーマは supabase/migrations/001_telemetry.sql にあり、収集内容を正確に確認できる。リポジトリに含まれるSupabaseのpublishable keyはパブリックキー(Firebase APIキーと同様)であり、Row Level Securityポリシーによりinsert-onlyのアクセスに制限されている。

ローカル分析は常に利用可能。 gstack-analytics を実行すれば、ローカルのJSONLファイルから個人の使用状況ダッシュボードを確認できる。リモートデータは不要。

トラブルシューティング

スキルが表示されない場合: cd ~/.claude/skills/gstack && ./setup

/browse が失敗する場合: cd ~/.claude/skills/gstack && bun install && bun run build

インストールが古くなった場合: /gstack-upgrade を実行。または ~/.gstack/config.yamlauto_upgrade: true を設定。

Codexで「Skipped loading skill(s) due to invalid SKILL.md」と表示される場合: Codexのスキル定義が古くなっている。修正方法:cd ~/.codex/skills/gstack && git pull && ./setup --host codex。リポジトリローカルインストールの場合:cd "$(readlink -f .agents/skills/gstack)" && git pull && ./setup --host codex

Windowsユーザー: gstackはGit BashまたはWSL経由でWindows 11上で動作する。Bunに加えてNode.jsが必要 — BunにはPlaywrightのpipeトランスポートに関する既知のバグがある(bun#4253)。ブラウザサーバーは自動的にNode.jsにフォールバックする。bunnode の両方がPATHに含まれていることを確認すること。

Claudeがスキルを認識しない場合: プロジェクトの CLAUDE.md にgstackセクションがあることを確認する。以下を追加:

## gstack
Use /browse from gstack for all web browsing. Never use mcp__claude-in-chrome__* tools.
Available skills: /office-hours, /plan-ceo-review, /plan-eng-review, /plan-design-review,
/design-consultation, /review, /ship, /land-and-deploy, /canary, /benchmark, /browse,
/qa, /qa-only, /design-review, /setup-browser-cookies, /setup-deploy, /retro,
/investigate, /document-release, /codex, /cso, /autoplan, /careful, /freeze, /guard,
/unfreeze, /gstack-upgrade.

ライセンス

MIT。永久に無料。さあ、何かを作ろう。