音声文字起こしと話者分離を簡単に行えるソフトウェア!
- Python 3.7以上
- FFmpeg
- VLCメディアプレイヤー
- このリポジトリをクローン:
git clone https://github.com/NullMagic2/SoftWhisper .-
必要なソフトウェアをインストール:
- Python (3.7以上)
- FFmpeg
- VLCメディアプレイヤー
-
依存パッケージをインストール:
pip install -r requirements.txt- SoftWhisper.batを実行:
.\SoftWhisper.bat- GUIが起動したら、以下の手順で文字起こし:
- 音声/動画ファイルを選択
- モデルサイズを選択(tiny, base, small, medium, large)
- 必要に応じて話者分離機能を有効化
- 「開始」ボタンをクリック
- 🎯 高精度な文字起こし(Whisperモデル使用)
- 👥 話者分離機能(誰が話したかを識別)
- 🌍 多言語サポート
- 🎮 使いやすいGUIインターフェース
-
libvlc.dll not foundエラー- VLCメディアプレイヤーがインストールされていることを確認してください
- インストール後、プログラムを再起動してください
-
FFmpegエラー
- FFmpegが正しくインストールされ、PATHに追加されていることを確認してください
このプロジェクトは以下のオープンソースプロジェクトを使用しています:
