Skip to content

Latest commit

 

History

History
81 lines (58 loc) · 2.52 KB

File metadata and controls

81 lines (58 loc) · 2.52 KB

SoftWhisper 🎤✨

JA doc EN doc

Python 3.7+ FFmpeg VLC

音声文字起こしと話者分離を簡単に行えるソフトウェア!

必要な環境

  • Python 3.7以上
  • FFmpeg
  • VLCメディアプレイヤー

インストール手順

  1. このリポジトリをクローン:
git clone https://github.com/NullMagic2/SoftWhisper .
  1. 必要なソフトウェアをインストール:

  2. 依存パッケージをインストール:

pip install -r requirements.txt

使い方

  1. SoftWhisper.batを実行:
.\SoftWhisper.bat
  1. GUIが起動したら、以下の手順で文字起こし:
    • 音声/動画ファイルを選択
    • モデルサイズを選択(tiny, base, small, medium, large)
    • 必要に応じて話者分離機能を有効化
    • 「開始」ボタンをクリック

image

機能

  • 🎯 高精度な文字起こし(Whisperモデル使用)
  • 👥 話者分離機能(誰が話したかを識別)
  • 🌍 多言語サポート
  • 🎮 使いやすいGUIインターフェース

トラブルシューティング

よくある問題

  1. libvlc.dll not foundエラー

    • VLCメディアプレイヤーがインストールされていることを確認してください
    • インストール後、プログラムを再起動してください
  2. FFmpegエラー

    • FFmpegが正しくインストールされ、PATHに追加されていることを確認してください

ライセンス

MITライセンス

謝辞

このプロジェクトは以下のオープンソースプロジェクトを使用しています: