Zeraku
← Back to Tools
🎙️
🌐 Runs in Browser⏱ Est. 1–3× real-timeNEW

音声文字起こし

Whisperレベルの精度で音声をテキストに変換 — 無料でプライベート

Try It Now — Free

What is 音声文字起こし?

ブラウザベースのWhisperモデルを使用して高精度で音声をテキストに変換。99言語をサポートし、タイムスタンプ付き文字起こしを生成、SRT、VTT、プレーンテキストにエクスポート。アップロード不要、アカウント不要。

Key Features

WebAssemblyでのOpenAI Whisper(tiny/base/smallモデル)を使用

自動言語検出で99言語をサポート

精密なナビゲーションのための単語レベルのタイムスタンプ

SRT、VTT、プレーンTXT形式でエクスポート

話者分離(ベータ版)

マイク入力のリアルタイム文字起こし

ブラウザ内でトランスクリプトを編集・修正

MP3、WAV、M4A、FLAC、OGG、WebMを最大500MBまでアップロード

How It Works

1

モデルを読み込む

初回使用時に、Whisperモデル(約150MB)がダウンロードされ、ブラウザにキャッシュされます。

2

音声をアップロード

音声ファイルをドロップするか、マイクから直接録音します。

3

文字起こし

モデルが音声をローカルでチャンク単位で処理し、タイムスタンプ付きのテキストセグメントを生成します。

4

確認とエクスポート

トランスクリプトを読んで編集・検索し、希望のフォーマットでエクスポートします。

Who Is This For?

  • インタビューを文字起こしするジャーナリスト
  • ショーノートと字幕を作成するポッドキャスター
  • 講義を文字起こしする学生
  • 動画のキャプションを生成するコンテンツクリエーター
  • 定性データを文字起こしする研究者

Why Use 音声文字起こし?

Unlike cloud-based alternatives that upload your files to remote servers, 音声文字起こし runs entirely in your browser. Your data stays private. No account, no subscription, no upload limits — just instant results. Built with cutting-edge web technologies including WebAssembly and WebGL for near-native performance.

Technical Details

EmscriptenでWebAssemblyにコンパイルされたwhisper.cppを使用。音声はWeb Audio APIでデコードされ、30秒のセグメントに分割され、専用のWeb Workerで処理されます。モデルファイルはCache APIを使用してキャッシュされます。

Frequently Asked Questions

Related Tools

Ready to try 音声文字起こし?

Open 音声文字起こし — Free
Advertisement320 × 50