音声ノイズ除去
文字起こし前に録音のバックグラウンドノイズを除去
ブラウザベースのWhisperモデルを使用して高精度で音声をテキストに変換。99言語をサポートし、タイムスタンプ付き文字起こしを生成、SRT、VTT、プレーンテキストにエクスポート。アップロード不要、アカウント不要。
WebAssemblyでのOpenAI Whisper(tiny/base/smallモデル)を使用
自動言語検出で99言語をサポート
精密なナビゲーションのための単語レベルのタイムスタンプ
SRT、VTT、プレーンTXT形式でエクスポート
話者分離(ベータ版)
マイク入力のリアルタイム文字起こし
ブラウザ内でトランスクリプトを編集・修正
MP3、WAV、M4A、FLAC、OGG、WebMを最大500MBまでアップロード
初回使用時に、Whisperモデル(約150MB)がダウンロードされ、ブラウザにキャッシュされます。
音声ファイルをドロップするか、マイクから直接録音します。
モデルが音声をローカルでチャンク単位で処理し、タイムスタンプ付きのテキストセグメントを生成します。
トランスクリプトを読んで編集・検索し、希望のフォーマットでエクスポートします。
音声文字起こしを無料で試したいけれど、アカウント登録が面倒、または録音データを外部サーバーに送りたくないという方は多いのではないでしょうか。 Zerakuの音声文字起こしツールは、OpenAI WhisperをWebAssemblyでブラウザ上に直接動作させることで、クラウド型サービスに頼らずに高精度な文字起こしを実現しています。音声ファイルはデバイスから外に出ることなく、すべての処理がブラウザ内で完結します。会議の議事録、取材音声、個人のボイスメモなど機密性の高いデータも安心して処理できます。 アカウント不要・分単位の課金なし・アップロード制限なし。初回モデルダウンロード(約150MB)後は完全オフラインで動作するため、電車や飛行機の中でも使えます。 主な活用シーン:ZoomやGoogle Meetの録音から議事録を自動作成 / YouTube動画用にSRT字幕ファイルを生成 / ジャーナリストや研究者のインタビュー書き起こし / 講義・セミナーの内容をテキスト化して学習効率アップ / ポッドキャストのショーノートやVTT字幕の作成。日本語を含む99言語に対応し、言語は自動検出されます。
多くの文字起こしツールは音声データを外部サーバーに送信するため、機密情報を含む会議録音や個人的なメモには使いにくい場合があります。Zerakuはすべての処理がブラウザ内で完結するため、データが手元を離れることなく安心して利用できます。
| Zeraku | サービスA | サービスB | |
|---|---|---|---|
| 完全無料 | ✓ | △月3回まで | △10分まで |
| プライバシー(データ送信なし) | ✓ブラウザ完結 | ✗サーバー送信 | ✗サーバー送信 |
| アカウント登録不要 | ✓ | ✗必須 | ✗必須 |
| オフライン利用(2回目以降) | ✓キャッシュ済み | ✗常時接続必要 | ✗常時接続必要 |
| 対応言語数 | 99言語自動検出 | 58言語 | 100言語+有料プランのみ |
| SRT/VTT字幕エクスポート | ✓無料 | ✓有料プランのみ | ✓有料プランのみ |
| 話者分離 | △ベータ版 | ✓有料プランのみ | ✓有料プランのみ |
| ファイルサイズ上限 | 500MB | 25MB無料プラン | 100MB無料プラン |
音声文字起こしとは、音声や動画の話し言葉を自動でテキストに変換する機能です。会議録音の議事録作成、動画への字幕追加、インタビューの書き起こし、授業の要点まとめに役立ちます。使い方はシンプルです。音声ファイル(MP3・WAV・M4A・FLAC)をアップロードし、言語を選択してスタートを押すだけ。テキストファイル(.txt)またはYouTubeに直接アップロードできる字幕ファイル(.srt)としてダウンロードできます。専門知識は一切不要です。
音声文字起こしを試してみませんか?
音声文字起こしを開く — 無料