Question 1

文字起こしはデバイス上で行われますか？

Accepted Answer

はい。すべてブラウザ内で実行されます。音声ファイルはいかなるサーバーにも送信されません。

Question 2

文字起こしの精度はどの程度ですか？

Accepted Answer

Whisper smallモデルを使用した場合、サポートされている言語の明確な音声では通常90〜95%の精度です。強いアクセントや背景ノイズがある場合は精度が低下します。

Question 3

初回読み込みにどのくらい時間がかかりますか？

Accepted Answer

Whisper smallモデルは約150MBです。ダウンロード時間は接続速度によります。初回ダウンロード後はキャッシュされます。

Question 4

どの言語に対応していますか？

Accepted Answer

英語、日本語、スペイン語、フランス語、ドイツ語、中国語、アラビア語など、WhisperモデルでサポートされるすべてのSS99言語。

Question 5

最大ファイルサイズは？

Accepted Answer

最大500MBのファイルをサポートしています。非常に大きなファイルの場合、デバイスによっては処理に時間がかかる場合があります。

Question 6

SRTファイルとは何ですか？YouTube字幕に使えますか？

Accepted Answer

SRTはタイムスタンプ付きの字幕ファイル形式です。YouTubeの字幕機能に直接アップロードできるため、動画に正確な字幕を簡単に追加できます。

Question 7

話者分離（話者識別）機能とは何ですか？

Accepted Answer

複数の話者が発言している音声を「話者1」「話者2」のように自動で区別してテキスト化する機能です。誰が何を話したかを把握できます（ベータ版）。

Question 8

初回以降はオフラインで使えますか？

Accepted Answer

はい。初回にモデルをダウンロードするとブラウザにキャッシュされるため、2回目以降はオフラインでも利用できます。

Question 9

日本語の文字起こし精度はどの程度ですか？

Accepted Answer

OpenAI WhisperのSmallモデル使用で、クリアな音声であれば90%以上の精度です。専門用語や方言は精度が下がる場合があります。

Question 10

会議の録音を文字起こしできますか？

Accepted Answer

はい。MP3、WAV、M4A、FLAC形式に対応しています。ZoomやGoogle Meetの録音データもそのままアップロード可能です。

Question 11

スマートフォンからも使えますか？

Accepted Answer

ブラウザベースのため、Chrome/Safariが動作するスマートフォンでも利用できます。ただしモデルの読み込みにWi-Fi環境を推奨します。

Question 12

録音データはサーバーに保存されますか？

Accepted Answer

いいえ。すべての処理はお使いのブラウザ内で完結し、音声データが外部サーバーに送信されることは一切ありません。

音声文字起こし

音声文字起こしとは？