日本語の音声/動画を高精度にテキスト化するAI文字起こしツール
会議やインタビュー、講演、セミナーといった日本語の音声・動画を、高精度で文字に起こせる、Apple Silicon搭載Mac専用の文字起こしツール。
音声認識エンジン「mlx-whisper」と話者分離AIを用いて正確なテキスト化を実現します。
リアルタイムに文字起こしするのではなく、音声または動画ファイルを読み込ませてからテキスト化をします。
処理はすべてMac本体内で完結するため(インターネット接続は不要)機密性が求められる議事録作成にも安心して利用可能。
複数人の話者を自動で識別・ラベル付けする話者分離機能(スピーカーダイアライゼーション)、不要語や繰り返しの自動除去、自然な区切りで文章を整えるBERTベースの日本語句読点自動補完機能なども搭載しています。
さらに、タイムスタンプ付きSRTファイルの出力に対応し、映像への字幕挿入が容易。オフライン環境下でもワンクリックで英訳できるほか、言語識別機能により多言語混在音声にも対応するため、国際的な会議や多言語プロジェクトにも便利。
購入後は文字起こし回数に制限がなく、長時間録音の処理も可能。推奨環境はmacOS Sequoia以降、メモリ8GB以上(推奨16GB)、十分なディスク空き容量が必要。



【変更点】
・同一話者の連続発話を結合認識して、速度と精度を向上
・単一言語認識時の言語識別精度を向上
・セグメントベースのハルシネーションフィルタを追加
・MLX Whisperを最新版に更新
・mel_filtersの事前ロードによる速度向上
・話者名編集時、反映処理が重いのを軽減
完全無料版として、最新の超高速文字起こしエンジン「par
【先着50名限定】
50%オフになる「 ブラックフライデーキャンペーンコード」→ FFTRANS-BF50

ミュージシャンハムスターTシャツ by studio.mu シルエットスタヂオ