FFTrans Pro 1.6.0 - 日本語の音声／動画を高精度にテキスト化するAI文字起こしツール

2025年11月15日

有料：15,000円（永久ライセンス）→50名限定の50%OFFキャンペーンコードはページ下部参照）

日本語の音声／動画を高精度にテキスト化するAI文字起こしツール

会議やインタビュー、講演、セミナーといった日本語の音声・動画を、高精度で文字に起こせる、Apple Silicon搭載Mac専用の文字起こしツール。

音声認識エンジン「mlx-whisper」と話者分離AIを用いて正確なテキスト化を実現します。

リアルタイムに文字起こしするのではなく、音声または動画ファイルを読み込ませてからテキスト化をします。

処理はすべてMac本体内で完結するため（インターネット接続は不要）機密性が求められる議事録作成にも安心して利用可能。

複数人の話者を自動で識別・ラベル付けする話者分離機能（スピーカーダイアライゼーション）、不要語や繰り返しの自動除去、自然な区切りで文章を整えるBERTベースの日本語句読点自動補完機能なども搭載しています。

さらに、タイムスタンプ付きSRTファイルの出力に対応し、映像への字幕挿入が容易。オフライン環境下でもワンクリックで英訳できるほか、言語識別機能により多言語混在音声にも対応するため、国際的な会議や多言語プロジェクトにも便利。

購入後は文字起こし回数に制限がなく、長時間録音の処理も可能。推奨環境はmacOS Sequoia以降、メモリ8GB以上（推奨16GB）、十分なディスク空き容量が必要。

【変更点】

・同一話者の連続発話を結合認識して、速度と精度を向上
・単一言語認識時の言語識別精度を向上
・セグメントベースのハルシネーションフィルタを追加
・MLX Whisperを最新版に更新
・mel_filtersの事前ロードによる速度向上
・話者名編集時、反映処理が重いのを軽減

完全無料版として、最新の超高速文字起こしエンジン「parakeet_mlx」と「parakeet-tdt-0.6b-v3」を用いた「FFTrans Parakeet」も公開されました。日本語には非対応ですが、英語をはじめとする欧州系言語を含め25言語に対応。話者分離を含む文字起こしの処理速度は従来比で最大3倍に達します。例えば、先日のAppleイベント（70分）を題材にすると、FFTrans Parakeetは約4分強で話者分離と文字起こしを完了（Mac Studio M2 Maxで計測）。同条件でFFTrans Proでは12分かかりました。

【先着50名限定】

50%オフになる「ブラックフライデーキャンペーンコード」→ FFTRANS-BF50

Webサイトからダウンロード