日本語の音声/動画を高精度にテキスト化するAI文字起こしツール
会議やインタビュー、講演、セミナーといった日本語の音声・動画を、高精度で文字に起こせる、Apple Silicon搭載Mac専用の文字起こしツール。
音声認識エンジン「mlx-whisper」と話者分離AIを用いて正確なテキスト化を実現します。
リアルタイムに文字起こしするのではなく、音声または動画ファイルを読み込ませてからテキスト化をします。
処理はすべてMac本体内で完結するため(インターネット接続は不要)機密性が求められる議事録作成にも安心して利用可能。
複数人の話者を自動で識別・ラベル付けする話者分離機能(スピーカーダイアライゼーション)、不要語や繰り返しの自動除去、自然な区切りで文章を整えるBERTベースの日本語句読点自動補完機能なども搭載しています。
さらに、タイムスタンプ付きSRTファイルの出力に対応し、映像への字幕挿入が容易。オフライン環境下でもワンクリックで英訳できるほか、言語識別機能により多言語混在音声にも対応するため、国際的な会議や多言語プロジェクトにも便利。
購入後は文字起こし回数に制限がなく、長時間録音の処理も可能。推奨環境はmacOS Monterey(12.0)以降、メモリ8GB以上(推奨16GB)、十分なディスク空き容量が必要。
なお、公式サイトでは体験版を配布中です。体験版では、文字起こしに利用できるモデルが「medium-v3」に限られるほか(製品版で搭載される高精度の「large-v3」には非対応)、オフライン英語翻訳機能は利用できません。さらに、1回あたりの文字起こし時間は20分までに制限されています。体験版の利用期限は2025年12月31日まで。
【変更点】
「BERTベースの日本語句読点自動補完機能」を追加。音声認識後の文章がより自然で、圧倒的に読みやすくなります。
当サイト読者限定の10%OFFキャンペーンコードは、「MACSOFT-FFTR2509」です。