Apple Silicon専用AI話者分離・文字起こしアプリ「FFTrans」ですが、日本語での文字起こし精度を向上させるため、「独自開発のカスタム辞書機能」を追加して、FFTrans Proとしてリリースしました。
ぶっちゃけカスタム辞書はクラウドファンディングで資金調達して開発しようと思っていたのですが、それでは提供がだいぶ先になってしまいますし、自分で使ってみてもやっぱり欲しいなと。
これまでいろんな音声で実験してみて、ちょっと残念だなぁと思った部分を切り抜いておいてそれをカバーできるようにしていった感じです。
実例を見てみましょう。
まずはその残念な文字起こし結果の集合体。
小柴風華が親友と夫に振り回された人生をやり直す勘弁ミサを。
私佐藤武はミサの2度目の人生を大きく左右する鈴木渉を演じます。
ツール「FFトランス」第3営業部の紹介です。
かわいいりなです。
夢島駅と永田駅の間で運転を見合わせていましたが。
福岡ソフトバンクホークスはソフトバンクがスポンサーをしています。
ここマンションがずらっと並んでますけども、ここ全部春見フラッグなんですね。
南港ポートタウン船を増発。
晩泊会場で一夜を過ごす人たち。
教養部分には神奈川県千賀咲市から家族で移住した。
今度はイヤーパッド、のモスキート
最後の部分は現状存在しない固有名詞が助詞と名詞に分かれてしまっている場合にも、ちゃんと辞書が有効に機能するかを試すためのものですね。
結果は以下の通り。
小芝風花が親友と夫に振り回された人生をやり直す神戸美紗を。
私佐藤健はミサの2度目の人生を大きく左右する鈴木亘を演じます。
ツール「FFTrans」第三営業部の紹介です。
川栄李奈です。
夢洲駅と長田駅の間で運転を見合わせていましたが。
福岡ソフトバンクホークスはSoftBankがスポンサーをしています。
ここマンションがずらっと並んでますけども、ここ全部晴海フラッグなんですね。
南港ポートタウン線を増発。
万博会場で一夜を過ごす人たち。
共用部分には神奈川県茅ヶ崎市から家族で移住した。
今度ハイヤーパッド、野茂スキート
「ハイヤーパッド」や「野茂スキート」といった架空の固有名詞も登録するとちゃんと登録された単語になっていますね。
ちなみにこのカスタム辞書、自然言語処理ベースで作られていて、文字起こし結果を「読み戻し」してトークン単位でファジーマッチングしているので、文字起こし後に単語を追加・編集したら、すぐにその結果が文字起こしした文章に反映できるというのが特徴です。
「辞書に登録したから、もう一回文字起こししなきゃ」という必要が一切ないわけです。
こう書くと単なる置換みたいですけど、実際にはそう簡単にはいかなくて結構苦労しました。
判定を緩くすると前後の短い助詞などを巻き込んで置換してしまいがちですし、厳しくすると「かわいいりな」みたいな、そもそも読みが間違えているものを正しい単語にすることができません。
この辺りは形態素解析や細かい判定基準のおかげでなんとかバランスを取っています。
今はカスタム辞書の単語数は300を上限にしていますが、高速処理のロジックもほぼできているのでそちらに切り替えれば数千単位の辞書にも対応可能です。
その際にはたとえば医療用単語とか業種別辞書のようなものを追加したり、あるいはインポート・エクスポート機能も用意したいなと思っています。
どちらにしても再度文字起こしせずに済むのはおそらく使い勝手の上で大きく差が出るはずです。
またSRTプレビューも文字起こしや話者の信頼度、同音異義語の選択など、単なるテキストエディタとは違う編集機能も追加したいところではあります。
FFTrans Proは永久ライセンスですから、こうした今後のアップデートもこれまで購入いただいた方には全て無償で提供されます。
今後もよほどのメジャーアップデートを除いて、すべての新機能を使うための追加料金や年間契約は一切不要です。
ただ元々、カスタム辞書は上位バージョンにする予定でしたので、FFTrans Proへのアップグレードに伴い、価格は改定する予定です。
そもそもProは2万円を予定していたくらいですので…。
ただ発売開始キャンペーンで9月いっぱいは従来価格のままでご提供しています。
ちなみに体験版はProとの性能差が大き過ぎて、すでに「体験版」として機能しなくなってしまいましたので廃止することにしました。
その代わりといってはなんですが、無料版のFFTrans Freeという形に生まれ変わらせました。
こちらも単なる「Whisperラッパー」ではなく、以下のような機能を有しています。
・話者分離と話者特徴量保存による次回以降の自動名前設定
・音声の言語識別による他言語の誤認識抑止
・3種類のハルシネーション除外フィルター
・FFmpeg排除によるダウンサンプリング精度の向上
・Entitlemetsによるアプリのネットワークアクセス完全遮断
・サンドボックス動作による他アプリからのデータ保護
1回の文字起こしは60分までという制限はありますが、あくまでも1ファイルにつき、ですので、ファイルさえ分ければ何度だって永久に無料で使えます。
商用利用こそできませんが、本来はBasicバージョンになるはずだったものに限りなく近い仕様です。
むしろメモリ8GBでもなんとか動作するので、個人利用には最適なものになっているはずです。
FFTrans Freeはもちろん、FFTrans Proを試してみたい!という方には期間限定ライセンスも提供可能です。
特にレビューしてみたいという方はぜひお待ちしております。
またFFTrans Pro永久ライセンスのプレゼントキャンペーンも実施しているので、そちらもぜひご応募ください。
コメント