テープ起こし、自動文字起こしに Adobe Premiere Pro を使ってみる ~意外にも自動文字起こしの認識率が良好~
テープ起こし...最近では、ICレコーダー起こしなのかもしれないし、スマホ起こしなのかもしれませんが、要は録音(録画)ファイルからの自動文字起こし(テキスト化)についての一例の紹介です。
最近は、文字起こしのために、無料・有料、さまざまなサービスが存在します。
独自エンジンを使っていたり、Google系のサービスを使っていたり、様々ですが、認識率は結構違う印象です。
日本においては、日本語の自動文字起こしが多いと思います。
ただし、話者が増えて来たり、男女の声などで音の高低差が大きいと認識率が悪くなるものも存在する印象です。
また、日本語、英語が混ざってくると、日本語のみしか正しく文字起こししてくれないなど、課題はまだ多いようです。
最近は、リコー製のtorunoというサービスを使い、自動文字起こしする音声ファイルの内容に応じて、個別の辞書を用意しして自動文字起こしを行っていました。
そんな時に、Adobe の Premiere を使う機会があったので、搭載された自動文字起こしの機能を使ってみることにしました。
ちょっと試すだけのつもりだったのですが、意外にも優秀で、これが2022年10月現在の本命かもしれません。
とはいえ、月額利用料を考えると高いのですが、それでも有料の自動文字起こしサービスよりも安い気がします(ただし、動画編集をする人であれば...という条件付き)。
使い方はシンプルです。
Adobe Premiere Proをインストールし、自動文字起こしをしたい音声ファイル(MP3等)または映像ファイル(MP4等)をメディア(1)としてよみこませたのち、タイムライン(2)にドラッグ&ドロップし、あとは、「シーケンスから文字起こし」をクリックして、自動文字起こしを実行するだけです。
Premiere Proのインストール直後は、英語しか文字起こしできないようですが、「日本語」を選択することで言語パックがダウンロードされ、日本語の自動文字起こしも可能になります。
Premiere Proの自動文字起こしには、複数の話者がいる時のチェックボックスがあります。
自動文字起こしの作業後には、テキストファイル等、書き出し形式がいくつもあります。
2022年10月現在の文字起こしの認識率を比較した印象では、Adobe Premiere Proが一番認識率が高かったです。
Googleの文字起こしサービスは複数の話者がいると認識率が下がったり、停止してしまう(Googleドキュメント時)印象。
リコーのtorunoは、個別の辞書を登録するとその効果が出る反面、やはり個別辞書を準備する手間が面倒です。
Adobe Premiere Proはシンプルに、特に工夫をせずとも、意外に自動文字起こしの認識率が高い印象です。
最近のコメント