« 「パーソナル編集長 Ver.14 」(ソースネクスト)で、スポーツ新聞風のチラシをつくってみる | トップページ | ノートPCのWebカメラやスマホカメラのレンズカバー/カメラカバー ~在宅勤務やオンライン会議でカメラに映りたくない場合に~ »

2020年7月 1日 (水)

録音・動画ファイルから音声認識して自動で字幕を作成・編集できるソフトウェア 『Vrew』 ~議事録作成、インタビュー等の文字起こしにも~

会議の議事録やインタビューをICレコーダー等に録音して、文字起こしをするのは、結構な労力を要する仕事で、これが自動化できれば...と以前からずっと考えていました。
音声認識ソフトの類は、今までにもいくつか発売されていますが、OCRソフト同様、認識率はあまり満足がいくものではありませんでした。

そこに、Google音声認識が登場し、急激に音声の認識率があがりました。Androidスマホのアプリで、Google音声認識を見つけて、使用した時は、ある程度ゆっくり、はっきり話す必要があったものの、その認識率の高さは従来のものとは違い、驚いたものでした。

 

このGoogleの音声認識技術を利用した自動字幕作成・編集できるソフトウェアが登場しました。それが『Vrew』です。

Vrew0

 

2020年7月1日現在、Vrewは、バージョン0.4.28

Ver0428

 

まだ、Ver.1.0に満たない製品ですが、その機能と有益性は非常に高いものと考えています。

約112MBほどのファイルからインストールし、Vrewを起動すると、サンプルの動画と音声認識および自動字幕作成結果の画面が表示されます。

Vrew

画面は非常にシンプルで、直感的な操作が可能です。

自前の録音ファイル(MP3等)や動画ファイル(MP4等)をVrewで開き、認識言語(日本語等)を設定すると、ファイルサイズにもよりますが、すぐに分析をはじめ、結果を表示してくれます。

分析・字幕作成結果は、画面上で確認でき、その場で修正が可能です。

また、分析・字幕作成の状態をプロジェクトとして保存したり、字幕ファイルのみをテキストとして保存できたりします。

 

こんな便利な「Vrew」ですが、ごくまれに、正常に音声認識できない録音ファイルがあります。

どんな録音ファイルかというと、ステレオ録音された音声ファイルで、分析結果の音声認識がほぼ使えない状態になります。

また、元ファイルでは正常に聞こえる音声が、分析後の確認画面ではひどく劣化した高く・かすれたような音声になってしまいます。

 

この件については、別途、調査や問い合わせをしてみたいと思います。

 

【2020/07/02 更新】

Vrewに問い合わせてみたところ、同様の報告があるとのことでした。
Vrewでは、STEREO音声をMONO化するプロセスがあり、そこでうまくMONO化できなかった場合に、認識がうまくいかないといった問題が発生するそうです。
改善項目として、要望を伝えることができました。

 

« 「パーソナル編集長 Ver.14 」(ソースネクスト)で、スポーツ新聞風のチラシをつくってみる | トップページ | ノートPCのWebカメラやスマホカメラのレンズカバー/カメラカバー ~在宅勤務やオンライン会議でカメラに映りたくない場合に~ »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« 「パーソナル編集長 Ver.14 」(ソースネクスト)で、スポーツ新聞風のチラシをつくってみる | トップページ | ノートPCのWebカメラやスマホカメラのレンズカバー/カメラカバー ~在宅勤務やオンライン会議でカメラに映りたくない場合に~ »

Google Adsense

2024年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

最近のコメント

最近のトラックバック

無料ブログはココログ