録音・動画ファイルから音声認識して自動で字幕を作成・編集できるソフトウェア 『Vrew』 ~議事録作成、インタビュー等の文字起こしにも~
会議の議事録やインタビューをICレコーダー等に録音して、文字起こしをするのは、結構な労力を要する仕事で、これが自動化できれば...と以前からずっと考えていました。
音声認識ソフトの類は、今までにもいくつか発売されていますが、OCRソフト同様、認識率はあまり満足がいくものではありませんでした。
そこに、Google音声認識が登場し、急激に音声の認識率があがりました。Androidスマホのアプリで、Google音声認識を見つけて、使用した時は、ある程度ゆっくり、はっきり話す必要があったものの、その認識率の高さは従来のものとは違い、驚いたものでした。
このGoogleの音声認識技術を利用した自動字幕作成・編集できるソフトウェアが登場しました。それが『Vrew』です。
2020年7月1日現在、Vrewは、バージョン0.4.28
まだ、Ver.1.0に満たない製品ですが、その機能と有益性は非常に高いものと考えています。
約112MBほどのファイルからインストールし、Vrewを起動すると、サンプルの動画と音声認識および自動字幕作成結果の画面が表示されます。
画面は非常にシンプルで、直感的な操作が可能です。
自前の録音ファイル(MP3等)や動画ファイル(MP4等)をVrewで開き、認識言語(日本語等)を設定すると、ファイルサイズにもよりますが、すぐに分析をはじめ、結果を表示してくれます。
分析・字幕作成結果は、画面上で確認でき、その場で修正が可能です。
また、分析・字幕作成の状態をプロジェクトとして保存したり、字幕ファイルのみをテキストとして保存できたりします。
こんな便利な「Vrew」ですが、ごくまれに、正常に音声認識できない録音ファイルがあります。
どんな録音ファイルかというと、ステレオ録音された音声ファイルで、分析結果の音声認識がほぼ使えない状態になります。
また、元ファイルでは正常に聞こえる音声が、分析後の確認画面ではひどく劣化した高く・かすれたような音声になってしまいます。
この件については、別途、調査や問い合わせをしてみたいと思います。
【2020/07/02 更新】
Vrewに問い合わせてみたところ、同様の報告があるとのことでした。
Vrewでは、STEREO音声をMONO化するプロセスがあり、そこでうまくMONO化できなかった場合に、認識がうまくいかないといった問題が発生するそうです。
改善項目として、要望を伝えることができました。
« 「パーソナル編集長 Ver.14 」(ソースネクスト)で、スポーツ新聞風のチラシをつくってみる | トップページ | ノートPCのWebカメラやスマホカメラのレンズカバー/カメラカバー ~在宅勤務やオンライン会議でカメラに映りたくない場合に~ »
「パソコン・インターネット」カテゴリの記事
- Affinity がスプリングセールを開催中らしい(2024年4月10日現在)Affinity V2 Universal Licence (Upgrade)がお得(2024.04.10)
- Windows Update(KB5034848)がインストールできない ~予定どおりに完了できませんでした。~(2024.03.04)
- Windows ネットワークに現れた 不明な怪しいネットワークデバイス Vehicle 、製造元: Qualcomm 、モデル: wdk_ap_test(2024.02.08)
- Lumix DMC-FZH1 で使っているSDカードがカードリーダで読み出し中にエラー。突然raw形式に。chkdskで復旧。(2024.01.17)
- SYNCO G3 ワイヤレス録音マイク の送信機の充電やデータ転送ができない件(2023.09.18)
« 「パーソナル編集長 Ver.14 」(ソースネクスト)で、スポーツ新聞風のチラシをつくってみる | トップページ | ノートPCのWebカメラやスマホカメラのレンズカバー/カメラカバー ~在宅勤務やオンライン会議でカメラに映りたくない場合に~ »
コメント