« Sirui の三脚 T-005KX の脚部の修理 ~脚止板の交換~ | トップページ | OMRON製 UPS BN50T のバッテリパック交換 ~交換バッテリパックーは オムロン BNB75T ~ »

2022年7月10日 (日)

音声認識 - 音声テキスト化サービス AIが発言を自動で文字起こしするリコー提供のサービス 『toruno』 ~認識率向上策~

文字起こし用のサービスとして、リコーの『toruno』というサービスを使用しています。

このサービスの音声認識なのですが、結構優秀です。感覚的にというか、Google音声認識に勝って部分があると思います(2022年7月時点)。

Google音声認識なのですが、複数人の会話を文字起こしする時に、格段に精度が落ちたり、もしくは停止してしまう傾向があると感じています。

一方、リコーの『toruno』ですが、複数人の会話でも発声がしっかりしていて、クロストークにならなければ、複数人、特に男女の声が混ざっていていてもきちんと認識してくれていると思います。

ただし、専門用語だったり、ネットスラング的なものや、芸能人等の固有名詞は苦手としているように思えます。

そこで、ユーザー辞書を利用すると、格段に認識率があがり、文字起こしされたテキストの編集の負荷が下がります。

一点、このユーザー辞書の注意点がわかってきました。

このユーザー辞書ですが、やみくもに大きな辞書データに育てても意味がないようです。

ユーザー辞書の効果的な利用方法は、認識する音声・会議で利用される固有名詞などを過不足なく網羅することです。

例えば、企業名だったり、参加者名だったり、場合によっては、「〇〇さん」や、「xx部長」といったものを登録していると文字認識率があがり、修正も容易です。

ユーザー辞書自体は、CSVで作成し、認識前にアップロードする仕様です。

会議が始まる前などに、事前にユーザー辞書を作成し、アップロードしておくことをおすすめします。

Torunodic

« Sirui の三脚 T-005KX の脚部の修理 ~脚止板の交換~ | トップページ | OMRON製 UPS BN50T のバッテリパック交換 ~交換バッテリパックーは オムロン BNB75T ~ »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« Sirui の三脚 T-005KX の脚部の修理 ~脚止板の交換~ | トップページ | OMRON製 UPS BN50T のバッテリパック交換 ~交換バッテリパックーは オムロン BNB75T ~ »

Google Adsense

2022年9月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30  

最近のコメント

最近のトラックバック

無料ブログはココログ