音声認識 - 音声テキスト化サービス AIが発言を自動で文字起こしするリコー提供のサービス 『toruno』 ~認識率向上策~
文字起こし用のサービスとして、リコーの『toruno』というサービスを使用しています。
このサービスの音声認識なのですが、結構優秀です。感覚的にというか、Google音声認識に勝って部分があると思います(2022年7月時点)。
Google音声認識なのですが、複数人の会話を文字起こしする時に、格段に精度が落ちたり、もしくは停止してしまう傾向があると感じています。
一方、リコーの『toruno』ですが、複数人の会話でも発声がしっかりしていて、クロストークにならなければ、複数人、特に男女の声が混ざっていていてもきちんと認識してくれていると思います。
ただし、専門用語だったり、ネットスラング的なものや、芸能人等の固有名詞は苦手としているように思えます。
そこで、ユーザー辞書を利用すると、格段に認識率があがり、文字起こしされたテキストの編集の負荷が下がります。
一点、このユーザー辞書の注意点がわかってきました。
このユーザー辞書ですが、やみくもに大きな辞書データに育てても意味がないようです。
ユーザー辞書の効果的な利用方法は、認識する音声・会議で利用される固有名詞などを過不足なく網羅することです。
例えば、企業名だったり、参加者名だったり、場合によっては、「〇〇さん」や、「xx部長」といったものを登録していると文字認識率があがり、修正も容易です。
ユーザー辞書自体は、CSVで作成し、認識前にアップロードする仕様です。
会議が始まる前などに、事前にユーザー辞書を作成し、アップロードしておくことをおすすめします。
« Sirui の三脚 T-005KX の脚部の修理 ~脚止板の交換~ | トップページ | OMRON製 UPS BN50T のバッテリパック交換 ~交換バッテリパックーは オムロン BNB75T ~ »
「パソコン・インターネット」カテゴリの記事
- SYNCO G3 ワイヤレス録音マイク の送信機の充電やデータ転送ができない件(2023.09.18)
- Outlook から Teams アドイン が消えた! 新しいTeams会議のアイコンが消えて予約ができない。そんな時の対処方法の一例(2023.05.28)
- SanDisk Extreme Pro SSD 4TB で複数の不具合報告(ファイルシステム損失、データ喪失)が出ている模様(2023 FEB)(2023.02.19)
- HDMI to USB Type-C ケーブル( club 3D CAC-1334 )と RICOH Portable Monitor 150BW での映像表示(2023.02.11)
- Windows で Miracast ワイヤレスディスプレイに接続できない場合 ~Firewall ファイアウォール で開けるポート~ (2022.12.18)
« Sirui の三脚 T-005KX の脚部の修理 ~脚止板の交換~ | トップページ | OMRON製 UPS BN50T のバッテリパック交換 ~交換バッテリパックーは オムロン BNB75T ~ »
コメント