AIによる音声起こしの弱点

先日、「AIで音声起こしをしたけれど、直すのに時間がかかってしまった」というお客様からご相談を受けました。
AIによる音声認識技術は日々進化していますが、それでもいくつかの弱点があります。
そのためにお客様も修正に時間がかかったのだと思いますが、今回はAIによる音声起こしの弱点について書いていきたいと思います。

まずは、認識精度が完璧ではないという点です。
AIの音声認識は、特定のアクセント、方言、話し方の癖、声の高さ、早口などによって、誤認識が発生することがあります。
特に、聞き取りにくい部分や専門用語が多いと、間違いが増える傾向にあります。
あとは固有名詞ですね。
私も最初に音声を聞いて荒く起こすときにAIを利用するのですが、固有名詞は、一般に認識されている地名などを除き、ほとんど正しく表記されません。
AIが音を正しく聞き取っていたとしても、例えば会社名や商品名が、カタカナなのか漢字なのか、またはローマ字表記なのか英語表記なのか、その部分はやはり人間の目と手で確認することが必要になります。

とても便利なAI音声起こしですが、完ぺきな原稿にはまだ足りない部分が多いと思っています。
私のような音声起こし屋も、むしろAIがなかったころよりもお客様に必要とされていると感じることが多いです。

続いてのAIによる音声起こしの弱点については、また次回のブログで書こうと思います!