【トップページへ戻る】

ここまできた音声認識       (2002.12.15)

テレビでSMAPの慎吾君が、自分の声がうまくパソコンに認識されて、「すげー!!」と感心しているCM。1998年に、IBMのPCに初めて音声認識ソフトVIaVoice(ビアボイス)が搭載された時のことです。
この時、私は、このViaVoiceを買い、音声認識もほぼ実用の域まで来たななと思ったのですが、それから4年、このViaVoiceは、大きく進化しました。
 
このソフトは、マイクに向かって話した言葉が、そのまま日本語の文章に変換されるディクテーション機能とアプリケーションを操作するナビゲーション機能(たとえば『印刷』と言えばワープロが印刷をおこなう)の2つからなります。
以前のバージョンでは、この両方の機能を組み込んで一つの製品でしたが、今回は、Standerd版はディクテーション機能のみ、Professional版にはディクテーション機能とナビゲーション機能の両方となっています。ディクテーション機能のみで良いというユーザも多いでしょうから、必要な機能のものを購入できるようにしたのは良いことです。私もスタンダード版を購入しました。
 
今回のバージョンアップの目玉の一つは、約1分のクイックエンコール(声の登録作業)で、とりあえず使えると言うことです。従来版では、長文朗読によるエンコールを終えないと使えなかったのに比べると大変便利になっています。これは大きな進歩です。
そして、従来の版と同様に、使い込むたびに自動学習機能が働き、アクセントやクセ等の声の性質を記憶し、自然に判別能力が向上していきます。
さて、クイックエンコールを終えてマイクに向かって話してみました。特に意識してわかりやすく話すということでもなく、普通に話した言葉をパソコンが認識し、文字に置き換え、ワープロのテキストとして表示してくれました。
また、音声合成で文章を読み上げる機能がついていますが、これを使って認識した文章をチェックすることができます。なめらかな口調で人間の発生とあまり変わらないのには驚きました。
一方、テープで録音した他人の声を再生してマイクから入力させてみましたが、まったくというほど認識しませんでした。 ソフトが覚えている私の声以外は受け付けないようです。この辺が音声入力の限界でしょう。
もし、他人の声も認識できるようになったら・・・・・・会議の議事録を作るのが大変楽になります。私がもっとも期待しているのはこちらの方なのですが・・・・。
私は仕事で会議の議事録をとることが多いのですが、もしこの録音をパソコンが認識してくれたら、聞き漏らしたりすることがなく、正確な議事録が作れるし、とても素晴らしいことでしょう。
残念ながら、現在ではまだこれは無理なようです。会議ではいろいろな人が話し、それぞれの声に癖があるので、音声認識ソフトは、マイクから入ってくる声が、自分が覚えていた人の声と違う為に、入力される声をどのパターンに合わしたら良いのかわからなくなってしまうのでしょう。 でも、きっと数年後には、会議のようなさまざまな声も認識できるようなるに違いありません。 楽しみに待ちたいと思います。 
それにしても、高々1万円で、こんなことまでできるソフトが買えるようになったのは、大きな驚きです。


【トップページへ戻る】