【ホームページへ戻る】
もう一歩のところまできた音声認識    (1998.8.12)

テレビでSMAPの慎吾君が、自分の声がうまくパソコンに認識されて、「すげー!!」と感心しているIBMのPC(Aptiva)のCM。 これを見て、私も音声認識に興味を持ちました。
このAptivaで使われているソフトが、ViaVoice(ビアボイス) 98です。
ともかく購入し試してみました。横浜の量販家電店で、13,800円でした。

このソフトウェアは、パソコンに結構高度なスペックを要求します。
CPUはMMX Pentium 200MHz以上、メモリー64MB以上、ハードディスク200MB以上と言ったところです。
このようなスペックのPCは、数年前でしたら高嶺の花でおいそれとは買えなかったのですが、今では普及機の部類です。
ハードウェアが廉くなったという背景があるからこそ、この処理の重いソフトも日の目を見たのでしょう。

このソフトは、マイクに向かって話した言葉が、そのまま日本語の文章に変換されるディクテーション機能とアプリケーションを操作するナビゲーション機能(たとえば『印刷』と言えばワープロが印刷をおこなう)の2つからなります。

特に意識してわかりやすく話すこともなく、普通に話した言葉をパソコンが認識し、文字に置き換え、ワープロのテキストとして表示してくれます。

さて使い勝手ですが、私がマイクに向かって話す場合は、思いのほかうまく認識します。
ソフトウェアがアクセントやクセ等の声の性質を記憶し、認識精度をあげているのでしょう。

ただし、テープで録音した他人の声を入力した場合は、まったくというほど認識しません。
実は私が期待していたのはこちらの方だったのです。
私は仕事で会議の議事録等をとることが多く、その補助として、カセットテープレコーダーを 回しています。聞き漏らしたりした時に、テープを聞いて補完するためです。
もしこの録音をパソコンが認識してくれたら、テープを聞かずに、非常に助かると思ったからです。

残念ながらこの期待は裏切られました。
会議ではいろいろな人が話し、それぞれの声に癖があります。
従って当然といえば当然なのですが、入力される声が、音声認識ソフトが認識している私の声と違う為に、どのパターンに合わしたら良いのかわからなくなってしまうのでしょう。

とはいえ、高々1万数千円で、音声認識ソフトもここまできたのかと感心しました。
きっと数年後には、会議のようなさまざまな声も認識できるようなるに違いありません。
楽しみに待ちたいと思います。

【ホームページインデックスへ戻る】