SSブログ

音声認識エンジン

 ソフトウェアの世界ではオープンソースとしてソフトウェアを公開して誰でも自由に使えます。便利な機能をただだからいう理由で使っていると、サービスを提供してくれる会社に、知らず知らずに支配されるようになっています。アマゾン、グーグル、マイクロソフトなどの会社は優秀な人材を集めて、ソフトウエアの開発力は、他を凌駕して、技術を牽引しています。

 クラウドのサーバーが整備されて、音声認識による検索サービスを使える時代になりました。HTML5 の Web Speech API を使うと、 ブラウザベースで音声認識とテキストの読み上げを実現する ことができます。JAVASCRIPTで数行のコードを書くだけで、パソコンにマイクをつないで、日本語、英語を話すと、テキストに変換してくれます。
 
 ロボットのPepperは、クラウドの音声認識エンジンにインターネットを経由して、認識性能を高めています。自分で対話するロボットを簡単に作ろうとすると、最も重要な音声認識とAI機能については他の人が作ったものを利用する方法があります。それなら、自分はどの部分で創意工夫すると、他と差別化できるか、という問いが残ります。自分で創意工夫ところがないと、いろんな技術が類似してきます。


  

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。