声を使って自堕落なインターネット生活を送る - blog.jgs.me

まずはこの動画をみてほしい。
Voice Reblog from Takaya Kobayashi on Vimeo .
そう!声でDashboardを徘徊できたらどこでも、どんなスタイルでもTumblrが楽しめるじゃん!?!?!?
…と思ってつくりました。試験中に思いついていろんな壁にぶちあたってなんとか完成しました。
これがあれば、寝っ転がりながらでも家事しながらでもTumblrを楽しむことができます。が、リリースはちょっと難しそうなので誰でも手元でできるようになるのはまだ先になるとおもいます。
ここからは開発で大変だった話です。
当初の構想は
Chrome extension+Chrome Speech API
ChromeのdevチャンネルバージョンにSpeech APIなるものが搭載されて、しかもディクテーションしてくれるということで試してみたんですが、マイクの使用の許諾が毎回でてきて、しかもそれが消せない厄介なやつだったので断念しました。
次の構想は
Julius→ Node.js →(Websocket)→Chrome extension
というような感じをイメージしていました。以前、 I am Electrical machine • Siriでうけみちゃんとおはなし したときにJuliusを使ってターミナル上で会話することを試みたのですが、文字コード周りでうまくいかなくて断念していました。 hecomi /node-julius · GitHub というスーパー便利モジュールがあって、感謝しながら使わせていただきました。
Chrome extensionにWebsocketでコマンドを送信するところまでできたので、コマンドを基にkeypressかkeydownを発火させればできるだろう、と見立てていたら Chrome extensionsでkeydown eventを発火させたいのだけれど、どうにも発火してくれない というようなことがあって、しかもChromeのbug扱いされていたのでこれも断念しました。
Chrome extensionの中にスクロールするコードとかリブログするコードを含めればextensionでも実現はできると思うけれど、面倒くさかったのでやめました。
それで、最終的に
Julius→Node.js→(Websocket)→Windows8 App
っていう構成になりました。Windows8 App上でWebsocketが使えるか不安だったのですが、ずっこけるぐらいあっさり動いて拍子抜けでした。
それにしても、ありあわせのものを組み合わせるだけでスッとこういうものが作れるのはすごいなあ、と改めておもいました。
音声認識もなかなかの精度で認識してくれるので、面白いです。声とWebの組み合わせアツいとおもうよ!!
次は脳波でReblogですかね〜。

February 15th, 2013 6:11pm
original: http://blog.jgs.me/post/43137515474
#20130215 #0215

関連ページとランダムに選ばれたページ

筆者について

jigsaw(ジグソウ、1991年6月12日-)は日本のプログラマ、会社代表。本名は小林貴也(こばやし たかや)。主にウェブ、フロントエンド領域で活動している。カミング・スーン合同会社の代表社員。
さらに詳しく

寄附について

面白かったらBTCETHでの寄附をお待ちしております。
寄附のきろく