VOCALOID-flex


  
自慢じゃないが、ミクが出るまえからトークロイドの可能性を熱く語っていた漏れ。
つまりさ、いまでも寂しい老人向けに子供騙し(老人騙し?)の癒しロボットとかあるよね。
あれって会話機能がキモなんだ。
人間は役割演技=「応答」を通じて自我を構成している。
だから話し相手のいない老人はぼけやすい。
もちろん内言を通じての本やメディアとの応答もいいけどリアルとはレベルが違いすぎる。
だから漏れはこれからの老人社会でバーチャル応答ロボってのが極めて有望だと思うのだ。
それは漏れみたいな寂しいおじさんにも同じ。(^_^;)
どんな筐体に入れるかはともかく、
出掛けるとき「いってくるね」「いってらっしゃい!」帰ってきたら「おかえりなさい!」とか言ってくれるロボがあればどんだけ和むことか
(書いていて余計寂しくなってきたが・・・(^_^))
さて問題になるのは応答パターンの有限性だ。
決まり切ったやりとりしかできないというのがこれまでのバーチャルアイドルの限界だった。
音声認知技術は格段に向上しているわけだから語りかけ文はユーザーが無限に追加できる。
それに対する応答文を設定できれば応答パターンは等比級数的に増やせるはず。
これをネットでつないだボランティアで実現すればいいのだ。
つまりネットにうpされた呼びかけ文に匿名のユーザーがどんどん応答文をつけるの。
もちろんメタレベルで管理して悪意の文例は排除したうえで。
結果、端末は変わらなくても発話ミクの語彙・応答は日々増えてゆくわけだ。
同じことを話しかけても違うことを返してくる。
儀礼文のほかは同じことは二度は言わないよう制御する。
ユーザー個別オプションで語彙や会話の偏りも設定できるようにしたらなお愉し。つまり「性格」ってことだけどな。
Talkloidミクは寂しいお友達に受けると思うなあ〜
「唄わせる」以上に「お話しさせる」というニーズは高いと思う。
電子ブックと連携させて「朗読」させるのもまたよし。
眼がつかれて億劫なときに読んでもらったり、ラジオ的にもつかえる。
もちろん官能小説だって!!!
(というか、この使い方をきっかけにブレイクしそうな気がする(^_^))
障害のある人(盲目・発声障害など)にも非常に助けになるだろう。
声優が老衰しても『ルパン三世』の新作を永久につくれる!
問題は犯罪に使われるだろうと言うこと。
声という証拠を消したり不法にサンプリングしての成り済ましもおこりそう。
勝手にサンプリングする声の肖像権?の問題もでてくる。
でもそれはすべての革新的な変化に必然的に伴う課題にすぎない。
問題だから開発しないというものでもないし、とめるのは不可能だ。
suitcase原爆ほどひどいことにはならないだろ。
そんな技術が目前だということに痺れる憧れるゥ〜。
   

「テキストの音声化ではない」 しゃべるVOCALOIDflex」が狙う市場
感情を込めた声でしゃべる音声を合成できる「VOCALOID-flex」は、従来の音声読み上げソフトとは異なる市場を狙うという。
2010年03月01日 22時42分 更新
http://www.itmedia.co.jp/news/articles/1003/01/news097.html
 
リニューアルしたばかりのヤマハ銀座ビル「本日は、ほんっとーーに、ありがとうございます!」

 少し舌足らずだが感情のこもった音声が3月1日、「ヤマハ銀座ビル」(東京・銀座)の地下ホールに響いた。ヤマハ「Y2プロジェクト」の企画を紹介する「Y2 SPRING 2010」のオープニングのひと幕。「VOCALOID-flex」で合成した音声だ。

 VOCALOID-flexは、歌声合成ソフト「VOCALOID」に、自然なしゃべり声の合成機能を加えたソフトだ。VOCALOIDは歌声に特化していたが、flexはしゃべり声の編集に対応。音韻(音素などの音の構成や長さ)や韻律(音の高さ、強さ)の細かな編集が可能で、感情のこもった声や方言など、さまざまなトーンの声を再現できる。

「ありがとうございます」の音韻や韻律の調整画面。開発中の画面で、ユーザーインタフェースはライセンス先企業が設計できる 「VOCALOIDのようなナチュラルな音声データベースを使い、ユーザーが指示した通りにイントネーションなどを再現できる点が新しい」と、開発に携わった同社の剣持秀紀さんは話す。

 入力したテキストを読み上げる、いわゆる「Text-to-speech」の音声合成ソフトは多いが、そういったソフトとは一線を画すという。「“感情を込めた音声”がターゲット。突き詰めていくと歌になると思うが、様々なタイプの音声にチャレンジしたい」

 まずは企業向けにライセンス提供する。従来のVOCALOIDライセンス先に加え、映画やアニメ、ゲームのアフレコ、ロボット向けの音声制作など、感情のこもった声が必要とされるさまざまな用途を想定している。第1弾として、PSP向けゲーム「METAL GEAR SOLID PEACE WALKER」(4月29日発売、5229円)に採用。「AI兵器」と呼ばれる、知能のある兵器の音声に使われた。

 AI兵器の声を提供したのは女優の菊地由美さん。菊池さんが感情を込めて読んだせりふ音声から音韻や韻律を抜き出し、自らの声で構築したVOCALOIDデータベースにはめこんで合成、エフェクトをかけることで、感情がこもっていながらロボットっぽい声を作り上げたという。

ムービーの閲覧にはFLASHプラグイン(バージョン8以上)が必要です。

コナミの村岡さん(左)と剣持さん。奥に映し出されているのが「METAL GEAR SOLID PEACE WALKER」のAI兵器 「テキストの音声化ソフトはこれまでにもあったが、ニュースキャスターのようなきれいなしゃべり方だった。VOCALOID-flexなら簡単に、感情を加えたり早口にしたりでき、戦闘シーンでも使いやすい。ピッチやスピードの調整も簡単だった」と、METAL GEAR SOLID PEACE WALKERサウンドディレクターの村岡一樹さん(コナミデジタルエンタテインメント)は振り返る。

 NetVOCALOIDを使い、プレイヤーがAI兵器のハミングに自由な歌詞を入れられる仕組みも用意、インタラクティブに楽しめるようにした。

「ネットも音楽もソーシャルなはず」
 Y2プロジェクトは、ヤマハのネット関連の研究開発プロジェクト。この日のイベントでは、ネット経由でVSTプラグインを使える「クラウドVST」や、遠隔地同士の楽曲セッションをネット経由で可能にする「NETDUETTO」、初音ミクをベースにしたキャラクターと「セカイカメラ」、ヤマハの音声技術を組み合わせた「初音ミクの破片 セカイロイド襲来」の紹介もあった(記事は後ほど掲載)。

 「音楽を生み出す行為を身近にしたい」と、ヤマハネットビジネスグループの田邑元一マネージャーは話す。「『Y2』は『Yamaha meets you』が語源。楽器や音楽はもともと、ソーシャルなもの。ITと親和性が高くて当然だったが、これまでの当社のネットの取り込み方は、満足できるものではなかった。技術ではなく人のアクティビティを取り込んでいきたい」

 Y2プロジェクトは今後も、さまざまな企業と協業しながら進めていきたいという。「みなさんも輪に加わり、参加してほしい」