2023-02-01
研究者も何故うまくいくか分からないのがAI。確かなのはコンピューターの膨大な計算力と記憶力を使うと意外となんとかなっちゃうこと。コンピューターと同様で、使うのは簡単なので、手軽に使えるところからどんどん使いましょう!


「AIチャットボイス」src on GitHub
以前作ったAIチャットと、音声認識・音声発話APIを組み合わせました。試用版のAPIを使っているので一般公開はしませんが、APIキーを取得すれば誰でも使えるオープンソースです。(MacのChromeで動作確認、iPhoneでは二度目の認識がうまくいっていません)

音声認識して、OpenAIのチャットAPIを呼び出し、音声発話することの繰り返し。メインのコードはこんな感じです。 divinfo.textContent = tscr; recog.stop(); divai.textContent = "考え中"; const res = await fetchChat(tscr); divai.textContent = res; await speech(res); tscrは認識した文章、音声認識(recog)を一旦止めて、考え中表示をして、APIアクセス(fetchChat)、返ってきた返答を表示しつつ、発話(speech)させてます。小学校のプログラミングで習う「逐次実行」です。

現在は一問一答式の実装ですが、OpenAIのAPIでも文脈には対応しているので改良してみるのもありです。ChatGPT3のAPIに変更したり、いろいろカスタマイズを加えてみるのもいいですね。


福井工大で開催された「AI&IoTコンソーシアム設立シンポジウム AIの最前線~基盤モデル・深層学習・強化学習~」にて、OpenAI ChatGPTチーム RLHFチームリーダーのShixiang Shane Guさんによる基調講演。劇的進化を遂げた2022年、2023年も楽しみですね!


AI&IoTセンター長の福井工大 芥子育雄さんより「AI&IoTコンソーシアム」の設立趣旨紹介。あらゆる業界が近い福井だからこそのおもしろさ、追求していきましょう!

気軽に最新技術を学び、使ってみたい方、AI&IoTコンソーシアムCode for FUKUIへどうぞ!

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS