2024-05-30
OpenAI社のAPIをJavaScript/Denoで気軽に使おうプロジェクト。テキスト生成画像認識に続き、音声合成APIを「openai-speech」として整備しました。これを使ってブログの読み上げてもらいました。

OpenAI社の音声合成APIに用意されているAI声優さんは、7名。それぞれの声をお聞き比べください。(ID=4325「医療とオープンソース、DPCリスト、診断群分類 by 厚生労働省」の読み上げ音声化)

- echoさん
- alloyさん
- echoさん
- fableさん
- onyxさん
- novaさん
- shimmerさん

こちら、Mac標準の音声合成、Otoyaさん。差は歴然!
- otoyaさん by mac

一部の漢字の読みがおかしかったりしますが、だいぶ自然に聞くことができます。


「blog2speech」

一日一創ブログのIDから、署名付きデータ、Rensaファイルをダウンロードし、HTMLコンテンツの抽出しています。テキストへの変換は、以前作ったhtml2txtが役立ちました。


「openai-speech」

OpenAI社のAPIKEYをセットすればすぐに使えるJavaScript/Denoのライブラリを使って実装しています!

AIで、どんどん広がる、できること!

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS