2025-04-26
OpenAIのAPI、画像生成APIに「gpt-image-1」が追加され、より高性能な画像生成が可能になりました。神山まるごと高専3期生のITブートキャンプ成果発表オープンデータを使って、AIグラレコと、PRキャラクターを生成し、まとめサイトをバージョンアップしました。


「11チームのPRキャラクター」

発表動画をffmpegで音声抽出し、AI文字起こしテキストを生成。そのテキストを使ってグラレコとPRキャラクターを次のプロンプト(txttopng.js)で生成しています。

//const defpreprompt = "下記のプレゼンテーションの文字起しからポップなグラレコを生成してください"; const defpreprompt = "下記のプレゼンテーションで示される事業をPRする、かわいいキャラクターを描いてください";


こちらチームsecomのグラレコ。紹介で話している、4つの機能がちゃんと入っています。ただ、文字がところどころまだ怪しいですね。


「神山まるごと高専ITブートキャンプ2025 まるごとハッカソン発表会」

文字起こしの段階で間違った認識をしていると、グラレコ、PRキャラクター共におかしなことになるので、人手によるチェックを入れるか、ご認識しないようにプロンプトで工夫する必要があります。

クオリティの高い画像生成はそれなりにコストもかかるので、大量自動処理には注意しましょう。

AIは、プログラミングと合わせて使うと、より楽しい!

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS