2025-12-17
#js 
画像化された文字をテキストデータにする技術をOCR(光学文字認識)と呼び、昔からありましたが、AI(LLM)登場のお陰で、ぐっと精度が高くなりました。


「code4fukui/openai-imagerecog」

OpenAI社のAPIを使ったOCRライブラリ、img2txt.js を作りました。APIキーを取得し、コマンドラインやプログラム内から呼び出すだけ!


こちら、とうほくプロコン2025参加作品の「東北地方観光案内センター V1.1」の図鑑の一コマ。


img2txt.jsを使ってテキストデータ化できそうです。

新型コロナウイルス対策ダッシュボードの開発で使っていた頃は、数字部分のみの画像にして認識させていましたが、今はざっくり渡せばいいので楽です。いずれにしても、間違うことはあるので必要に応じて対策しましょう。

links
- なければつくろう、中学生も貢献!全国都道府県別検査陽性率ダッシュボード、OCRで画像データを数値化しJSON-API化、GitHubオープンソースで提供
- とうほくプロコン2025

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS