「福井観光スポット似たもの探し」
福井県観光連盟「ふくいドットコム」が紹介する755箇所の観光スポットの中から、似た観光地ベスト3と、似てない観光地ベスト3を表示します。クリックすると次々と見ることができます。知らない福井に触れてください!
「txt2vec」
最大8191トークンの文章を1536次元のベクトルにするOpenAIのEmbedding API、ADA002を使うJavaScript/Denoライブラリを準備。コサイン類似度を算出するベクトル計算を行うVec2.jsも実装。
「福井観光スポット似たもの探し」のつくりかた
1. 説明(description)だけを抜き出した配列をtxt2vecでベクトル化し、IEEE754/Base64URLでエンコードしたCSVファイルを生成。 (make_vec_fukuispot.js)
2. 全件に対して文章的な近さをコサイン類似度を計算して、トップ3、ワースト3のIDを追記したCSVを生成。 (calc_vec_fukuispot.js)
3. これを表示するアプリを作ってできあがり! (index.html)
「Embeddings - OpenAI API」
文章を配列にしてまるっと渡すと、サクッとベクトルにして返してくれます。料金は、$0.0001 / 1K tokens (100万文字で15円)とリーズナブル!