北陸観光ハッカソンの目玉、北陸3県79箇所に設置された、Wi-Fiパケットセンシングのデータを2024/8/26〜2024/11/1までのデータを可視化してみました。
Wi-Fiパケットセンシングとは、スマホなど無線LAN通信で発するパケット(Probe Request)で受信する機器に振られたID、MACアドレスを補足することで、行動を追跡するもの。MACアドレスはハッシュ化したものが公開されている。MACアドレスはランダム化されているはずだが、うまく把握できる方法があるとのこと。(参考、Wi-Fi パケットセンシングによるクルーズ旅客の観光周遊行動の捕捉とその特性分析~石川県金沢港を対象として~)
オープンデータとして公開されている「hokuriku-inbound-kanko/mac-address」は、ディレクトリ構造が複雑で多数のファイルに分離されサイズも大きいことから、前処理を行う。
Deno/JavaScriptで実装した、make.jsとmake2.jsによって、登場するMACアドレスのハッシュ値の全件をまとめた「user.csv」と、30分未満の連続記録を滞在と判断する形で圧縮したデータ「move.csv」を生成する。
「北陸観光移動軌跡」 src on GitHub
まずは、設置箇所一覧である「00_M5_facility list.csv」を緯度経度データを使ってマップに表示し、「user.csv」より、最も移動が多いユーザーの軌跡を表示したところ、全設置箇所をランダムに巡っていることになった。このようなデータが上位ユーザーで続く。
10箇所巡っているユーザーを表示したところ。ルートの妥当性が見えない。
設置箇所の移動元と移動先をつないでみるも、ほぼ均等に発生しているように見える。
2ヶ月間79箇所で補足したMACアドレスにしては、ユニークユーザー数が3,652件とあまりに少ない(単純計算1箇所ユニーク45人)ので、ハッシュの衝突が起きているのかもしれない。ただ、データの解析方法に問題がある可能性もあるので、ぜひオープンソースの検証や分析などお試しください。
links
- 世界初の広域観光オープンデータが楽しい、北陸観光ハッカソン!
- TIFDATA 北陸観光データポータル|
- 北陸インバウンド観光DX・データコンソーシアム