2019-04-12
まもなく話題の10連休。これを海外からくる外国人はちゃんと認識できるいるのだろうか?
「祝日」によって変わる営業日。せっかく来たのにお休みでがっかりさせたり、思わぬ混雑に巻き込まれかねない。

ITジャーナリスト 神田さんによって、話題となった国民の祝日。
まるで大喜利?『国民の祝日』データをもっと真剣に考えてほしい これが政府の考える『オープンデータ』だ(神田敏晶) - 個人 - Yahoo!ニュース

こちらで指摘されている問題点は、3つ
1. CSV形式(アルゴリズムが含まれていない、形式の一貫性がない)
2. 2019年、2020年の2年分しかない、もっと長く公開すべし
3. 「国民の祝日オープンデータ」で検索してヒットするサイトが開けない

政府CIO任命、オープンデータ伝道師視点で、それぞれ解説する。

1. 国民の祝日オープンデータはCSVでいいのか?
→ ひとまず合格ただし、(文字コード規定を定め、国際化、LOD化にチャレンジすべし

CSV形式、5つ星オープンデータ(5-star Open Data by Tim Berners lee)でいう、機械可読な3つ星オープンデータにあたる。 国際的にコンセンサスが得られたRDFを使ったLOD化も合わせて行うのがベストだが、多くのエンジニアにとってはCSVの方が現時点では馴染みが深く使いやすいと思われる。 ここは国民の祝日先進国として、率先して語彙策定に努めたい。

祝日に挟まれた日は祝日化するなどのアルゴリズムを表記するのも手ではあるが、シンプルに祝日を反映させる形のほうが使いやすい。(オープンデータには「祝日扱い」として反映ずみ)

ただCSV形式はSJISかUTF-8かの問題を抱えているのがやっかい。日本人がExcelで見やすいのはSJIS、iPhoneなどで閲覧できるのはUTF-8。ここは非エンジニア視点は捨てて、政府提供CSVの基本はUTF-8にすることを提唱したい。

加えて、せめて英語化はしておきたい。ローマ字表記するのか、英語として翻訳するのか、勝手に翻訳することはできないため、混乱を防ぐためにも一次情報としての公開が必要。

2. 2019年、2020年の2年ぶんしかない、もっと長く公開すべし
→ むしろ過去分の充実を!未来分は決まり次第迅速に

むしろすでにデータ化できる過去分こそ重要。機械学習の肝は過去データをいかに活かすか。解析する際、祝日だったかどうかで経済活動がまるで違う。2019年以降しかないのは問題。 ネット上では法律が過去分を遡れないので、過去の祝日を公式の手段がない状況はもったいない。

データ量に関しは、機械に読ませるデータなので、データ件数がスマホ程度でも数十万件あろうが問題ない中でのせいぜい数百件、全く問題にならない。(きっと、画像一枚分に満たないデータサイズ)

未来分に関しては春分の日、秋分の日問題や、法律によって変わるので、もはや確実な未来はないことを前提にするのがいいと思う。故にオープンデータ化は大事!

3. 「国民の祝日オープンデータ」で検索してヒットするサイトが開けない
→ URLを変えてはいけなかった。DATA.GO.JP のSSL化での失敗(一定時間後に解決する)

今年、2019/3/18、DATA GO JPがAOSSL化したが、その際非SSLリンクが無効になってしまった。
3月18日(予定)以降、データカタログサイトのURLが「https://www.data.go.jp/」に変わります。 - メンテナンス情報 - DATA GO JP
事前に指摘するもリダイレクトも含め対応はできないとのこと。もっと早く知っていればなんとかできたかもしれない。多くの DATA GO JP へのリンクが無駄になったことは残念で、申し訳ない。 検索の問題はいずれ解消される。 一人ひとりが、古いリンクを新しいSSL化した方のリンクへのはりかえる作業をするほどに解決は早まる・・・。

国民の祝日オープンデータ(CSV)」を使ってシンプルにカレンダー形式にするアプリをつくってみた。

国民の祝日オープンデータカレンダー」 JavaScript オープンソース / CC BY
政府公開のCSV形式(SJIS)のファイルがこの形式のまま、URLが変更されずに更新されればアプリは自動的に反映される。(CSV / 3つ星オープンデータによる効果)
https://www8.cao.go.jp/chosei/shukujitsu/syukujitsu.csv
公開されている年のみを表示しているので、今現在、2019年と2020年のみ表示。2021年はどうなる!?
シンプルで使いやすい「国民の祝日オープンデータ」さえあれば、柔軟に対応できるので急な変更でも大丈夫!

神田氏のように影響力のある人が声をあげてくれることはとても大きい!
打てば響くのがいまの日本!

DATA GO JP の意見受付コーナーへ投書したところ、「オープンデータ | 政府CIOポータル」の「オープンデータ取組済自治体一覧」のCSVオープンデータが更新され、使いやすくなった!

日本のオープンデータ都市率ダッシュボード」 7x7カラム地図 (TabularMaps7x7)
ファイル名が固定化されたので、政府によろ更新がリアルタイムにこのアプリで反映される。
現在24%、2020年度末までに100%が政府目標!

みんなで目指そう、世界最先端IT国家
ひとりひとりの当事者意識と行動で、日本は変わる!

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS