東京都福祉保健局が公開する「新型コロナウイルスに関連した患者の発生について(第150報)」をオープンデータとみなし、「【参考】区市町村別患者数(都内発生分)」を使って、東京都内の患者発生状況を可視化しました。
COVID-19 Tokyo - 東京都 新型コロナウイルスオープンデータサマリー
位置関係をだいたい保ったまま、各項目を等しく見せるカラム地図(東京都)を使用。


5つ星オープンデータ」 by Web発明者 Tim Berners-Lee
ウェブとスマホ時代に便利な情報伝達ツール「オープンデータ」の作り方を解説。

現在病床数など、知りたいデータが公開されていないと、電話やメールなどでの問い合わせが発生し、その対応可能な件数に上限があります。まずはこれをウェブサイトで公開することでぐっと手間を減らせます。ウェブ公開。この時点ではまだオープンデータではありません。

公開されたデータを使って、記事を書きたい、アプリにしたい場合など、そのデータを使っていいかどうかの確認が必要になります。その問い合わせをなくす方法が、オープンデータです。誰でも自由に確認不要で二次利用してOKと、公開データと合わせて明記しましょう。日本の行政データは、オープンバイデフォルト(IT総合戦略室)、明記されていなくても、みなしオープンデータとして活用してOKです。

公開されるデータが増えてくると、重要な項目だけ知りたい人には探しづらくなっていき、機能しなくなっていきます。HTMLや、PDFを情報源として使っていると、その情報の公開の形が変わってしまうたびに、調整しなくてはいけません。ここで有効なのが、3つ星オープンデータです。3つ星オープンデータは機械(コンピューター)にわかりやすい形式(CSVなど)で公開することで、データの更新からアプリなどへの反映が自動化できます。 また、見たい人に合わせて見せ方も自由に変えることもできるので、重要な情報をさっと知りたい人、詳しく知りたい人、じっくり自分で分析したい人、どんなニーズにも答えられるのも大きな利点です。

オープンデータであっても分散してしまうと大変です。例えば、47都道府県の現在患者数を知りたい時、ひとつひとつ全部の公式サイトのチェックが必要になります。 そこで登場、5つ星オープンデータ。項目名を世界で識別可能なURL表記で統一することで、個別対応が不要になり、集計が自動化できます。

従来手法だと、各自治体が中央に情報を何らかの手段で送り、それを集計して発表するというワークフローとなりますが、5つ星オープンデータでその作業が自動化されます!


COVID-19 Japan 新型コロナウイルス対策ダッシュボード
日に10万人ほどがアクセスしているこのサイト、モバイルのアクセス比率が68.3%(パソコン27.8% / タブレット3.8%)。 少し文字が小さくみずらい点を、初めて使う CSS Grid Layoutを使って、改善! データ提供者とは無関係に、どんどん改善していけるのが、オープンデータというインターフェイスの良いところ。

新型コロナウイルス対策ダッシュボードは、現在、厚生労働省が公開しているデータを使用していますが、前日締めのデータが当日の夜21時ごろ反映とタイムラグがあるのが難点です。 Code for Japan 協力で作成された「新型コロナウイルス感染症対策サイトのためのデータ公開について | 政府CIOポータル」を使った、自動集計化への取り組みも始まりました。

東京都区市町村別患者数アプリの舞台裏。東京都福祉保健局からは画像のみ提供、みなし1つ星オープンデータ。 以前の厚生労働省データのように、光学文字認識(OCR)を使うも、やはり誤認識が多く使えない。 数字部分を切り出すプログラムを作り、0〜9の画像を生成。画素比較して最も近いものを採用する簡単なOCRを作って、精度を目視でチェック。 JSON/CSV化するプログラムを作って、カラム地図と組み合わせて、できあがり!(src on GitHub

心配なのは、今の所画像内の位置を決め打ちにしているので、フォントや、レイアウトがちょっと変わると対応できなくなること。活用しやすさで言えば、断然3つ星オープンデータ以上、できれば、5つ星オープンデータになってくれるのがベストです!

links
- 5分で分かる5つ星オープンデータとビジネスの可能性
- Tim Berners-Lee: ティム・バーナーズ=リー 「オープンデータとマッシュアップで変わる世界」 | TED Talk

Tweet
クリエイティブ・コモンズ・ライセンス
この作品は「Creative Commons — CC BY 4.0」の下に提供されています。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / RSS