2021-08-31
2021/8/31、IT室こと内閣官房情報通信技術(IT)総合戦略室の最終日。最後の更新があり、政府DXに関連する様々な文書が公開されました。

政府CIOポータル - 更新終了
デジタル政策はデジタル庁へと引き継がれるとのことです。(→デジタル庁スタート


ディスカッションペーパー | 政府CIOポータル
発表されたディスカッションペーパーは下記の7つ!
- ゼロトラストネットワークを実現するための政府職員のアカウントやアセットの管理
- 政府情報システムの移行のためのデータポータビリティ
- クラウドサービス(SaaS)活用のためのネットワーク設計
- 拠点間ネットワークに適用可能なオーバーレイネットワークの設計と運用
- メタデータルールと利用イメージの検討
- データ人材フレームワークの設計
- デジタル社会実現のためのアーキテクチャ設計

この7つリンクを作るプログラムはこちら

$ deno import { CSV } from "https://js.sabae.cc/CSV.js"; const data = CSV.toJSON(await CSV.fetch("https://code4fukui.github.io/cio-jp/discussionpaper.csv")); data.filter(d => d.datetime.startsWith("2021-08-31")).map(d => `- <a href=${d.url}>${d.name}</a><br>`).forEach(s => console.log(s))

たった3行、CSVデータとしてまとめておくと活用しやすくて便利です。

政府CIOポータルのライセンスがCC BYのオープンデータなので気兼ねなくスクレイピングしデータの二次利用が可能です。 デジタル庁でも使いやすいデータがどんどん出ることに期待しましょう!


ディスカッションペーパーのページのHTMLソースを見てみると、大事な部分がarticleタグで囲まれているのでスクレイピングしやすいナイスな構造!

HTMLから、スクレイピングして、CSVにするシンプルなコード(実際のコードはGitHub参照) import HTMLParser from "https://dev.jspm.io/node-html-parser"; import { CSV } from "https://js.sabae.cc/CSV.js"; const dom = HTMLParser.parse(txt); const articles = dom.querySelectorAll("article"); console.log(articles.length); const data = []; for (const a of articles) { data.push({ name: a.querySelector("h1").text }); } await Deno.writeTextFile("scraped.csv", CSV.stringify(data)); (src on GitHub)


政府CIOポータル ディスカッションペーパー Markdown
Markdown化しておくと一括して読めて便利ですね。


標準ガイドライン群用語集src on GitHub
更新された標準ガイドライン群用語集。検索、各項目でソートもできます。「廃止」で検索すると並ぶ、11項目。政府CIO、IT室は廃止され、デジタル庁へとその機能を移します。 IT人材という言葉も今後は「デジタル人材」や「高度デジタル人材」などと呼ぶようになるとのこと。

最終更新日から一気に、スマホでも読みやすいMarkdownバージョンもどうぞ
標準ガイドライン群用語集

こちらCSVをMarkdown化するcsv2md.jsと、MarkdownをHTML化するmarked.jsを作って、make.jsで使っています。

いろんなデータで遊んで、データ人材になりましょう! 高度デジタル人材データ人材の育成プログラムでもある、jigインターン生による成長の記録。 3周目の2日目が終了しました。
⭐jigintern diary⭐

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS