2021-05-18
齟齬のないコミュニケーションに必要な、言葉の定義。 日本政府のIT総合戦略室、PDFとWordファイルで提供されている、政府CIOポータルに掲載された「標準ガイドライン群」のひとつ「標準ガイドライン群用語集」をCSVデータ化し、GitHubに置き、検索アプリとして提供しました。

標準ガイドライン群用語集
現在掲載は95単語。日本政府として使っている意味、みなさんの思っている意味と同じでしょうか?


code4fukui/stdwords-jp: 標準ガイドライン群用語集 - standard words in Japan
気になる点があればイシューでディスカッションし、間違いや改善はプルリクというGitHubの機能がそのまま使えて便利です。PDFや、WordファイルはCSVデータから単純に生成すればいいので、手間は減ります。 今回の勝手CSV化は、元データを尊重して項目名は日本語名のそのままとしています(3つ星オープンデータ)。

オール日本で進めるデジタル推進。 その旗振り役の政府としては、1つ星オープンデータのPDF、2つ星のWordファイルだけでなく、少なくとも3つ星CSV、できれば、語彙(schema.orgや、共通語彙基盤などで)を標準化して5つ星CSVでいきましょう!

CSVデータになっていて、HTTPSでアクセスでき、CORS対応していれば、次の2行のHTMLで検索機能付き表示アプリができあがります。(ノーコード?ローコード?)

<script type="module" src="https://code4sabae.github.io/js/csv-viewer.js"></script> <csv-viewer src="https://code4fukui.github.io/stdwords-jp/hyoujun_guideline_yougosyu.csv" name="標準ガイドライン群用語集"></csv-viewer>

オープンソースな自作HTMLタグ、csv-viewerタグを今回拡張。全角アルファベットと半角アルファベットが入り交じる文章で検索しづらいので、経産省によるオープンソース「IMI 情報共有基盤 コンポーネントツール」の「半角全角変換ライブラリ」をESモジュール移植したものを使って、全角半角大文字小文字を区別しない検索機能としました。(src on GitHub

import { CSV } from "https://code4sabae.github.io/js/CSV.js"; import IMIMojiConverter from "https://code4sabae.github.io/imi-moji-converter-es/IMIMojiConverter.mjs"; const std = (s) => IMIMojiConverter.toHalfWidth(s).toLowerCase();

JavaScriptのESモジュール、世界中のライブラリを気軽にどんどん接続できるのがいいところです。

2021.5.20 追記、「UDトーク公式公開辞書 | UDトーク」として活用いただきました。

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS