2021-06-13
国家のデジタル化の基礎データ「ベースレジストリ」のひとつ、文字。基本ですね!

各府省は、文字情報基盤の活用を推進し、文字情報に関する相互運用性を確保する。また、情報システムを整備する際には、一般的業務に係る情報システムにおいて使用する文字の範囲はJIS X 0213を原則とし、UCS(Universal multiple-octet coded Character Set)に従った表現(符号化及び記述法)で情報システムの整備を行う。
デジタルガバメント実行計画
約6万の漢字を国際化した文字情報基盤ですが、まだ環境によって表示できない文字があるので、約1万文字の漢字を含む、JIS X 0213を原則とする。仕方ないですね。

JIS X 0213の定義が政府CIOポータルで見つからないので、68B09さんがMITライセンスで公開している文字情報定義ファイルを使って、JIS文字チェッカーを作りました。


JIS X 0213 チェッカーβ
このチェッカーによると半角スペースはJIS X 0213では無い!?
JIS X 0213は、2012年に改訂され、JIS X 0213:2012があります。半角スペースを含んだ形になったかどうかが気になるところです。
文字という超基本仕様、オープンデータにしてもらいたいですね。
解決、JIS X 0213 でした!


用語.md
文字に関する用語をマークダウンでまとめました。ベースレジストリの文書からリンクして少しずつ読みやすくしています。

links
- 文字コード入門 - とほほのWWW入門 - とほほのWWW入門
- 文字情報基盤整備事業 | 一般社団法人 文字情報技術促進協議会

Tweet
クリエイティブ・コモンズ・ライセンス
本ブログの記事や写真は「Creative Commons — CC BY 4.0」の下に提供します。記事内で紹介するプログラムや作品は、それぞれに記載されたライセンスを参照ください。
CC BY / @taisukef / アイコン画像 / プロフィール画像 / 「一日一創」画像 / RSS