まずは記事を世界で一番使われている語彙「schema.org」に変換して、全1260記事を1記事ずつ整理。
「https://fukuno.jig.jp/blog/2016/2016-01-01.xml」などのリンクでXML形式でRDFをダウンロードできるようにしました。
記事に使った語彙は BlogPosting、タイトルやキーワード、日付などをRDF化、CC BY 4.0のライセンスも http://schema.org/license で明示しています。
オープンデータ時代の標準Web API SPARQLが使えるように、Apache Jenaを組み込んで、全記事抽出してつくった「ブログ記事一覧」がこちら。
select ?dt ?url ?title ?key { graph ?g { ?s <http://schema.org/url> ?url; <http://schema.org/name> ?title; <http://schema.org/datePublished> ?dt. optional { ?s <http://schema.org/keywords> ?key. } } } order by ?dt
今回使ったSPARQLクエリーはこちら。
どなたでもSPARQLを使って取得できるようになる、SPARQL Endpointも公開予定です。
より読みやすい次世代のブログをいろいろと試してみます!
SPARQLとオープンデータをもっと知りたい、使ってみたい方へのオススメイベント
賞金付きハッカソン!福井県情報システム工業会主催のオープンなイベント
「防災オープンデータで、オープンアプリ ハッカソン ~学びながら、地域課題を解決するアプリ作り~ 」
2016.1.23(土)10:00-17:30 at めがね会館7F jig.jp セミナールーム
詳細、お申し込みはこちら