データダウンロード

エクスポート形式を選択

特定の文字をエクスポート

ひらがな、カタカナ、漢字に対応しています。指定した文字のすべてのキャプチャデータをエクスポートします。

データ形式について

JSON-LD形式

本データセットは、Linked Open Data (LOD) の標準形式であるJSON-LDで提供されています。既存のデータセット(Unicode、KanjiVG、DBpedia、e-Stat)と連携し、手書きストロークデータと評価データを付加した新しい価値を提供します。

データ構造

{
  "@context": {
    "@vocab": "https://handwritten-lod.jp/ns/",
    "unicode": "http://identifiers.org/unicode/U+",
    "kanjivg": "http://kanjivg.tagaini.net/kanji/",
    "dbpedia": "http://ja.dbpedia.org/resource/",
    "estat-sac": "http://data.e-stat.go.jp/lod/sac/",
    ...
  },
  "@id": "https://handwritten-lod.jp/capture/123",
  "@type": "CaptureEvent",
  "license": "https://creativecommons.org/licenses/by/4.0/",
  "character": "unicode:U+4E00",
  "kanjivg_ref": {
    "@id": "http://kanjivg.tagaini.net/kanji/03055",
    "downloadUrl": "http://kanjivg.tagaini.net/kanji/03055.svg"
  },
  "timestamp": "2024-01-01T00:00:00Z",
  "stroke_count": 1,
  "strokes": [
    {
      "order": 1,
      "path": "M 10 20 L 30 40",
      "physics": {
        "point_count": 50,
        "pressure_available": false
      }
    }
  ],
  "contributor": {
    "age_group": "20-29",
    "city": {
      "@id": "http://ja.dbpedia.org/resource/Kawasaki",
      "name": "川崎市"
    },
    "region": {
      "@id": "estat-sac:C14130"
    },
    "device": {
      "type": "...",
      "os": "Windows",
      "browser": "Chrome"
    }
  },
  "quality_metrics": {
  "readability_score": 0.72,
  "balance_score": 0.58,
  "evaluation_count": 12
  },
  "evaluations": [
    {
      "question_id": "Q1",
      "question_text": "形がきれい",
      "mu": 25.0,
      "sigma": 8.333,
      "ordinal_score": 0.64,
      "evaluation_count": 10
    }
  ]
}

主な特徴

  • 外部データセットとの連携
    • Unicode: 文字の標準コードポイント(例: U+4E00)
    • KanjiVG: 漢字のストローク構造データ(概念URIとSVGファイルURLを分離)
    • DBpedia: 都市情報をURIで参照(例: 川崎市 → http://ja.dbpedia.org/resource/Kawasaki)
    • e-Stat: 日本の自治体コード(例: estat-sac:C14130)
  • 品質メトリクス
    • readability_score: 読みやすさスコア(Q3評価軸のOpenSkillレーティングを0〜1に正規化した値)
    • balance_score: バランススコア(Q1評価軸のOpenSkillレーティングを0〜1に正規化した値)
    • evaluation_count: 評価回数
  • 評価データ
    • 各評価軸(Q1: 形がきれい、Q2: 芸術的、Q3: 読みやすい)ごとのOpenSkillスコア
    • mu(平均値)、sigma(標準偏差)、ordinal_score(0〜1に正規化された品質スコア)を含む
  • ストロークデータ
    • SVGパス形式のストローク情報
    • ポイント数や筆圧情報の有無を含む物理的特性
  • ライセンス
    • Creative Commons Attribution 4.0 International (CC BY 4.0)

Turtle形式

Turtle形式にも対応しています。