データセット

下記、いずれも2024年5月29日に公開した最新バージョンです。クリックするとダウンロードが始まります。

書誌データには、資料名、時代、原本所蔵、影印・複製・電子画像情報、入力凡例、字音情報、参考文献を掲載しています。各データを参照する際にご利用ください。

*上記統合データおよび個別データについて、50-041-01_邦訳日葡辞書、および90-046-01明解日本語アクセント辞典は、現在未公開です。

データ列の構成

  • ID:単字ごとのユニークID(統合データのみ)
  • 資料番号:資料ID
  • 資料名
  • 資料内漢字番号:漢字の資料内出現順の通し番号
  • 資料内漢語番号:漢語の資料内出現順の通し番号
  • 単字_見出し:音注が付された漢字の見出し列。JIS漢字第2水準の範囲内の字体は康熙字典体に正規化。(「見出し」列の正規化に関する注意事項
  • 単字_出現形:音注が付された漢字。原則的に入力者の表記方針による。助詞、音合符などが表記される場合もある。
  • 漢語_見出し:音注が付された漢字を含む漢語の見出し列。JIS漢字第2水準の範囲内の字体は康熙字典体に正規化。 (「見出し」列の正規化に関する注意事項
  • 漢語_出現形:音注が付された漢字を含む漢語。単字_出現形に同じ。
  • 漢語_alphabet:欧文による漢語の表記がある場合に入力されている
  • 語種:混種語がある場合に、語種を示す。ただし入力者によって対応はまちまちである。
  • 漢語内位置:漢語内での単字の位置。例えば1文字目ならば”1”。
  • 単字長:単字の拍数(この項目はほとんど入力できていない。今後の検討課題である)
  • 声点:単字に対する四声(平上去入)、六声(平平軽上去入軽入)及び清濁
  • 声点型:漢語に対する声点の組合せ。声点がない単字については*で表す。
  • 仮名注:仮名表記による字音注(仮名反切を含む)
  • 仮名型:漢語に対する仮名注の組合せ。仮名注がない単字については*で表す。
  • 反切:単字に対する反切注
  • 類音:単字に対する類音注
  • 節博士:声明等音楽資料に付される博士譜など
  • その他:その他の音注
  • 出現位置:資料内の単字・漢語の所在
  • 備考:注記すべき事柄

*この他、文献によっては独自の列が存在している場合もあります。各文献におけるより具体的な表記の注意点は、Bibliographyファイル(データセットからダウンロード可能)をご覧ください。