下記、いずれも2024年5月29日に公開した最新バージョンです。クリックするとダウンロードが始まります。
- DHSJR_data_all_20240529.zip…統合データ(タブ区切りテキストデータをZipで圧縮)
- DHSJR_data_files_20240529.zip…54文献の個別データ(Excel形式のファイルをZipで圧縮)
- Bibliography_20240617.zip…書誌データ(md形式のテキストデータをZipで圧縮)
書誌データには、資料名、時代、原本所蔵、影印・複製・電子画像情報、入力凡例、字音情報、参考文献を掲載しています。各データを参照する際にご利用ください。
*上記統合データおよび個別データについて、50-041-01_邦訳日葡辞書、および90-046-01明解日本語アクセント辞典は、現在未公開です。
データ列の構成
- ID:単字ごとのユニークID(統合データのみ)
- 資料番号:資料ID
- 資料名
- 資料内漢字番号:漢字の資料内出現順の通し番号
- 資料内漢語番号:漢語の資料内出現順の通し番号
- 単字_見出し:音注が付された漢字の見出し列。JIS漢字第2水準の範囲内の字体は康熙字典体に正規化。(「見出し」列の正規化に関する注意事項)
- 単字_出現形:音注が付された漢字。原則的に入力者の表記方針による。助詞、音合符などが表記される場合もある。
- 漢語_見出し:音注が付された漢字を含む漢語の見出し列。JIS漢字第2水準の範囲内の字体は康熙字典体に正規化。 (「見出し」列の正規化に関する注意事項)
- 漢語_出現形:音注が付された漢字を含む漢語。単字_出現形に同じ。
- 漢語_alphabet:欧文による漢語の表記がある場合に入力されている
- 語種:混種語がある場合に、語種を示す。ただし入力者によって対応はまちまちである。
- 漢語内位置:漢語内での単字の位置。例えば1文字目ならば”1”。
- 単字長:単字の拍数(この項目はほとんど入力できていない。今後の検討課題である)
- 声点:単字に対する四声(平上去入)、六声(平平軽上去入軽入)及び清濁
- 声点型:漢語に対する声点の組合せ。声点がない単字については*で表す。
- 仮名注:仮名表記による字音注(仮名反切を含む)
- 仮名型:漢語に対する仮名注の組合せ。仮名注がない単字については*で表す。
- 反切:単字に対する反切注
- 類音:単字に対する類音注
- 節博士:声明等音楽資料に付される博士譜など
- その他:その他の音注
- 出現位置:資料内の単字・漢語の所在
- 備考:注記すべき事柄
*この他、文献によっては独自の列が存在している場合もあります。各文献におけるより具体的な表記の注意点は、Bibliographyファイル(データセットからダウンロード可能)をご覧ください。