「見出し」列の正規化に関する注意事項

昨年度までに公開していたバージョンでは、漢字の入力方針を各データベースの作業者に任せていたため、「単字」「漢語」列に新旧字体が混在していた。
そこで、2024.3以降のバージョンでは、従来の「単字」「漢語」列の名称を「単字_出現形」「漢語_出現形」に改めた上で、「常用漢字表」(2010年告示)において( )内に示される旧字体のうち、JIS第2水準の範囲に限って、新字から旧字への置換を行い、その結果を「単字_見出し」「漢語_見出し」列に格納した。変換リストの出典には、「漢字データベース」で公開されている「常用漢字表異体字」(https://github.com/cjkvi/cjkvi-variants/blob/master/joyo-variants.txt)を利用した。

ただし、「灯/燈、弁/辨・瓣・辯、糸/絲、欠/缺、缶/罐、台/臺、芸/藝、虫/蟲、証/證、予/豫、余/餘」の11字については、新字と旧字の区別が字種の区別に関わるため、置換を行わなかった。

なお、常用漢字表外の字種については、置換の対象外となっている。また、常用漢字表内の字種であっても、「畧」「舩」のように、新字体でも旧字体でもない字体が「出現形」列に入力されている場合は、変換できていない点にご留意いただきたい。次年度以降に対応予定である。

※新字→旧字 置換リスト(249字)
乗→乘
乱→亂
亜→亞
仏→佛
来→來
仮→假
伝→傳
偽→僞
価→價
倹→儉
児→兒
両→兩
剰→剩
剣→劍
剤→劑
労→勞
勲→勳
励→勵
勧→勸
区→區
巻→卷
参→參
単→單
厳→嚴
嘱→囑
圏→圈
国→國
囲→圍
円→圓
図→圖
団→團
堕→墮
圧→壓
塁→壘
壊→壞
壌→壤
壮→壯
壱→壹
寿→壽
奥→奧
奨→奬
嬢→孃
学→學
寝→寢
実→實
写→寫
宝→寶
将→將
専→專
対→對
届→屆
属→屬
峡→峽
岳→嶽
帯→帶
廃→廢
広→廣
庁→廳
弾→彈
弥→彌
径→徑
従→從
恒→恆
恵→惠
悪→惡
悩→惱
慎→愼
惨→慘
応→應
懐→懷
恋→戀
戦→戰
戯→戲
払→拂
抜→拔
拝→拜
挟→挾
挿→插
揺→搖
捜→搜
択→擇
担→擔
拠→據
挙→擧
拡→擴
摂→攝
収→收
効→效
叙→敍
勅→敕
数→數
断→斷
昼→晝
暁→曉
曽→曾
会→會
条→條
桟→棧
栄→榮
楽→樂
楼→樓
枢→樞
様→樣
検→檢
桜→櫻
権→權
欧→歐
歓→歡
帰→歸
残→殘
殻→殼
殴→毆
気→氣
浄→淨
浅→淺
渓→溪
滞→滯
満→滿
潜→潛
渋→澁
沢→澤
湿→濕
済→濟
浜→濱
滝→瀧
湾→灣
焼→燒
営→營
炉→爐
争→爭
為→爲
犠→犧
狭→狹
独→獨
猟→獵
獣→獸
献→獻
画→畫
当→當
畳→疊
痴→癡
発→發
盗→盜
尽→盡
真→眞
砕→碎
秘→祕
禅→禪
礼→禮
称→稱
稲→稻
穂→穗
穏→穩
窃→竊
並→竝
粋→粹
経→經
県→縣
縦→縱
総→總
縄→繩
絵→繪
継→繼
続→續
繊→纖
声→聲
聴→聽
粛→肅
脳→腦
胆→膽
臓→臟
与→與
旧→舊
艶→艷
荘→莊
茎→莖
万→萬
蔵→藏
薬→藥
処→處
号→號
蛍→螢
蚕→蠶
蛮→蠻
衛→衞
装→裝
褒→襃
覚→覺
覧→覽
観→觀
触→觸
謡→謠
訳→譯
誉→譽
読→讀
変→變
譲→讓
豊→豐
弐→貳
売→賣
賛→贊
践→踐
軽→輕
転→轉
辞→辭
逓→遞
遅→遲
辺→邊
酔→醉
医→醫
醸→釀
釈→釋
銭→錢
鎮→鎭
鉄→鐵
鋳→鑄
鉱→鑛
関→關
陥→陷
随→隨
険→險
隠→隱
双→雙
雑→雜
覇→霸
霊→靈
静→靜
顕→顯
翻→飜
餅→餠
騒→騷
駆→驅
験→驗
駅→驛
髄→髓
体→體
髪→髮
鶏→鷄
塩→鹽
麦→麥
黙→默
点→點
党→黨
斉→齊
斎→齋
歯→齒
齢→齡
竜→龍
亀→龜