資料室


データベース公開


「知は萬人によって求められることを自ら欲す」――擬岩波文庫發刊之辭

「エエイ、持ってけ泥棒」(copyleft)――無名氏


 *普請中(Under Reconstruction!)

*重量あるデータはZIP形式で壓縮アーカイヴが開けない者は、+Lhaca等の解凍ソフトを利用せられたし。


『變態心理』總目次
表形式・エクセル用(.xls)壓縮ファイル.zip/506kb

中村古峽主幹・日本精神醫學會發行『變態心理』誌1917.61926.10全署名記事一覽

不二出版發行複刻版別册所收「総目次・索引」及び変態心理と中村古峡所收「執筆者別総目次」の元データである。出版時の校正を反映してゐない。 *

正字正假名遣ひ仕樣かな漢字變換辭書

正假名遣(但し字音假名遣を除く。促音拗音は小書き)で入力して正字表記(但し主にJIS X 020897JIS)の包攝規準内で)にする、かな漢字變換辭書。些か自家用の癖あれど、お要り用ならどうぞ。

ATOK13(一太郎10)以降向け。――ATOK16(2003年發賣)から舊かな入力に對應した文語モードも出來たが、口語文の歴史的かなづかひ、さらには正字體表記の爲には、なほ自前で辭書を用意する必要がある。他の辭書と共に、その叩き臺ともなれば幸ひ。類似品は過不及ある變換表に基づくもの少なからざれば、努めて誤謬無きを期した。

ATOK以外の日本語入力システムでも、單語ファイル(テキスト形式)から變換辭書への登録は可。但し、假名遣のためには、ハ行四段活用に品詞對應してゐること(ハ行四段動詞が1500語以上ある)。例、Mac OS X專用egbridge Universalにて利用できた由iwaman「egbridge Universalで正字正かな」『正字正假名覺書』2007年6月19日、參照)

ATOK用正字正假名辭書セット内訣zip形式壓縮ファイル)
辭書ファイル.dic

約14萬7千語

ATOK共通形式

ATOK2007(=ATOK20)以降コンバート不要で使用可。ATOKプロパティ追加する。

單語ファイル.txt

約14萬7千語

ver.13以降互換
Unicodeで出力した)

辭書ユーティリティーで新規辭書作成し一括登録する。但し、上二段・下二段活用はver.16以降のみ登録可。一部機種依存文字が文字化けしてゐるかも。

單語コメント.txt

約300語

年號干支.dic

593〜2014年

ATOK共通形式

「780ねん」と入力し「七八〇(寶龜十一)年」「寶龜庚申」等に變換。「年号辞書」「『干支』for ATOKとに基づく飜字版。

以上同梱、2014年4月29日版(zip形式壓縮ファイル/3.3mb)→ダウンロードする

辭書を裝備する手順は「THn版正字正仮名辞書のインストール」等も參考に。Windows Vista以降、辭書ファイルの置き場所は“C:\Users\ユーザー名\AppData\Roaming\Justsystem\ATOK\DIC\”とした(ツール→フォルダ オプション→表示→ファイルとフォルダの表示→すべてのファイルとフォルダを表示する)。

基本は、ATOK1317標準辭書を單語ファイルとしてテキスト出力し、JIS X 208の對應範圍で全て正字體に一括變換した上で、讀みを歴史的假名遣に直しながら用字(當用漢字制定後の「同音の漢字による書きかえ」その他)も點檢・修正してゆき、最後に元の標準辭書との重複を削除して成った。ほか日本語變換ソフト『契冲』ver.12.9の單語辭書も參照し、また諸書を調べて疑問假名遣には單語コメントを附し、さらに中國史・漢文、佛教語、圖書館用語、等々の各種專門辭書も舊假名讀み・舊字表記化して加へてある。表記の新舊に關はらぬ語彙も含め私用に應じて單語登録しつつ、普段利用中に氣づいたことはチビチビ訂補に努めて適當に溜まったらここに更新してゐるが、ATOK2005(version 18)以降からシステム辭書が閲覽不可にされたため、嚮後の大幅な改訂は見込めない。

09-02-12追記:ATOK2009(=ATOK22)より機能強化され、文語モードでの入力中に正字體表記をも變換候補に擧げるやうになったJUST­SYSTEMS特長 いわゆる康煕字典体の入力もスムーズに。まだまだ問題ありとはいへcf.iwaman「ATOK2009の文語モードで色々試してみた」『科學の剃髮』2009年2月5日)、やうやく我が辭書を公開する意義も薄れることかと思ふ。

新字⇔正字變換表
Seizi.txt60kb):新字→正字(2005-09-16補訂)
Sinzi.txt60kb):正字→新字

Seizi.exe附屬の變換表ファイルSeizi.datには誤りもあるため、自家用に修訂したもの。テキスト・ファイルにて、各行にユニコード番號・漢字・正字をスペース區切りにして入れてある。JIS X 208:1997の範圍内での新・舊字對照表を兼ねる。名前の變更で擴張子を“.dat”にすればSeizi.exeで使へる。ついでに、正字を新字化する爲の變換表としてSinzi.txtも作った。兩者はほぼ重なるが一對一對應でなく微差がある。そもそも、もと複數の別字が新字で一字に纏められてしまった字體(辨・辯・瓣→弁、予・豫→予、ほか)は機械的置き換へができない。既存のJISポインタ等も參照の上、利用者は各自手を入れられたし。

CID正字化置換用 新舊異體字對照表
EucCidCid3.dat82kb):A­do­be-Ja­pan1準據CID番號1125〜8285+α (2007-11-03up­date)

例、「:1126:7633」。開いて讀むには擴張子を“.txt”に變更する。文字コードはEUC

「実験室:fontforgeをつかってAdobe Reader付属の小塚明朝を自分ごのみにする。」(「じめじめ団」提供『梅雨空文庫』内)に公開されてゐるEucCidCid2.datは、自稱「できそこないの当用漢字字体絶滅版作成用」とて、JIS包攝規準で別コードに分けてある字までも舊字に統一してしまふので、JIS第2水準までの中で新舊分離して共に備はってゐる字は除外とし、誤脱を修補しつつ、異體の字形差も勘案して私に改めたもの。記された番號から「A­do­be-Ja­pan­1の漢字(部首画数順)」を檢索すると字形グリフを確認できる。この表を利用してA­do­be-Ja­pan­1-6對應のO­pen­Typeフォント(“小塚明朝Pro-VI Re­gular”が無償で入手可)を改造すれば、いはゆる康熙字典體で實裝したフォントが作成される。

正字體フォント作成法――或いは、余は如何にして或種のフォントを作り得ざりし乎

技術文書、上記「CID正字化置換用 新舊異體字對照表」の用法を含む。注意書きあり。(2007-11-03update)

代替スタイルシート切換用JavaScriptプログラム
SwitchStyle.js7kb):セレクト・メニュー式切替
changessR.js4kb):ラジオ・ボタン式切替

WinIE5.5以降向け。いろんな所のを寄せ集めて眞似ただけ。他にもっといいのがある筈。といふか、誰か詳しい人に改良して貰ひたい。Cookieなんてよく知らないのに、これ以上は手に餘る。(2022年11月改造)


【書庫】資料室

▲刊記▼

發行日 
2003年3月 開板/2014年4月29日 改版
發行所 
http://livresque.g1.xrea.com/Data/index.html
ジオシティーズ カレッジライフ(舊バークレイ)ライブラリー通り 1959番地
 URL=[http://www.geocities.co.jp/CollegeLife-Library/1959/Data/index.html]
編輯發行人 
森 洋介MORI Yôsuke [livresque@yahoo.co.jp]
亂丁落丁(リンクぎれ)、誤記誤植、刷りムラ等、お氣づきの點は、乞ふ御一報