eiji yoshikawa laboratory
TOP 授業 ゼミ 研究 履歴 雑記 書庫 LINK
 
イメージ  
archives
  個人的に作成・蓄積してきたデータやプログラム・スクリプト等がありますが、バグや版権の問題など、相当手を加えないと(ものによっては手を加えても)公開できません。可能なものは、なんとか校務の合間を縫って提供してゆくつもりです。
作品鑑賞 高校生の時に虜になり、現在にいたるまで耽溺しています。三好達治が「唯一無二の詩人」と心酔した詩人、口語自由詩の確立者です。代表作に『月に吠える』『青猫』があります。
萩原朔太郎詩抄

紀貫之歌抄
(掲載予定)
和歌資料
八代集類句索引
八代集に収載される短歌約9,000首から、類句・類縁関係にあるもの1,660組を掲載。スクリプトを作成して自動抽出したものです。かつて大学紀要に「八代集類歌一覧礎稿」として掲載しましたが、HTML化に際して歌番号のみでなく歌詞を掲出しました。
解題
1. 古今集(328首/565組)
2. 後撰集(347首/537組)
3. 拾遺集(372首/588組)
4. 後拾遺集(258首/379組)
5. 金葉集(167首/239組)
6. 詞花集(105首/156組)
7. 千載集(252首/350組)
8. 新古今集(371首/505組)

八代集各句索引
(掲載予定)

後撰和歌集注釈
(掲載未定)
プログラム
国歌大観検索
『新編国歌大観』46万首の検索用プログラム。CD-ROM版(紀伊国屋書店)添付のソフトが使い勝手が悪いため作成しました。検索本文(校訂・かな)、検索対象(歌詞・詞書)、時代別指定、歌集種別指定、歌人指定、本文閲覧、解題閲覧などの機能があり、通常検索のほか、OR検索、AND検索が可能です。また正規表現が使えますので、ご存じの人はおわかりのように添付ソフトより格段に便利なのですが、対象データは市販CD-ROM(定価28万円)から吸い出して加工したものなので、未来永劫公開できません。
国歌大観検索のウィンドゥ …カーソルを乗せると拡大

万葉集検索
検索対象(歌詞・題詞・左注)、検索本文(白文・訓読・かな)、対象巻、作者指定、OR検索、AND検索、各句検索、事項検索、正規表現検索、表記の一括変換、引用形式コピー、歌集ファイル作成などが可能です。友人に求められて作ったもので、若干プログラムを修正する必要がありますが、データ作成者の了解が取れれば公開できると思います。
万葉集検索のウィンドゥ

歴史検索
公開予定はありません。西暦・元号の年号対照、事項・人名検索などができますが、データが不十分なのであまり有用性はないでしょう。
日本語辞書
古文変換辞書
"WXG"専用です。「思はざりけり」「咲かんずらん」「言ひ伝ふるなれば」のような古文の言い回しが一発で変換できます。どういう仕組みかは辞書ファイルの中身を覗いてください。拡張品詞をもち接続が指定できる"WXG"ならではの機能で、その他のIMEは付属語が登録できないため使用できません。ちなみに、"WXG"はすでに開発中止になっており、WindowsXPには完全対応していません。
WXG用 ダウンロード

単漢字変換辞書
"WXG ver.4"、Windows標準搭載の"MS-IME"で使用できます。画数・部首・読みのすべての組み合わせ(17万通り)で漢字変換できます。例えば、「枦」はハゼという木の名ですが、訓がわからなくても、「き8」「と8」「き・と」「と・き」のように入力して変換することができます。画数だけでは変換しません。部首や読みに続けて入力します。±1の誤差を許容し「き7」「と9」でも変換します。また、部首と読みはあいだに中黒(・)をはさんで入力、「部首・部首」「読み・読み」「部首・読み」のいずれの組み合わせも可能で、順序を問いません。部首名については辞書ファイルを覗いてください。
WXG用 ダウンロード
MS-IME用 ダウンロード

アーカイブはzip形式の圧縮ファイルで、解凍すると辞書テキストになります。テキストファイルからの一括登録の方法は、"WXG"ユーザは詳しいはずなので省略します。"MS-IME"の登録方法は以下のとおりです。

  1. 適当なフォルダに解凍します。単漢字辞書は解凍すると4MBのサイズになります。
  2. 言語バーで右クリック→「設定」を選択。
  3. 「プロパティ」→「辞書/学習」→「辞書ツール」とクリック。
  4. 「ファイル」メニューから「新規作成」を選択し、適当なファイル名を入力して新規辞書を作成。
  5. 「ツール」メニューから「テキストファイルからの登録」を選択、解凍したファイルを指定して登録。
  6. 「ツール」メニューから「システム辞書の作成」を選択、作成した辞書をシステム辞書に変換。
  7. IMEのプロパティからシステム辞書に追加。警告が出ますが無視して実行。
スクリプト テキストファイルに対してさまざまな加工処理を行います。DOSコマンドプロンプトで実行、数万行のファイルでも一瞬で処理します。"sed"や"jgawk"の実行ファイルはVectorなどで入手してください。
sed
DOSコマンドライン: sed -f script filename
アーカイブには次のスクリプトが含まれています。
num_n.sedファイル全体の全角算用数字・半角算用数字・漢数字を相互に変換する。
kana_n.sedファイル全体の平仮名・片仮名・半角片仮名を相互に変換する。
kanji_n.sedファイル全体の旧漢字と新漢字を相互に変換する。
bunsetsu.sed全文を文節単位に分割する。必ずしも正確ではありません。
buntai_n.sed全体の「である・だ」調と「ですます」調を相互に変換する。
nagasaki.sed全文を長崎弁に翻訳する。
nagoya.sed全文を名古屋弁に翻訳する。
osaka.sed全文を大阪弁に翻訳する。
null.sedファイル中の空行をすべて削除する。
ダウンロード

awk
DOSコマンドライン: jgawk -f script filename
アーカイブには次のスクリプトが含まれています。
文章推敲 moji.awk文字種別カウンタ。漢字・仮名・英数字の文字数を報告する。
buncho.awk1文ごとに文字数をカウント。単調な文章を回避する。
bunmatu.awk文末表現をチェック。同一表現の連続を回避する。
long.awk長大な仮名表記をチェック。
構造解析 line.awk全体の行頭に通し番号を付加。
recinfo.awkファイルのデータ構造を報告する。
nf.awk各行のフィールド数を報告。
maxlen.awk各フィールドの最大長を計算。
整形処理 keta.awk全フィールドの桁位置をそろえ見やすくする。
multi.awk多項目データを1項目1フィールドに整形する。
hyou.awkカンマ区切りやTAB区切りのデータを表に自動変換。
その他 revcara.awk1行の文字を逆順に並べ替える。
reverse.awk1行の文字を逆順に、行の順番を逆に出力する。
revline.awkファイル全体の行の順番を逆転させる。
seiseki.awk成績の自動集計。合計点・平均点・評定点を自動計算する。
ダウンロード

バッチファイル
(掲載未定)
実用ソフト
図書管理
(掲載未定)

テキスト・フィルタリング
(掲載未定)

総合デスクトップ・マネージャ
(掲載未定)

スケジューラ
(掲載未定)

住所録&葉書印刷
(掲載未定)
ページトップへ