追記20110225
追記20110228
追記20110307:結論
例のあれ
とりあえず英辞郎のデータをGET
手持ちは少々古い第二版しかなかったので、Amazon で中古の英辞郎第四版を購入(送料込みで669円)
が、MacOSX環境だとテキストに書き出せないなど、若干はまったのでダウンロード購入をお勧めする。安さよりも時間大事。
以下、手順メモ(これは英辞郎第四版の場合のみかもしれない)
- 上記ブログの例のあれの記事を参考に進める。
- 必要なファイルをダウンロード
- 作業するフォルダをコピー
- /Developer/Extras/Dictionary Development Kit/project_templates
- 作業するフォルダに英辞郎のテキストデータをコピー
- Eijiro112.txt
- Ryaku112.txt
- Reiji112.txt
- Waeijiro112.txt
- Ryaku112.txt をCP932に変換
- Ryaku112_sjis.txt
- 『ruby -Ks ryaku_conv.rb < Ryaku112_sjis.txt > Ryaku.txt』
- テキストファイルの文字コードを全てUTF8に変換。
- Eijiro112.txt
- Ryaku.txt
- Reiji112.txt
- Waeijiro112.txt
- cat.rbは使わず、上記テキストをコピペで一つのファイルにする。(文字コードのあたりが問題無ければ cat.rb でも可のはずだけど)
- 検索置換する(Eijiro_all_dic.txt )
- 行頭に『■』をいれる
- 『///』を『:』に置換
追記20110225:『 \ 』を『///』に、『【』を『{』に、『】』を『}』に置換したほうがいいかもしれない。- 追記20110228:抜けてた(Emacs で検索置換する場合)
- こんな感じになる
総評
- 思ったよりも使い勝手が良いかもしれない。素晴らしく良い。
- 次やるときは英辞郎データをダウンロード購入する。
- 辞書を一つにまとめたけど、例辞郎は辞書.appの性質上あまり役に立たないかもしれない。
- 第四版と最新のデータが同じ形式かどうか分からないので、この手順は第四版の場合のみとする。
- (環境:MacOSX10.6)
結論
- なんか第四版のデータの並びが違うっぽい
- 品詞の表示おかしくなったりする
- よって素直に最新版をダウンロード購入してやり直すことにした。