牌語備忘録 -pygo

あくまでもメモです。なるべくオフィシャルの情報を参照してください。

牌語備忘録 -pygo

以前から英辞郎を MacOSX の辞書.app で使ってみたかったので例のあれをやってみた、その覚え書き

追記20110225
追記20110228
追記20110307:結論


例のあれ

とりあえず英辞郎のデータをGET

手持ちは少々古い第二版しかなかったので、Amazon で中古の英辞郎第四版を購入(送料込みで669円)
が、MacOSX環境だとテキストに書き出せないなど、若干はまったのでダウンロード購入をお勧めする。安さよりも時間大事。

以下、手順メモ(これは英辞郎第四版の場合のみかもしれない)

  1. 上記ブログの例のあれの記事を参考に進める。
  2. 必要なファイルをダウンロード
  3. 作業するフォルダをコピー
    • /Developer/Extras/Dictionary Development Kit/project_templates
  4. 作業するフォルダに英辞郎のテキストデータをコピー
    • Eijiro112.txt
    • Ryaku112.txt
    • Reiji112.txt
    • Waeijiro112.txt
  5. Ryaku112.txt をCP932に変換
  6. ruby -Ks ryaku_conv.rb < Ryaku112_sjis.txt > Ryaku.txt』
  7. テキストファイルの文字コードを全てUTF8に変換。
    • Eijiro112.txt
    • Ryaku.txt
    • Reiji112.txt
    • Waeijiro112.txt
  8. cat.rbは使わず、上記テキストをコピペで一つのファイルにする。(文字コードのあたりが問題無ければ cat.rb でも可のはずだけど)
  9. 検索置換する(Eijiro_all_dic.txt )
    • 行頭に『■』をいれる
    • 『///』を『:』に置換
    • 追記20110225:『 \ 』を『///』に、『【』を『{』に、『】』を『}』に置換したほうがいいかもしれない。
    • 追記20110228:抜けてた(Emacs で検索置換する場合)
      • Query replace regexp (default +: +【\(.*?\)】 -> : ■{\1}):
      • Query replace regexp (default \\\ 【\(.*?\)】 -> ■{\1}):
      • Query replace regexp (default {@} -> {その他}):
      • Query replace (default \ -> ■):
    • こんな感じになる
  • ruby eiji_conv.rb < Eijiro.txt > MyDictionary.xml ; make ; make install』
  • 出来上がり(上記コマンドから要2-3日)

総評

  • 思ったよりも使い勝手が良いかもしれない。素晴らしく良い。
  • 次やるときは英辞郎データをダウンロード購入する。
  • 辞書を一つにまとめたけど、例辞郎は辞書.appの性質上あまり役に立たないかもしれない。
  • 第四版と最新のデータが同じ形式かどうか分からないので、この手順は第四版の場合のみとする。
  • (環境:MacOSX10.6)

結論

  • なんか第四版のデータの並びが違うっぽい
  • 品詞の表示おかしくなったりする
  • よって素直に最新版をダウンロード購入してやり直すことにした。