JDT for Taiyaku >> 「ユーザー辞書」メニュー              
「ユーザー辞書」を作成された場合は、ユーザー辞書のインデックスの作成・抽出・ファイル作成をすると多くの情報を高速に検索することができます。


書籍版英辞郎のデータを利用して「ユーザー辞書」形式の英辞郎を作成された場合は、以下の手順を参照して下さい。

4つのフォルダ(「英辞郎」「略語郎」「和英辞郎」「例辞郎」または「音辞郎」)それぞれで以下の作業が必要となります。
 英辞郎 見出し語からインデックス語を作成
本文から日本語インデックスを抽出
インデックスファイルの作成
 音辞郎 or 例辞郎 見出し語からインデックス語を作成
  本文から日本語インデックスを抽出
インデックスファイルの作成
 略語郎 見出し語からインデックス語を作成
本文から日本語インデックスを抽出
インデックスファイルの作成
 和英辞郎 見出し語からインデックス語を作成
本文から日本語インデックスを抽出
インデックスファイルの作成
「ユーザー辞書」メニューの項目

 メニュー項目   説  明
見出し語から
インデックス語を作成
ユーザー辞書の検索用インデックスを自動的に作成します
本文から日本語インデックスを抽出 英和型のユーザー辞書の本文から漢字・カタカナの語を抽出し、和英機能を使えるようにします
インデックスファイルの作成 完成したユーザー辞書にインデックスファイルを作成し、検索を高速化します


    
        
■■ 見出し語からインデックス語を作成(ユーザー辞書) ■■
通常の紙の辞書は「見出し語」と「本文」によって構成されますが、電子辞書には加えて検索用の「インデックス語」も必要になります。「インデックス語の作成」とはこの部分を自動化する機能です。
見出し語からインデックス語を作成する手順
JDT for 対訳君画面 [ユーザー辞書]→[見出し語からインデックス語を作成] 
1.ユーザー辞書を指定する

ユーザー辞書フォルダ をクリックする。



 ※見出し語の全単語を条件検索に追加
見出し語が単一の単語ばかりの辞書では前方一致のみですべての単語を検索することができますが、見出し語に熟語や用例など複数の単語がある辞書では前方一致と後方一致のみでは十分な検索が行えないことがあります。このオプションをオンにすると見出し語に使われているすべての単語を条件検索用インデックスに追加します。これによりユーザー辞書でも熟語や用例の検索などができるようになります。
     

コンバート済みの辞書が入っているフォルダの@ドライブ、Aディレクトリ・フォルダを指定して→[OK]

2.実行する
利用上の注意点
  • 「DATA」フォルダ内ファイルは書き換えられますので、万が一に備え、バックアップをとっておいてください。※このフォルダがあるディスクに十分な空きスペースが必要となります。
  • この機能は見出し語が日本語の辞書でも使えますがその場合は「見出し語の全単語を条件検索に追加」はオフにして実行してください。
  • すでにインデックスファイルを作ってあった辞書を変換した場合は必ずインデックスファイルを作り直してください。
■■ 本文から日本語インデックスを抽出(ユーザー辞書) ■■
ユーザー辞書の本文から日本語の単語(連続する漢字またはカタカナ)を抜き出してインデックスに追加します。これにより英和型のユーザー辞書に和英機能を追加したり本文に含まれる日本語キーワードを使った検索などが可能になります。
本文から日本語インデックス語を抽出する手順
JDT for 対訳君画面 [ユーザー辞書] → [本文から日本語インデックスを抽出] 
1.ユーザー辞書を指定する

ユーザー辞書フォルダ をクリックする。

     

コンバート済みの辞書が入っているフォルダの@ドライブ、Aディレクトリ・フォルダを指定して→[OK]
   
除外する括弧などのリストのファイル

辞書の本文に品詞やジャンル・注釈などが書いてある場合など、それらをインデックス化の対象から除外し、純粋に説明文の部分のみからインデックスを取り出すことで検索の精度をあげることができます。このオプションで指定するファイルはテキスト形式のファイルで、フォーマットは除外したい括弧の左側 (タブ) 除外したい括弧の右側 (改行)という形式です(必ずしも括弧でなくてもかまいません)。また特定の記号から改行までを読み飛ばしたい場合は、除外した記号(タブ)¥n 改行)と記述します

     サンプル
◆      \n
【発音  \n
【@    \n
【レベル        \n
【大学入試      \n
《      》
{       }
【      】
・1文字の場合はインデックスに入れない

1文字の漢字やカタカナをインデックス化するかどうかを指定します。デフォルトはオン(入れない)になっています。1文字の語をインデックスに入れた場合は検索語に全然関連のない項目が検索されることが多発し検索精度が大幅にさがります。また、インデックスの量が膨大になるためインデックスファイルの作成などに大幅な時間がかかるようになります。

・条件検索インデックスに入れる
オフにした場合は抽出された語が前方一致インデックスに追加されます。本文のデータがすべて見出し語の直訳のみのような辞書の場合は前方一致に入れると便利ですが、本文に直訳以外の語や用例が入っている辞書では前方一致に追加すると検索語と検索結果の関連が不明瞭になることがあります。この場合は本文のキーワードを検索する条件検索に入れた方が自然な動作になります
2.実行する
利用上の注意点
  • 単純に漢字またはカタカナの連続を抜き出しますので不要なインデックス語が作成されることもあります。
  • 日本語の性質上ひらがなや漢字仮名交じりの単語は抽出できません。
  • ユーザー辞書にコンバートした英辞郎でこの機能を使う場合はインデックスファイルの作成の所要時間が大幅に増加します。実装メモリが512MB未満の環境では何時間または何十時間かかるかもしれません(十分なメモリのある環境では数分〜十数分で終了します)。
  • すでにインデックスファイルを作ってあった辞書を変換した場合は必ずインデックスファイルを作り直してください この機能は見出し語が日本語の辞書でも使えますがその場合は「見出し語の全単語を条件検索に追加」はオフにして実行してください
■■ インデックスファイルの作成(ユーザー辞書) ■■
    
インデックスファイルの作成手順
JDT for 対訳君画面 [ユーザー辞書]→[インデックスファイルの作成] 
1.ユーザー辞書を指定する


ユーザー辞書フォルダ  をクリックする。
   


辞書が入っているフォルダの@ドライブ、
Aディレクトリ・フォルダを指定して → [OK]
2.実行する
「対訳君」はユーザー辞書を以下の2種類の方法で検索することができます。
検索方法
用 途
説 明
テキストモード 編集途上の辞書用 一般的なテキストファイルの検索と同様に検索ごとに辞書の先頭から最後までを検索して該当語をリストアップします。データーの読み出しごとにファイルを開いて閉じますので「対訳君」と並行してエディタなどで辞書を編集することができます(編集直後には表示が乱れることがありますが、再検索すれば正しい表示になります)。この検索モードではファイルサイズに比例して検索に時間がかかるようになります。
インデックスモード 完成した辞書用 専用のインデックスを使った検索です。データが100万件以上あっても市販の電子辞書と同様の高速な検索が行えます。ただし、インデックスはデータの位置情報を元に作成されますのでインデックス作成後に辞書を編集した場合はインデックスを作り直す必要があります。このインデックスファイルを作成するのがJDTの「インデックスファイルの作成」です。
テキストモードとインデックスモードの切り替えはインデックスの有無により自動判別します。1度インデックスを作った辞書を再編集する場合はINDEXフォルダを中身ごと捨ててください。
利用上の注意点
  • インデックスファイルの作成には大量のシステムリソースが必要になり処理時間もかかります。この作業を行う前に他のすべてのアプリケーションを終了させ、空きメモリをできるだけ多くしてやると処理速度が向上します。
  • インデックスファイルの作成完了後に、エラーメッセージが表示される場合もありますが、処理は正常に終了しております。

Copyright(c) 2008 MCL Corp. All Rights Reserved.