制限語彙

「制限語彙」とは、簡単に言えば同義語の輪の中にある適当な言葉のリストであり、典拠ファイルのフォーム内の同意義用語のリストと言えるかもしれません。用語と用語の間に階層的な関係を定義(幅広い、狭いなど)すれば分類体系ができあがります。同義語の輪は、検索を目的とした際に、同義の言葉であると定義された単語をつなげて1つのセットにします。ところが、これらの単語は本当は同意義ではないことがよくあります。例えば、ある消費者用ポータルサイトが複数の企業から発売されている家庭用製品を評価した情報を提供しているとします。検索ログを調べたりユーザーと話したりすると、「同じ製品を探していても、人々が入力する単語は多岐にわたる」ということが分かるでしょう。ある電化製品を買う場合、ある人は製品種別を入力するかもしれませんし、知っている具体的な製品名を入力することもあるでしょう。あるいは、そのつづりを間違えた製品名を入力するかもしれません。似たようなケースはいくらでも考えられます。最適語はもともと無いのかもしれませんし、少なくともそれを定義するほどの理由も無いかもしれません。そのかわりに検索エンジンの素晴らしい機能を使って、同義語の輪を作り上げることができます。そのためにはテキストファイルに同義語を1セット入力するだけです。ユーザーが検索エンジンに単語を1つ入力すれば、テキストファイルでその単語が調べられます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です