近傍検索で漏れを減らす H20.8.30

 近傍検索(近接演算)は、PatentWeb/PatSearch Fulltextのように明細書全文
を対象に検索する時は、大変重要な検索手法だと思われます。ところが、うまく
使えない人のいることが分かりました。

 その人が言うには、近傍検索では絞りすぎになって漏れが多くなるというので
す。私はあまりそのように感じていなかったので、やり方を見せてもらいました
ら理解できました。

     ご参考 近傍検索の典型的なやり方; motor near5 cool
         近傍検索の基本的な説明; ⇒USPの近傍検索 H12.8.2

 結論を言うと、以下のような点に気をつければ近傍検索は漏れが少なくうま
く使えます。(これ以外にも適切なキーワードを選定するなどは必要なことです。)
@orで同義語、類義語を補う。例;motor near5 (cool or coolant or heat)
A前方一致を使う。例;motor near5 cool*
B近さを限定しすぎない。例;motor near20 cool

@orで同義語、類義語を補う

 例;motor near5 (cool or coolant or heat)
 カッコで囲ってその中に、orやandでキーワードを設定できます。これにより
同義語や類義語を指示できますので漏れを大幅に減らせます。
 下記はmotor near5 coolだけに対して、どのように件数が増えるかを示してい
ます。   対象;2005年以降の登録USP
  440件 motor near5 cool
 1632件 motor near5 (cool or cooling)
 1742件 motor near5 (cool or cooling or coolant)
 2859件 motor near5 (cool or cooling or coolant or heat)
 4266件 (motor or generator) near5 (cool or cooling or coolant or heat)
 2235件 (motor or generator) near5 (cool or cooling or coolant)

 下記は近傍検索でorを指定している実際の画面です。


 実際の検索に当たっては、その同義語、類義語を加えて良いかどうか十分に吟
味することが必要です。

 特に、類義語をorで加えることは検索の漏れを減らすために貴重なものです。
しかし、同じ意味ではないワードをorで加えることですから、その検索目的にお
いて、その類義語を加えてもノイズが多くならないということを十分検討するこ
とが必要です。そうしないとノイズが極端に増える原因になってしまいます。

 上の検索例では (motor or generator) near5 (cool or cooling or coolant)
は理解できるとしても、heatまでorで加えるような検索目的というのはちょっと
考え難いかもしれません。しかし、全くないわけではありません。

A前方一致を使う

 指定されたキーワードは一致しなけばならないが、その後ろにはどのような
文字があってもよい、という前方一致が使えます。PatentWebでは前方一致の指
定のために、*を使います。

例;motor near5 cool*

 上の例では、coolだけでなく、その後にどのような文字列が来ても対象にな
ります。例えば、cools、cooling、coolantなどは全部含みます。
下記に検索結果を紹介します。対象;2005年以降の登録USP
  440件 motor near5 cool
 1977件 motor near5 cool*
比較 1742件 motor near5 (cool or cooling or coolant)

 比較にあるように(cool or cooling or coolant)を使うよりも235件も
増えています。この差を見るには下記のような検索で行なえます。



この中には下記のようなものがあり、多くの場合、妥当なものが検索さ
れています。


 ただし、語尾にどのような文字列がくるか分かりませんので、語幹の文字
をあまり短くする場合には注意が必要です。
例えば car* などにおいては、車のcar以外に、炭素の意味のcarbonateや
それに類似のワードの化学薬品名を含みます。

B近さを限定しすぎない

 motor near5 coolは、5ワード以内に左右のワードが存在するものを検索
している。motor near10 coolとすると、10ワード以内に存在するものを検索
するので、条件が緩やかになり、回答件数が多くなり、漏れは減ります。

 しかし、漏れは減りますがノイズが増え過ぎる恐れが生じます。その対策
として、さらand検索などで絞ることになりますが、それによって漏れが増え
る恐れがありますので、注意が必要です。

 また、近傍検索では以下のような演算子が利用できます。
 演算子など  入力例   説明 
nearN digital near4 video near5 camera  Nワード目以内に次のワードがあるもの
 間に(N-1)個以内のワードがあって良い)
adjN floppy adj disk 上と同じ、ただし、語順どおり
with note with desk 同1文章内
same electronic commerce 同1パラグラフ(段落)内

 下記に、実際の検索結果を紹介します。対象;2005年以降の登録USP
 1977件 motor near5 cool*
 2832件 motor near10 cool*
 5820件 motor with cool*
 6179件 motor same cool*

 近さの指定条件が緩やかになるということは、and検索に近いづいていく
ことになります。
近傍検索の条件指定が緩やかになると上のように件数が増えますが、ノイ
ズも多くなります。

2832件 motor near10 cool* には以下のようなノイズに近いものが含まれる
ようになるので注意が必要です。


5820件 motor with cool* にはさらに、以下のようなノイズが含まれる
ようになるので、注意が必要です。


ノイズが多くなった場合には、このような緩やかな条件にしたのが良かっ
たのか検討し、また、漏れに注意しながら、他の条件でさらに絞り込むと
いいでしょう。