近接演算の使い分け    H16.4.22

 PatentWebでは下記のようにいくつもの近接演算が利用できます。これにより長い明細書の検索も適切な検索ができます。
 近接演算子   意 味          
 same     同一パラグラフ(段落)内
 with     同一文内
 nearN,adjN  指定したワード数(N)の範囲内
検索式によく使われる and は、book and read などのように指定した前後のワードが1件の特許の中に存在するかどうかを指定するのでノイズが多いのです。これに対し、近接演算子を使うことで book と read が近くにある文章だけを指定することができますので、ノイズの少ない検索が可能になります。

 with
 PatSearch Fulltextで、例えば本を読み上げるシステムを検索したいとき、検索式として book and (read or reads or reading) しました。(read*とするとreadyなどまで含むので、避けるため*は使っていません。)
 ところがこれではまずい場合があります。ある特許で背景説明などの部分で”世の中にはbookや新聞がある・・・”と書かれ、最後の部分では”磁気記録媒体からreadしたデータを・・・”などと書かれていると、この特許も検索されますが、これは探したかったものと違う内容なので不要(検索される必要のなかった特許)と言う意味でノイズです。
対象はUS登録、2001〜2004.3月末までで 6074件もあります。
内容を見てみると、ほとんどのものは本を読み上げるようなものではありません。

 欲しいのは bookをreadするシステムですから、それらが同一文内にあるものだけに限定して検索できれば、かなりうまく行きます。
book with (read or reads or reading)とすると同一文内にbookとreadなどがあるものだけになるので1016件と、かなり減らせます。


 明細書を詳細に読むときは、その先頭部分にある Go to firtst matching をクリックすることで一致箇所を順次見ていくことで、非常に効率的な調査を行なえます。なおこのとき、bookやreadが単独にある部分は一致箇所になっておらず、withなどの演算子の条件を満たす部分のみが一致箇所になっていることです。つまり一文の中にbookやreadなどがある部分のみが一致箇所になっています。これはPatentWebのすばらしい特長の一つです。


When using the display device as an electronic book, (^) the display device is provided with a read (^)-in device ・・・

 上記のように一致箇所のみを効率よく見ていくことができます。

 ところが、現時点のPatentWebでは少々問題があります。それは、withを使った場合、以下の文のように必ずしも一文の中で条件を満たしていなくても出ることがあります。MicroPatent社でも気がついているようですが、データファイル全体の再作成になるので、慎重に検討しているようです。

例; US6715080、他に該当の部分は無いのでこの部分でbookとreadsが一つの文にあるように判断されていると思われる。しかし、"rowser 100 . If the user"の部分で分かれた2つの文なのに、一文と見ている。

The enterprise based OLTP service application 114 then reads (^) the user Cookie information, and passes back advertisements on books related to the Civil War to the web browser 100 . If the user decides to purchase a book, (^) transaction related cookie information which has already been passed to the end service application minimizes the amount of information that needs to be re-entered by the user.  

 これは確かにまずいです。しかし、システムの一部が不完全だから一切使わないと言うよりも、不完全さを上手に避けてうまく使いこなすことを考える方が現実的と思われます。問題点をなくすのに大きな費用をかけ、その結果利用料金が高価になったら、必ずしも便利とはいえません。
 どんなシステムでも大小の違いはあっても不完全さを内蔵しているものです。したがって、問題点を覆い隠して見えなくした体制よりも、問題点が見えてそれを注意して使いこなすのが懸命な態度と思います。例えば、飛行機でも離着陸ごとに発生する機体への損傷を明確にし、それを定期点検で観察しつつ飛行するとか、原子力発電所の圧力容器のヒビ割れも(使い始めた後は)存在するのが当たり前で、それを測定しつつ一定範囲以内ならば安全として使っていくと聞いたことがあります。

 withの不完全さの対策として2つ考えられます。
(1)利用者において2文を合わせて一つの文とみなすと許容できればそのまま使える。つまり、withの定義を、文法的に完全な1文ではなく、隣り合った文以内に存在するものを検索するものと考える。・・・少々長い文になり過ぎて、ちょっと使いにくくなるが。
(2)それに代わるものとしてnearNを使う。Nワード以内に存在することを条件とするnearNは完璧に機能しているようです。near10などとして10ワード以内に出てくるものを指定します。

 near
 book near5 (read or reads or reading) で検索すると、535件ありました。この特許の内容を見ると、下記のような文章を見つけることができます。

The transition of active reading from the paper environment to the electronic book (^) environment has not projected the same transparent user interface.

 readingとbookの間には4ワードまで許されるのですが、よく見ると7ワードもあります。しかしこれは間違いではありません。ワードとして数えられるのはストップワード以外の有効なワードだけなのです。from,the,to,theはストップワードでありカウントされませんのでそれらを除くと、間に4ワードあり、5ワード目にreadingとbookがあります。

 nearは文をまたいで近くにあるワードを探します。下記の実例はreadingが前の文、bookが後ろの文にあります。これは near の機能であり間違いではないようです。
Cloth must be sewn into or printed onto in order to create suitable reading material. Additionally, the above book, (^) mandated the use of sewing needles and thread.

 やはり near は頼りになる近接演算子です。

 same
 sameは同一段落内ですので(正常に機能している)withよりもやや遠くにあるものまで指定することができます。

 これは、bookをreadするというような直接的な関係のワードの場合ではなく、青色レーザの応用としてDVDに使うようなやや離れた関係のものを探すような場合に役立つようです。
(blue near2 laser) near5 DVD 23件
 near5などでは近すぎるため、近い関係のものしか探せません。
(blue near2 laser) same DVD 72件
 同一段落内に出てくる場合、応用などを探すとき好都合のことがあります。当然それ以外にも好都合のことがあります。
(blue near2 laser) and DVD 151件
 andになると、特許の前部と後部のように離れた所にあるものも包含するので、関係の薄いものまで出てくることが多いようです。

 adj
 nearとよく似てadj3などワードの近さを指定できますが、語順が書いたとおりになります。DVD or (digital adj versatile adj disk) などのように使います。
技術的な説明文では前後が明確に指定できることは少ないように思います。それよりも、製品やシステムなどの名称などで多く使うように思われます。

 出願人名で、Hitachi, Lid.を検索したいときは、Hitachi Chemical Company, Ltd.などを除くために、hitachi adj ltdとすることで検索できます。
 hitachi adj ltd 5432件

また、Hitachi, Ltd.以外にどのような社名があるのか見たいときは
Assignee欄に hitachi not (hitachi adj ltd) と入力することで検索することができます。



Hitachi, Ltd. 以外をリストアップできます。