検索の最適化
これは、検索エンジン (1)の演習「検索の最適化」の解答例です。
検索エンジンはそのアルゴリズムを絶えず調整しています。検索とランキングのアルゴリズムもエンジンによって異なります。あるエンジンでうまくいくものが、別のエンジンでは全く機能しないこともあります。それでも、ほとんどの場合において検索を最適化するのに役立つルールがいくつかあります。
単語一つだけの検索クエリは避ける方が良いでしょう。覚えておくべき重要なルールは、検索で何をしようとしているか、つまり文脈を含めることです。ただし、単語が多すぎると、結果が返ってこなかったり、関連性のない結果が返ってくる可能性があるため、検索したい内容をいくつかの重要な名詞で表現してみてください。あまりにも一般な単語は省略するのが良いでしょう。
検索は反復的なプロセスです。結果をもとに問いを再構成する必要があります。
『British Journal of Educational Technology』に掲載されている、学習者が反復的に検索を使用した事例を紹介します。
ノムサは対象領域の専門用語を用いたコマンドを改善し、次のような3つのクエリを作成しました。
- 持続可能な (sustainable) 建築材料 (building material) (検索結果リストに興味深い情報はなし)
- 持続可能な (sustainable) 暮らし (livelihoods) (検索結果2件を精査)
- 持続可能な (sustainable) 暮らし (livelihoods) 建築材料 (building material) (目的の情報源を発見)
このような一連のクエリを作成し使用することは、経験豊富なウェブ検索者の間で一般的な戦略であり1、検索語句をわずかに変えながら繰り返しクエリを実行するということがよく行われます。
検索エンジンにおいてどのように人工知能が使われているかを理解するには、「検索エンジンにおける人工知能」、「検索エンジンで使用される人工知能」などの表現が効果的でしょう。
- 引用符は、その中の用語と完全一致する結果を探すよう検索エンジンに強制します。「baked cheese recipes」の結果にはチーズケーキのレシピが含まれる可能性がありますが、「“baked cheese” recipes」ではその混乱を回避できます。「“East German” stories」では「East」と「German」両方の単語を含む結果を示し、これは「“East German” stories」と「East German stories」の検索結果のページ数を比較することで違いがよく分かるはずです。
- 検索エンジンは引用符( ‘ と ” )を除いて句読点を無視します(上記で議論されたように、所有権を示すためです)。
- nearは指定された場所の近くにあるものを示します。near meはデバイスの現在地に当てはまる結果を示します。「restaurants near eiffel tower」は、エッフェル塔を訪れた際に食事をする場所を探す方法のひとつです。
- マイナス記号に単語を続けて記述すると、その単語を含むページを検索結果から除外します。””内で複数の単語を組み合わせることもできます。「artificial intelligence -“machine learning”」は機械学習を含まない人工知能について言及する結果が表示されます。
- x AND yはxとyの両方を含む結果を探します。x OR yはxまたはy、もしくはxとyの両方を含む結果を示します。ANDとORは大文字であることに注意してください。「2つの特定の同義語または密接に関連する単語を含む結果を検索したい場合、ORを使用するとよいです。例えば、「direct marketing consultant OR expert」という検索では、2つのフレーズ「direct marketing consultant」と「direct marketing expert」の結果が組み合わされます2。
- * は未知の単語の代わりになります。「university of * California」 の結果にはuniversity of southern Californiaが含まれますが、「university of California」では少なくとも最初の数ページにuniversity of southern Californiaが現れることはありません。
- site:bbc.comは、検索結果をbbc.comのウェブサイト内に限定します。「courses site:*.edu」は.edu(教育機関)で終わるすべてのサイトの結果を返します。学術論文を探す際には、springer.com、scholar.google.comなどの特定のサイトで探するのが効果的です。「学術研究論文を探す際には、グローバルなオープンウェブ全体を検索するよりも、学術情報コレクションを使用する方がはるかに効率的です。検索するリソースの選択は、適切な結果を得るために必要な検索範囲の設定ということになります。情報空間は平坦ではなく、明確な構造を持っています。その構造についてより多くを知れば知るほど、より効果的な検索が行えるようになるでしょう3。」
- filetype:pdfやfiletype:jpgなどは、pdfドキュメントやjpgイメージのリンクを結果として返します。
1 Walton, M., Archer, A., The Web and information literacy: scaffolding the use ofweb sources in a project-based curriculum, British Journal of Educational Technology, Vol 35 No 2, 2004.
2 Spencer, S., Google Power Search: The Essential Guide to Finding Anything Online With Google, Koshkonong, Kindle Edition。
3 Russell, D., What Do You Need to Know to Use a Search Engine? Why We Still Need to Teach Research Skills, AI Magazine, 36(4), 2015。