文脈解析技術を利用した、FUTURAの「サイト内検索機能」 – 結果から除外される記事とは?
前回は、関連記事表示とタグ提案に加え、FUTURAのもう1つの大きな機能である「サイト内検索機能」を紹介しました。
WordPressの標準検索では検索結果が約600件であったのに対し、FUTURAの検索では100件になりました。
では、どのような記事がFUTURAの検索結果からは除外されたのでしょうか。
結果から除外される記事
「Apple」で検索すると、WordPressの標準検索では「あれから7年。東日本大震災はまだ終わらない。」という記事が結果の1つに表示されています。
これは、その記事内に「Apple」という単語が何度か出てきているからです。
しかし、こちらはそのタイトルからもわかるように東日本大震災について書かれた記事です。そのため、FUTURAでは「Apple」との関連性は低いと判断し、検索結果には表示されません。
このように、FUTURAでは文脈解析を利用することにより高精度な検索結果を提供することが可能になっています。
この「文脈解析に基づいた検索機能」は、「記事中に“Apple”という単語が含まれてはいるが、内容としての関連性は低い」という除外の判断とは逆の結果をもたらすこともあります。
次回はその「除外の判断とは逆の結果」について、具体的な例を紹介しますね。