セマンティック検索–変化の風
公開: 2019-11-15目次
セマンティック検索とは何ですか?
言葉の魔法と意味検索
セマンティック検索はどのようになりましたか?
カオスの秩序-セマンティック検索ツールで片付け
鬼ごっこ-セマンティック検索ツールVol。 2
セマンティック検索の分野におけるビジョナリー
セマンティック検索のターニングポイント
ナレッジグラフ
セマンティックWebの世界における人工知能
セマンティックSEO用にコンテンツを最適化する方法
セマンティック検索とは何ですか?
生の専門用語の下には、人類そのものとして古い、無実の欲望があります。
私たちは常に過去の姿を見て、私たちを取り巻くもののより深い意味に到達しようと努めてきました。
時折、これは私たちに深い認識をもたらしました。 他の時には、私たちは見事に失敗することに成功しました。
今、私たちは意味の探求を過給し、深める技術を持っています。
セマンティック検索を入力します。
言葉の魔法と意味検索
セマンティクスは言語学の魅力的な側面であり、意味を探すというタスクに起因します。
言葉の意味とそれらの相互関係。 セマンティクスは、物事を説明するために特定の単語やフレーズを選択する理由を説明する必要があります。
どのようなセマンティック検索の不可欠な一部として意味を定義することは、私たちが求めるとの接続を作成する必要が憧れです。
干し草の山で針を探すことを想像してみてください–紛れもなく神経を壊す経験です。
速くて直感的な結果を可能にするツールがなくても、インターネット上でほぼ同じレベルの成功を収めているものを探しているでしょう。
幸いなことに、私たちの生活を構造化して接続するという意欲は、Web上で物事を検索する方法にも反映されます。 このようにして、セマンティック検索が実現しました。
セマンティック検索とは何かについてのより詳細な説明は、HannahBastと共著者による出版物から得られます。
彼らが説明しているように、セマンティック検索は「意味のある検索」です。 そして、検索プロセスの少なくともいくつかの部分で意味を見つけることができます。
まず、クエリ自体で。 ここでは、リクエストの背後にある真の意図を理解する必要があります。
次に、取得する必要のあるデータを検討し、それが探しているものに本当に適合するかどうかを検討する必要があります。
または、情報を適切に提示して、検索に意味がある場合。
セマンティック検索の意味を分析する
レイマンの用語で言えば、セマンティック検索は、人間と同じように自然言語を理解し、適切なセマンティックWeb検索結果を提供することを目的としています。
どういう意味ですか?
そうですね、 Googleの検索フィールドに「これは最小の哺乳類です」と入力したとしましょう。
検索エンジンは、当然のことながら、入力したフレーズと完全に一致するものを探すのではなく、最小の哺乳類がどれであるかを知りたいという仮定に基づいて私の質問に答えます。
これが私が最初の結果として「世界の6つの最小の哺乳類」という名前の記事を取得し、続いてエトルリアのトガリネズミの写真を取得する方法です。これは、ちなみに、地球上で最小の既知の哺乳類です。
私のクエリの意味を理解しようとすると、セマンティック検索エンジンがスペルミスのある単語の修正を提案するのにも役立ちます。
したがって、哺乳類という単語のつづりを間違えた場合、Googleは、「哺乳類」ではなく、おそらく「哺乳類」を探していると提案します。
セマンティック検索はどのようになりましたか?
私たちの種は秩序を探すように描かれています-そしてそれが不足しているなら、私たちはそれを作成しようとするしかないのです。
したがって、注文と最適化された時間のニーズに応える仮想世界を構築していることは理解できます。
適切な答えを提供することに加えて、検索エンジンは人工知能の助けを借りてそれらに意味を追加します。
彼らはセマンティック検索機械学習を使用して情報の処理とランク付けを支援し、自然な人間の発話を理解することもできます。
これらすべてが、最終的に、クエリに適切な結果を提供します。
しかし、彼らは「世界最大のドーナツ」などの質問にどの程度正確に答えることができますか?
セマンティック検索はセマンティックWebから生まれたので、私自身の順序を求める性質に忠実であるために、セマンティックWebが最初に何であるかを見てみましょう。
セマンティックWebオリジン
つまり、セマンティックWebは、ワールドワイドウェブの拡張機能です。
また、World Wide Web Consortium(W3C)によると、データを共有および再利用するための共通のフレームワークを提供します。
これは、アプリケーション、企業、およびコミュニティ全体で有効です。
情報科学の分野で知られているフレームワーク、または「オントロジー」は、最終的に知識のシステムになる事実と情報を収集します。
簡単に言うと、セマンティックWeb構造とタグ付けは、コンピューターが読み取れる方法でデータを処理します。
セマンティックWebを使用すると、ネットワークまたは関連する要因に基づいて特定の入力を分析できます。 セット、プロパティ、およびリレーションを使用して、Webを構成する膨大な量のデータを理解します。
私はそれを家系図を作ろうとしている私と比較します。
私の祖母が私の母の側の私の遠い従兄弟であると主張する人々が誰であるかを私は間違いなく理解するのに失敗するでしょう。 私はそれらを知らないので、私は文脈を欠いています。
ただし、セマンティックWebは、物事を整理するためのより良い仕事をします。
セマンティックWebのビジョン
セマンティックWebの究極の目標は、創設者のティムバーナーズリーが見たように、コンピューターが私たちに代わって情報をより適切に操作できるようにすることです。
セマンティックWebとは何かという概念は、今日それを形成する2つの重要なタイプのデータであるLinked OpenDataとSemanticMetadataに進化しました。
カオスの秩序-セマンティック検索ツールで片付け
Linked Open Data(LOD)はグラフとしてモデル化され、サーバー間で相互リンクできるように公開されます。
これは基本的に構造化データを表します。 2006年、Tim Berners-Leeは、リンクトデータの4つのルールを次のように公式化しました。
- モノの名前としてURI(Universal Resource Identifier)を使用します。
- HTTP URIを使用して、人々がそれらの名前を検索できるようにします。
- 誰かがURIを検索するときは、標準のフォーマット(RDF、SPARQL)を使用して有用な情報を提供してください。
- 他のURIへのリンクを含めます。 彼らはより多くのことを発見することができます。
LODを使用すると、人とマシンの両方が異なるサーバー間でデータにアクセスし、そのセマンティクスをより簡単に解釈できます。
その結果、セマンティックWebは、リンクされたドキュメントで構成されるスペースから、リンクされた情報で構成されるスペースに移行します。
これにより、相互接続された意味のあるネットワークが可能になり、マシンで処理できるようになります。
さまざまなセクターにわたってLODとして公開されている、何千ものデータセットがあります。
例としては、百科事典、地理データ、政府データ、科学データベースと記事、娯楽、旅行などがあります。
それらは相互にリンクされているため、これらのデータセットは巨大なデータのウェブまたは知識グラフを形成します。
グラフは、エンティティの膨大な量の説明と一般的に重要な概念を結び付けます。
鬼ごっこ–セマンティック検索ツールVol。 2
セマンティックWebが信頼する2番目に重要なツールは、セマンティックメタデータです。
これは基本的にセマンティックタグであり、その意味をよりよく説明するために通常のWebページに追加されます。
たとえば、ノーベル賞のホームページには、スウェーデン、学術の進歩、文化、賞など、いくつかの関連する概念やエンティティへの参照を意味的に注釈を付けることができます。
サブジェクトと対応する結果の間のこれらの明確な関係は、 Schema.orgなどの構造化されたメタデータスキームによって最もよく表されます。
メタデータを使用すると、セマンティック基準に基づいてWebページを簡単に見つけることができます。
過去の結果から学習し、エンティティ間のリンクを作成することにより、検索エンジンは、正解が含まれる場合と含まれない場合がある複数のリンクを提供するのではなく、検索者のクエリに対する回答を推測できる場合があります。
メタデータは、潜在的なあいまいさを解決し、Prince(ミュージシャン)を検索するときに、たとえば、王族である多くの王子についてのページを取得しないようにします。
セマンティックWebに感謝することができます。
今。
セマンティックWebの構造により、セマンティック検索とは何かがわかります。 それは、検索エンジンが世界最大のドーナツがどれであるかをどのように決定するかさえ教えてくれます。
しかし
その歴史を見てみましょう。
セマンティック検索の分野におけるビジョナリー
他の大規模な運動と同様に、変化の背後にはリーダーがいます。 セマンティック検索の背後にいるのは多くの人が主張するティムバーナーズリーの名前についてはすでに述べました。
1998年、現代のWebの初期段階で、Berners-Leeは、彼が発行した「セマンティックWebロードマップ」というタイトルのレポートで、このアイデアについてすでに話していました。
21年後、彼のアイデアが採用され、セマンティック検索が現実のものになりました。
グーグルは変化をもたらし、セマンティック検索の台頭に道を譲った会社でした。
「機械は、人間と同じように互いに通信できる必要があります」とバーナーズ=リーは述べています。
Googleは現在、彼のビジョンの実現に向けて取り組んでいます。
どのように?
セマンティック検索のターニングポイント
1998年以来多くのことが起こっていますが、2012年はセマンティック検索のターニングポイントでした。
すべてのGoogle検索の20%が新規であったのは、今年のことでした。 それだけでなく、ロングテールキーワードが全検索の約70%を占めました。
これは、ユーザーが質問に答えたり問題を解決したりするためのツールとして検索エンジンを使用することに興味を持っていることをGoogleに伝えました。
もはや事実を調べて個々のウェブサイトを見つけるだけではありませんでした。
したがって、セマンティック更新に向けた最初のステップが実行されました。
ナレッジグラフ
2012年に導入されたナレッジグラフは、キーワードの文字列を無意識に比較するのではなく、エンティティとコンテキストを理解するようにGoogleが移行したことを示しています。
またはグーグルがそれを言ったように、「文字列ではなく物」。
ナレッジグラフとは何ですか?
ウィキペディアは、グーグルとそのサービスがナレッジグラフを使用して、さまざまなソースからの情報で検索エンジンの結果を強化すると述べています。
言い換えれば、知識グラフは、主題の専門家、データの相互リンク、および機械学習アルゴリズムの助けを借りて、知識ドメインをモデル化するプログラム的な方法です。
この特定のグラフをセマンティック検索ツールにしたのは、情報を収集する方法でした。
パブリックドメインと見なされるデータ(たとえば、地球のサイズからバンドのメンバーの名前まで)を、各エンティティのプロパティ(誕生日、兄弟、両親、職業など、それにリンクできるすべてのもの)とともに収集しました。実在物。)
または
構造化情報(リスト)と非構造化情報の両方を組み合わせて、膨大な量のデータをリンクするために既存のデータベースの上に構築されたと言えます。
ナレッジグラフは、検索エンジンが賢明な答えを出すために必要な情報を収集します。
グーグルのグラフは、大規模なアルゴリズムの変更が来るための段階を設定します。 そしてすぐにハチドリが続きました。
Hummingbirdで成功に向けて加速
ハチドリはターニングポイントでした。 このアルゴリズムは、世界中の検索の約90%に影響を与えました。
これは正確かつ高速に設計されており、多くの人が「会話型検索」を検索アクティビティに導入したツールと呼んでいます。
それはセマンティック検索技術のスターでした。
ただし、 Hummingbirdは、会話型のクエリに対する回答を提供するだけではありません。
アルゴリズムは、クエリ内の各単語に注意を払います。
次に、特定の単語ではなく、クエリ全体、文全体、または意味が考慮されていることを確認します。
意図は、実際の単語だけでなく、より深い意味に一致するページを取得することです。
もっとあります。
Hummingbirdアップデートの速度と精度の向上に加えて、Googleはセマンティック検索が統合されていることを確認しました。
彼らは、検索クエリ、さらにはロングテール検索の理解を大幅に向上させ、ユーザーの意図を大幅に向上させました。
結果として:
クエリ全体と検索クエリ内の単語グループの関係が特定され、対象が絞られ、解釈されました。
ハチドリアルゴリズムの効果
Hummingbirdの改善は、特にコンテキスト検索と会話検索に重点が置かれていました。
どちらの領域も、基本的なセマンティクスと単語間の関係に強く関連しています。
今。
アルゴリズムは、ヘッドレベルとロングテールレベルの両方でクエリのニッチな結果を取得するために自然言語を処理します。
言い換えれば、 Googleがクエリの背後にある意図に一致する結果をますます返すコンテキスト検索を使用します。
結果は単語自体に限定されなくなりましたが、検索用語の意図の解釈が含まれています。
どのくらい正確に?
ツールが行うことは、明示的にモデル化されていない関係をチェックすることです。
このプロセスでは、文法、統計、辞書を組み合わせて、リレーショナルタグ付けを実現します。
意味論的な方法で意図を評価し、同義語とテーマ関連のトピックに焦点を当てることにより、Hummingbirdは、ユーザーが検索を「abracadabra」しようとする代わりに、自信を持ってトピックとサブトピックを検索できるようにします。
アルゴリズムは多くの点でセマンティック検索の定義です。
Hummingbirdが実際にどのように機能するかを示す例は、「PresidentofEngland」などの検索です。
今。
イギリスには大統領はいないが、政府の長である首相がいる。 イギリスには、女王である国家元首もいます。
そしてグーグルはそれを知っているので、首相や女王に関連する結果を表示します。
ある意味で、Hummingbirdを使用すると、質問の仕方がわからない質問に対する回答を得ることができ、ユーザーが探しているものを見つけるのに役立つ結果をキュレートすることができます。
場所指向
Hummingbirdがもたらすもう1つの改善点は、ローカル指向の結果です。
コンテキストの使用のおかげで、ローカルの結果はより正確になります。
だから、あなたが良いイタリアンレストランを探しているとき、グーグルはあなたがあなたの街で夕食を食べたいと思っていると仮定します。
そのため、イタリアのレストランを一覧表示する代わりに、位置データを使用してお住まいの地域のおいしいピザをお勧めします。
私たちはしばしば、正しい結果を得る精度を当然のことと思っています。
それは舞台裏での長年の研究開発の実り多い収穫です。
セマンティック検索の夢は、会話言語処理と位置データに基づく人間の意図の理解を組み合わせることで形になりました。
Hummingbirdはセマンティック検索の重要なブレークスルーでしたが、Googleはそれだけではありませんでした。
彼らが後で導入したもう1つの非常に重要な改善は、RankBrainでした。
セマンティックWebの世界における人工知能
RankBrainは、 Googleがキーワードクエリに回答する際に遭遇した問題への回答として提供されたセマンティック検索機械学習ツールです。
数年前、Googleが取得した検索の約15%は、これまでに見たことのない単語で構成されていました。
ユーザーが何を探しているのかを正確に知る方法はありませんでした。
一見すると、15%は大したことではないように思われるかもしれません。
それでも、 Googleは毎日数十億のリクエストを処理しているため、その割合は絶対的にはかなり重要な数値でした。
約4億5000万件の検索に、これまで処理されたことのないキーワードが含まれていました。
では、質問に答える方法がわからないときはどうしますか?
推測?
それは、Googleがそれらの未知のキーワードのいずれかの要求を受け取ったときに行っていたものです。
残念ながら、それは正確な結果につながりませんでした。 検索エンジンは、ユーザーが入力したすべてのキーワードを含むページを、その背後にある意図を理解せずに検索しました。
検索エンジンがこれまでに受信したことのないリクエストのセマンティック検索を実装および生成する方法を知りませんでした。
そのため、Googleは解決策を見つけ、外出先で学習できるツールを導入するようになりました。
ランクブレインを入力してください
機械学習ベースの検索エンジンのアルゴリズムは、Googleのプロセスの検索結果を助け、ユーザーのためのより関連性の高い検索結果を提供します。
Googleは、AIアルゴリズムを使用して、これらの検索クエリを解決するだけでなく、それらを処理して理解します。
RankBrainで何が変わりましたか?
RankBrainの前は、Googleのアルゴリズムの100%が手作業でコーディングされていました。
そのため、このプロセスは、検索結果を改善するものを推測しようとした人間のエンジニアに大きく依存していました。
今日でもヒューマンエンジニアはアルゴリズムに取り組んでいますが、RankBrainもバックグラウンドでその作業を行っています。
プロセス
つまり、RankBrainは独自のアルゴリズムを微調整して、より良い応答を生成できます。
キーワードに応じて、RankBrainは、バックリンク、コンテンツの鮮度、コンテンツの長さ、ドメイン権限、およびその他のランキング変数の重要性を増減します。
次に、ユーザーが新しい検索結果をどのように操作するかを観察します。 彼らが新しいアルゴリズムをより好むなら、それはとどまります。
そうでない場合、RankBrainは古いアルゴリズムをロールバックします。
そのスマートなセマンティックアップデートの助けを借りて、 Googleは、以前にクエリを相互リンクしていなくても、あなたが何を意味するのかを理解することができます。
どのように?
これまでに見たことのないキーワードを、これまでに見たことのあるキーワードと照合する。
どのようにセマンティックウェブの作品の例については、Google RankBrainは注目の人は「世界最大のドーナツ」を検索しています。
そして、それを検索する人々は、これまでに作られた最大のドーナツを見つけることをかなり探していることを学びました。
したがって、誰かが「世界最大のドーナツ」を検索すると、RankBrainは同様の結果を表示します。
ドーナツの場合、両方の検索で取得する最初の3つのWebページは同じです。
ランクブレインの方法
Googleは、キーワードを概念に変える「 Word2vec 」と呼ばれるテクノロジーを通じて、検索者の意図をよりよく理解するために機械学習をどのように使用しているかについてコメントしています。
たとえば、このセマンティックWebテクノロジーは、「パリとフランスは、ベルリンとドイツと同じように(首都と国)、マドリッドとイタリアとは異なる関係にあることを理解しています」と言います。
また、これがRankBrainの動作方法であると具体的に言及していなくても、同様のテクノロジーを使用しているとほぼ推測できます。
キーワードマッチングの概念に戻る– RankBrainは、検索の意図に基づいて結果を提供しようとします。
ユーザー満足度とRankBrain
確かに、 RankBrainは新しいキーワードを理解することに賭けることができます。 また、アルゴリズムを独自に調整することもできます。
一番の質問は次のとおりです。
RankBrainが一連の結果を表示したら、それらが良好かどうかをどのように判断しますか?
まあ–それは観察します。
RankBrainはUXシグナルを使用します–少なくともそれは専門用語です。
簡単に言えば、これは、RankBrainがあなたが好きだと思う検索結果のセットを表示することを意味します。
多くの人が1つの特定のエントリを気に入った場合、そのページのランキングが上がります。
そうでない場合はどうなりますか?
次に、アルゴリズムはそのページを削除し、別のページに置き換えます。
RankBrainは正確に何を観察しますか?
検索結果とのやり取りに細心の注意を払っています。
監視している信号はいくつかあります。
- 有機クリックスルー率(CTR)
- 滞留時間
- バウンス率
- ポゴスティック
これらは、ユーザーエクスペリエンスシグナル(UXシグナル)として知られています。
例を見て、GoogleのセマンティックWebが私の検索をどのように解釈するかを見てみましょう。
「子供に最適なドローン」を検索すると、最初に得られる結果は6月中旬に公開された記事です。
これは、RankBrainがクエリへの回答を提案するときに評価するコンテンツの鮮度を呼び戻します。
しかし、とりあえずそれを残しましょう。
アルゴリズムは私が開いたウェブサイトに注意を払います。 これまでに開かれた回数を比較して同様の結果を得ることができるため、CTRが得られます。
ページを開くと、RankBrainが私の滞留時間を監視します。 これは私がウェブサイトで過ごす時間です。 そうすれば、アルゴリズムは、私がその情報が有用であると思ったかどうかを推定します。
クエリとは関係のないコンテンツを表示したり、表示が不十分な場合は、すぐに結果ページに戻ります。
十分な数の人がそれを行うと、ウェブサイトのランキングは下がります。
また、ページが時間どおりに読み込まれない場合、バウンスの可能性が高くなり、それに伴ってページのランキングが急落します。
さて、ページを最初にクリックしても、探しているものが見つからないとしましょう。 私はおそらくそれを見つけるまで私が得た結果を精査し続けるでしょう。
そしてそれは、RankBrainがその仕事の成功を分析するために使用するもう1つの要素であるpogo-stickingです。
行ったり来たりすればするほど、RankBrainが同様の検索で次のユーザーにそれらの不幸なページを提案する可能性は低くなります。
今。
Googleのような検索エンジンがユーザーの要求を理解して適切な回答を提案するために使用する基本的なセマンティックツールについて説明しました。
それで、私たちはそれらを私たちの利益のためにどのように使うことができるかを見ることができます。
セマンティックSEO用にコンテンツを最適化する方法
SEOの場合、セマンティック検索を理解することには大きなメリットがあります。 大部分は、レースで先行し続ける能力です。
周りの専門家によって提案された優れたセマンティックSEO戦略にはいくつかのステップがあります。
そして、時間の経過とともにセマンティック検索の影響力が増すにつれて、これらの手順は、誰もがコンテンツを最適化し、Webサイトをより適切にランク付けするのに役立つ良いアドバイスです。
- キーワードだけでなく、トピックを検討する
- コンテンツを検索意図に一致させる
- コンテンツに関連キーワードを含める
- 注目のスニペット用にコンテンツを最適化する
- コンテンツに構造化データを含める
- キーワードだけでなくトピックを検討する
記事の前半で見たように、それはすべてトピック、つまり検索のコンテキストに関するものです。 そしてグーグルと他の検索エンジンは私たちに最も関連性のある結果を提供しようとしています。
したがって、コンテンツはこれまで以上に包括的で有益なものでなければなりません。
幅広い検索クエリのすべてのバリエーションに対して、コンテンツの短くてフラットなページを作成することを考えている場合は、気にしないでください。 代わりに、トピック全体をカバーする包括的で永続的なガイドを作成する必要があります。
次に、キーワード最適化のベストプラクティスを使用して、コンテンツが検索エンジンとリーダーの両方に対して完全に最適化されていることを確認する必要があります。
コンテンツを検索意図に一致させる
ターゲットとするSEOキーワードのコンテンツを作成する前に、ユーザーがそのフレーズを検索する理由を尋ねる必要があります。 キーワードが表す意図を確立すると、視聴者を引き付けるのもはるかに簡単になります。
キーワードの目的は次のとおりです。
- 情報–ユーザーは何かを学ぼうとしているため、「know」キーワードを使用して情報を探し、回答を得ます。
- ナビゲーション–ユーザーは特定のサイトに移動したり、特定のアイテムを見つけたりしようとしているため、「go」キーワードを使用して、使い慣れたブランドのWebサイトを検索します。
- トランザクション–ユーザーは購入しようとしているため、「do」キーワードを使用して購入する製品またはトランザクションを行うページを検索します。
コンテンツに関連キーワードを含める
セマンティック検索のセマンティックバーを確認するには、関連または潜在セマンティックインデックスキーワード(LSI)をコンテンツに追加する必要があります。
LSIキーワードは、ターゲットキーワードに密接に関連するフレーズです。 それらはコンテンツにコンテキストを与え、検索エンジンがコンテンツの意味とそれが視聴者にどのように役立つかをよりよく理解するのを助けます。
したがって、チョコレートについて話すときは、少なくともそれをココアに関連付ける必要があります。
注目のスニペットのコンテンツを最適化する
検索エンジンは、ユーザーが必要な情報を結果ページに直接提供する豊富な結果を表示することを好みます。
検索の可視性を高めるには、次のことを行うことができます。
- 回答ボックスと段落、リスト、および表の特徴的なスニペットのコンテンツを最適化する
- ロングテールキーワードに焦点を当てたコンテンツの質問に明確に答える
- 書式設定を使用して、情報を注目スニペットの魅力的なオプションにします
最後に、構造化データをコンテンツに含める
検索エンジンがコンテンツの意味と関連性を理解するのに役立つもう1つの方法は、構造化データを使用することです。
構造化データ、つまりスキーママークアップは、Webページにコピーするコンテキストを追加するマイクロデータの形式です。
検索エンジンのコンテンツを分類する一連の標準データ構造を使用します。
この追加情報は、検索エンジンがコンテンツをランク付けし、豊富な検索結果に表示できる情報を特定するのに役立ちます。
実際には、これまでに述べたことはすべて1つに要約されます。
オンラインでの存在感を最大限に活用するには、公開する情報を意味的に整理する必要があります。
コンテキストは、セマンティックWeb検索の未来です。 収集するパズルのピースはまだありますが、セマンティックWebはすでに生きています。
おそらく私は、次世代のインテリジェントネットワークが私たちの予定をスケジュールし、買い物をし、必要な情報を見つけ、志を同じくする人々と私たちをつなぐことによって私たちを支援する日からそう遠くはありません。
その上、自律的にそれを行います。
確かに、セマンティック検索とは何かを尋ねる必要はありません。 それは私たちの日常生活の不可分の一部になるでしょう。