1. <output id="36c7b"></output>
        <code id="36c7b"><strong id="36c7b"><source id="36c7b"></source></strong></code>
      2. <var id="36c7b"></var>

        1. <code id="36c7b"><strong id="36c7b"></strong></code>

                  您好,歡迎您登陸華人企業網絡營銷!

                  業務電話:010-85755626 13401063884

                  當前位置:首頁 > 新聞中心 > 百度搜索引擎_索引系統概述

                  百度搜索引擎_索引系統概述

                  時間:2018-09-10 09:33:03 來源:華人企業網 作者:admin 點擊: 173次

                  百度搜索引擎_索引系統概述

                  眾所周知,搜索引擎的首要工作進程包含:抓取、存儲、頁面剖析、索引、檢索等幾個首要進程。曩昔幾周給咱們介紹了抓取有關的扼要進程。今日扼要介紹一下索引體系,以億為單位的頁面庫中查找特定的某些關鍵字猶如大海里邊撈針,或許必定的時間內可以完結查找,可是用戶等不起,從用戶體會視點咱們必須在毫秒等級給予用戶滿足的成果,否則用戶只能丟失。怎樣才能到達這種請求呢?

                  如果能知道用戶查找的關鍵字(query切詞后)都出現在哪些頁面中,那么用戶檢索的處理進程即可以幻想為包含了query中切詞后不一樣有些的頁面調集求交的進程,而檢索即變成了頁面稱號之間的對比、求交。這么,在毫秒內以億為單位的檢索成為了也許。這便是通常所說的倒排索引及求交檢索的進程。如下為樹立倒排索引的基本進程:

                  (1)頁面剖析的進程實際上是將初始頁面的不一樣有些進行辨認并標記,例如:title、keywords、content、link、anchor、談論、別的非主要區域等等;

                  (2)分詞的進程實際上包含了切詞分詞同義詞變換同義詞更換等等,以對某頁面title分詞為例,得到的將是這么的數據:term文本、termid、詞類、詞性等等;

                  (3)之前的準備工作完結后,接下來便是樹立倒排索引,構成{termàdoc},可以大略的理解為如下,為什么是【term->doc】,而不是直接應用【doc->term】呢?

                  上述便是索引體系中的倒排索引進程,是搜索引擎完成毫秒級檢索非常主要的一個環節。

                   

                   

                   

                   

                  華企商城更多商品介紹:快手刷評論    易推微信營銷工具  微信朋友圈廣告方案

                   

                  文章轉載請注明出處:http://www.netshop168.com/article-2727.html

                    轉載請注明本文地址:http://www.qboc.tw/xwzx/2018091017479.html

                  上一篇:上一篇:【網絡推廣公司】企業的互聯網營銷如何從多維度把握營銷方向

                  下一篇:下一篇:【網絡推廣方案】談傳統企業如何借力網絡營銷呢?

                  黑龙江十一选五网址