1. <output id="36c7b"></output>
        <code id="36c7b"><strong id="36c7b"><source id="36c7b"></source></strong></code>
      2. <var id="36c7b"></var>

        1. <code id="36c7b"><strong id="36c7b"></strong></code>

                  您好,歡迎您登陸華人企業網絡營銷!

                  業務電話:010-85755626 13401063884

                  當前位置:首頁 > 新聞中心 > 百度搜索引擎_檢索系統概述

                  百度搜索引擎_檢索系統概述

                  時間:2018-09-11 11:01:34 來源:華人企業網 作者:admin 點擊: 154次

                  百度搜索引擎_檢索系統概述

                  前面扼要介紹過了搜索引擎的索引體系,實際上在樹立倒排索引的后還需要有一個入庫寫庫的進程,而為了提高功率這個進程還需要將悉數term以及偏移量保存在文件頭部,而且對數據進行緊縮,這涉及到的過于技能化在此就不多提了。今日扼要給咱們介紹一下索引以后的檢索體系。

                  檢索體系首要包含了五個部分,如下圖所示:

                  (1)Query串切詞分詞行將用戶的查詢詞進行分詞,對以后的查詢做準備,以“10號線地鐵毛病”為例,也許的分詞如下(近義詞疑問暫時略過):

                  10 0x123abc

                  號 0x13445d

                  線 0x234d

                  地鐵 0x145cf

                  毛病 0x354df

                  (2)查出含每個term的文檔調集,即找出待選調集,如下:

                  0x123abc 1 2 3 4 7 9…..

                  0x13445d 2 5 8 9 10 11……

                  ……

                  ……

                  (3)求交,上述求交,文檔2和文檔9也許是咱們需要找的,全部求交進程實際上關系著全部體系的功能,這兒面包含了運用緩存等等手法進行功能優化;

                  (4)各種過濾,舉例也許包含過濾掉死鏈、重復數據、色情、廢物成果以及你懂的;

                  (5)終究排序,將能滿足用戶需要的成果排序在前,也許包含的有用信息如:網站的全體評估、頁面質量、內容質量、資源質量、匹配程度、分散度、時效性等等,以后會具體給咱們介紹。

                   

                   

                   

                  華企商城更多商品介紹:提升品牌質量度    B2B網站系統  html5網站源碼

                   

                  文章轉載請注明出處:http://www.netshop168.com/article-2728.html

                    轉載請注明本文地址:http://www.qboc.tw/xwzx/2018091117492.html

                  上一篇:上一篇:360搜索廣告推廣開戶費用多少錢?好搜廣告開戶多少錢?

                  下一篇:下一篇:容易被站長忽視的優化內容_主動訪問用戶數據

                  黑龙江十一选五网址