• <button id="2oo4m"></button>
    <tr id="2oo4m"></tr>
  • <rt id="2oo4m"><nav id="2oo4m"></nav></rt>
  • <tr id="2oo4m"><nav id="2oo4m"></nav></tr>

    搜索引擎面對海量的網頁,他們并不是平行的抓取每一個網頁,搜索引擎如何優先抓取最重要的網頁


    點擊次數: 次 發布時間:2013-1-18

      但是,特征 4 和5具有局限性,因為鏈接的深度并不能完全表明這個網頁的重要程度。那么怎么解決這個問題?搜索引擎采用如下的辦法:

      1) URL 權值的設定:根據 URL 的目錄深度來定,深度是多少,權值就減少多少,權值最小為零。

      2) 設定 URL 初始權值為 一個固定的數值 。

      3) URL 中出現字符”/”,”?” ,或”&” 1 次, 則權值減 一個數值 ,出

      現”search”,”proxy”,或”gate” 1 次,則權值減一個數值;最多減到零。(包含”?”,

      或”&” 的URL 是帶參數的形式,需要經過被請求方程序服務獲得網頁,不是搜索引擎系統側重的靜態網頁,因此權值相應降低。包含”search”,”proxy”,或”gate” ,說明該網頁極大可能是搜索引擎中檢索的結果頁面,代理頁面,因此要降低權值)。

      4) 選擇未訪問 URL 的策略。因為權值小不一定說明不重要,所以有必要

      給一定的機會搜集權值小的未訪問 URL 。選擇未訪問 URL 的策略可以采用輪流的方法進行,一次按照權值排序取,一次隨機取;或者 N次隨機選取。

      當搜索引擎抓取了大量的網頁的時候,然后進入到一個階段,對網頁進行前面3個特征的判讀,再通過大量的算法判斷網頁的質量,然后給予相對的排名。
    作者天宇科技 - 搜索引擎面對海量的網頁,他們并不是平行的抓取每一個網頁,搜索引擎如何優先抓取最重要的網頁

    本文地址:http://www.fangjiekuaiji.cn/News_Show_50_1.html   手機地址http://www.fangjiekuaiji.cn/Mobile/News_Show_50_1.html

    版權所有 © 轉載時必須以鏈接形式注明作者和原始出處!
    相關文章
    關于我們
    關于我們
    企業文化
    最新資訊
    核心服務
    品牌形象
    邢臺網站建設
    邢臺網站優化
    成功案例
    品牌設計
    公司成功案例
    邢臺網站優化
    解決方案
    邢臺網絡公司
    邢臺網站維護
    邢臺網絡營銷
    招賢納士
    加入我們
    學習發展
    常見問題
    聯系我們
    聯系我們
    我要留言
    如何合作
    首頁
    手機網站
    FLASH版
    舊版邢臺網絡公司
    本站關鍵詞邢臺網站建設,邢臺網站制作,邢臺網站設計,交換鏈接QQ:83004814 鏈接要求:pr>=3,百度快照三天內。
    强奷乱码中文字幕