搜索引擎算法:獲得網站網頁資料,建立數據庫并提供查詢的系統,我們都可以把它叫做搜索引擎。搜索引擎的數據庫是依靠一個叫“網絡機器人(crawlers)”或叫“網絡蜘蛛(Spider)”的軟件,通過網絡上的各種鏈接自動獲取大量網頁信息內容,并按一定的規則分析整理形成的。Google、百度都是比較典型的搜索引擎系統。 為了更好的服務網絡搜索,搜索引擎的分析整理規則---即搜索引擎算法是變化的。搜索引擎算法的變革將引領第四代搜索引擎的升級。
公式
GoogleScore = (KW Usage Score * 0.3) + (Domain Strength * 0.25) +(Inbound Link Score * 0.25) + (User Data * 0.1) + (Content QualityScore * 0.1) + (Manual Boosts) – (Automated & Manual Penalties)
翻譯
Google分數=(相關關鍵詞分數X0.3)+(域名權重X0.25)+(外鏈分數X0.25)+(用戶數據X0.1)+(內容質量分數X0.1)+(人工加分)-(自動或人工降分)
因子分析
從公式中我們可以清楚的知道,影響pagerank分數的因素依次是“相關關鍵詞”、“域名”、“外鏈”、“用戶數據”、“內容質量”以及“人工干預”六個方面。那么又是哪些因素影響到了這幾個方面呢?
關鍵詞分數
1.網頁title中關鍵詞的處理
2.H標簽(h1-h6)中關鍵詞的處理
3.文本內容中關鍵詞的密度
4.外鏈中關鍵詞的選擇
5.域名中的關鍵詞
域名權重
1.域名注冊前的歷史問題
2.域名注冊時間的長短
3.外鏈網站的權重
4.外鏈、給出鏈接的相關度
5.是否使用歷史、鏈接形式
外鏈分數
1.鏈接域名權重
2.是否錨文本
3.鏈接數量/鏈接權重(PR或其他參數)
4.外鏈網頁的主題相關度
5.鏈接的時間
用戶數據
1.搜索引擎結果頁面(SERPs)的點擊率
2.用戶在網頁上呆的時間
3.域名或URL搜索量
4.訪問量及其他*可以監測到的數據(工具條、GA等)
內容質量分數
1.內容的相關度
2.內容的原創性
3.內容的獨特性
4.內容的搶先性和長效性
人工干預
1.投票人員干預
2.關鍵詞人工加(扣)分
3.機器算法干預