女女同性女同一区二区三区91,国产精品99蜜臀久久不卡二区,怡红院在线观看

當前位置：首頁>網站專題>網站優化

搜索引擎判斷網站是否作弊的原理分析（二）

時間：2012年05月27日內容來源：互諾科技瀏覽量：0

　　承接搜索引擎判斷網站是否作弊的原理分析(一)

廣州SEO陳永繼續為大家分析信任傳播模型、不信任傳播模型及異常發現模型3個代表算法，它們分別是TrustRank算法、BadRank算法和SpamRank算法。

　　我們先詳細介紹TrustRank算法

　　TrustRank算法屬于信任傳播模型，基本遵循信任傳播模型的流程，即算法流程如下兩個步驟組成。

　　步驟一：確定值得信任的網頁集合

　　TrustRank算法需要靠人工審核來判斷某個網頁應該被放入網頁集合，考慮到人工審核工作量大，所以提出了兩種初選信任網頁集合的策略，在初選集合基礎上再由人工審核。

　　*初選策略1：高PR分值網頁，即認為高PR得分的網頁是可信賴的，所以可以對網頁計算PR值后，提取少量高分值網頁作為初選頁面集合。

　　*初選策略2:逆PR(Inverse PR),在pr計算過程中，是根據網頁入鏈傳入權值計算的，逆PR與此相反，根據網頁的出鏈傳出的權值計算，即先將網頁之間的鏈接指向關系反轉，選取的分較高的一部分子集作為初選頁面。

　　步驟二:將信任分值從白名單網頁按照一定方式傳播到其他網頁

　　在這個步驟，TrustRank算法的信任傳播方式基于以下兩個假設。

　　假設1：距離可信網頁越近越值得信任，這里的距離指的是通過多少步鏈接轉可以通達。

　　假設2：一個高質量網頁包含的出鏈少，那么被指向的網頁的是高質量網頁的可能性越小。

　　所謂信任衰減，即距離可信網頁越遠的網頁，通過傳播得到的信任分值越小。

　　所謂信任值均分策略,即將網頁獲得的信任值按照出鏈個數平均分配，如果一個網頁有K個出鏈，則每個出鏈分配到1/k的信任分值，并將分值傳遞給出鏈。

　　通過結合以上兩個傳播策略可以再頁面節點圖之間傳播信任分值，在最后的計算結果中，低于一定信任度的頁面會被認為是作弊網頁。

　　先分析這里，搜索引擎判斷網站是否作弊的原理分析(三)將為大家講解BadRank算法，具體可以到我的博客(http://www.30ly.com)了解。

　　本文原創于廣州SEO陳永博客http://www.30ly.com/?p=205

　　轉載請加上轉載地址

黄色在线观看视频网站,精品久久蜜桃,这里只有视频精品,97久久精品人人爽人人爽蜜臀