黄色在线观看视频网站,精品久久蜜桃,这里只有视频精品,97久久精品人人爽人人爽蜜臀

搜索引擎判斷網站是否作弊的原理分析(二)
時間:2012年05月27日 內容來源: 互諾科技 瀏覽量:0

  承接搜索引擎判斷網站是否作弊的原理分析(一)

廣州SEO陳永繼續為大家分析信任傳播模型、不信任傳播模型及異常發現模型3個代表算法,它們分別是TrustRank算法、BadRank算法和SpamRank算法。

  我們先詳細介紹TrustRank算法

  TrustRank算法屬于信任傳播模型,基本遵循信任傳播模型的流程,即算法流程如下兩個步驟組成。

  步驟一:確定值得信任的網頁集合

  TrustRank算法需要靠人工審核來判斷某個網頁應該被放入網頁集合,考慮到人工審核工作量大,所以提出了兩種初選信任網頁集合的策略,在初選集合基礎上再由人工審核。

  *初選策略1:高PR分值網頁,即認為高PR得分的網頁是可信賴的,所以可以對網頁計算PR值后,提取少量高分值網頁作為初選頁面集合。

  *初選策略2:逆PR(Inverse PR),在pr計算過程中,是根據網頁入鏈傳入權值計算的,逆PR與此相反,根據網頁的出鏈傳出的權值計算,即先將網頁之間的鏈接指向關系反轉,選取的分較高的一部分子集作為初選頁面。

  步驟二:將信任分值從白名單網頁按照一定方式傳播到其他網頁

  在這個步驟,TrustRank算法的信任傳播方式基于以下兩個假設。

  假設1:距離可信網頁越近越值得信任,這里的距離指的是通過多少步鏈接轉可以通達。

  假設2:一個高質量網頁包含的出鏈少,那么被指向的網頁的是高質量網頁的可能性越小。

  所謂信任衰減,即距離可信網頁越遠的網頁,通過傳播得到的信任分值越小。

  所謂信任值均分策略,即將網頁獲得的信任值按照出鏈個數平均分配,如果一個網頁有K個出鏈,則每個出鏈分配到1/k的信任分值,并將分值傳遞給出鏈。

  通過結合以上兩個傳播策略可以再頁面節點圖之間傳播信任分值,在最后的計算結果中,低于一定信任度的頁面會被認為是作弊網頁。

  先分析這里,搜索引擎判斷網站是否作弊的原理分析(三)將為大家講解BadRank算法,具體可以到我的博客(http://www.30ly.com)了解。

  本文原創于廣州SEO陳永博客http://www.30ly.com/?p=205

  轉載請加上轉載地址 

 
 
主站蜘蛛池模板: 黄山市| 普兰店市| 宜丰县| 汕头市| 准格尔旗| 永州市| 齐齐哈尔市| 南昌市| 金湖县| 德令哈市| 濉溪县| 故城县| 土默特左旗| 长泰县| 普安县| 霸州市| 沛县| 天等县| 陆河县| 丹东市| 怀化市| 含山县| 灌云县| 长阳| 比如县| 淄博市| 平泉县| 济南市| 柏乡县| 久治县| 开鲁县| 沙洋县| 枝江市| 巴青县| 台东市| 石门县| 兰坪| 囊谦县| 陵水| 丹凤县| 通辽市|