360搜索部門的工作人員告訴我360已經(jīng)推出了ICO算法了,ICO 全稱:Index clear optimize,簡單來說就是處理重復(fù)內(nèi)容的算法。這也意味著,這是繼Google、百度之后,又一家敢公布算法的搜索引擎,也是自信的一種表現(xiàn)。
360也聰明了,為了避免之前百度犯過的錯(每次更新不明不白,導(dǎo)致怨聲載道),所以在360搜索逐漸強大的時候公布每一次算法的改動。
ICO算法是對已經(jīng)入索引庫的低質(zhì)量URL和無效URL數(shù)據(jù)進行清理的算法,在不同的階段會對不同類型的無效數(shù)據(jù)進行清理,該算法是一個長期執(zhí)行的算法。
一次清理超過10億頁面的算法360搜索都將提前公布告知站長,并告知算法優(yōu)化處理的主要方向。
ICO算法:處理量級:10億以上處理網(wǎng)頁特點:該算法主要是針對重復(fù)內(nèi)容進行清理,對用戶沒有價值的內(nèi)容頁面,內(nèi)容時效性強且過期的頁面,采集站類,URL地址含有無效參數(shù)的頁面等。例如:招聘類網(wǎng)站不同子站中內(nèi)容相同的頁面,小說采集站尤其處理對用戶無價值的頁面,舊新聞頁且內(nèi)容重復(fù)的頁面也會處理一部分,以及其他的部分無效頁面。
ICO算法:
處理量級:10億以上
處理網(wǎng)頁特點:
該算法主要是針對重復(fù)內(nèi)容進行清理,對用戶沒有價值的內(nèi)容頁面,內(nèi)容時效性強且過期的頁面,采集站類,URL地址含有無效參數(shù)的頁面等。
例如:招聘類網(wǎng)站不同子站中內(nèi)容相同的頁面,小說采集站尤其處理對用戶無價值的頁面,舊新聞頁且內(nèi)容重復(fù)的頁面也會處理一部分,以及其他的部分無效頁面。