搜索引擎算法之:謹慎對待同義詞
來源:昆明多彩網(wǎng)絡公司 日期:2011-02-20 閱讀: 發(fā)表評論
在搜索引擎中有一個很重要的分詞技術,比如將一個長的詞語分解成若干個短語,然后再根據(jù)這些短語呈現(xiàn)最終的搜索結果,而我們這里說得同義詞并非搜索引擎中的分詞技術,說的是一個該怎么樣去理解用戶意圖的技術。
比如說我們搜索“網(wǎng)站制作”和“網(wǎng)頁制作”這兩個同義詞語,可以對比一下搜索出來的結果,發(fā)現(xiàn)還是有很多不同的,雖然這兩個詞語的意思基本相同;而我們再搜索競爭較小的同義詞的時候就可以發(fā)現(xiàn)搜索結果相似程度的就出現(xiàn)上升趨勢。
這里我們可以大膽的猜測一下影響搜索引擎對于同義詞搜索結果的相關因素:
1、兩個同義詞如果意義非常接近,同時相關信息較少的話,搜索引擎會自動匹配這兩個詞語,并且呈現(xiàn)大部分相同的結果。
2、兩個同義詞意義非常接近,但是詞語的搜索指數(shù)很高,同時相關的網(wǎng)站競爭排名也非常激烈,那么呈現(xiàn)出來的結果就會迥異。
3、如果兩個同義詞前面加上了地域或者其他限制性的前綴,搜索引擎會考慮將這兩個詞語當成一個關鍵詞來對待,但幾率較小。
4、對于冷門和一些專業(yè)術語,搜索引擎如果在自身數(shù)據(jù)庫中有兩個同義詞的數(shù)據(jù),將同義詞當成一個關鍵對待的幾率將大大加大。
以上猜測僅參考了少部分的搜索詞語,搜索引擎對于同義詞的匹配和對待的態(tài)度是非常的謹慎,更多更準確的數(shù)據(jù)就需要更多的關鍵詞語去驗證了。
發(fā)表評論評論列表(有 條評論)