北京赛车下载|北京赛车怎么玩
當前位置:首頁 > SEO文章轉載 > 什么是TF-IDF算法,在SEO優化中TF-IDF算法怎么用

什么是TF-IDF算法,在SEO優化中TF-IDF算法怎么用

2
  TF-idf算法是一種用戶信息檢索和常用的加權信息挖掘技術,經常SEOER應用于,很多人可能不知道,事實上,最直觀的理解是“網站關鍵字密度”。

直接點,TF-idf算法最終是如何計算:

公式:

TF:詞頻

IDF:逆文檔頻率指數

TF-IDF=TF*IDF

我們說明,TF詞義,指的是《紐約時報》一個單詞出現在頁面,如果單詞的總數在200年的一篇文章,“網站優化”這個詞出現了4次,然后這個詞TF=4/200,是0。02。

IDF文檔頻率,指N出現在很多頁面的字數,文件數米,然后IDF=lg(M/N)。假設“網站優化”出現在2000頁,文件的總數是100000000,然后IDF的文檔頻率=lg(100000000/2000)=4。69897,然后計算最后TF-IDF=0。02*4。69897=4。69897。

這是一個判斷頁面的相關問題,在SEO網站優化,不僅決定TF-IDF點的值,我們需要一個高度識別詞的頁面。例如:搜索引擎包含一萬億頁,應該說,每個頁面都有“,,,”等等,這些高頻詞也稱為噪聲詞或停止的話,搜索引擎會刪除這些話,所以額外的重量這些話應該是0。公式:TF-IDF日志(1美元/一萬億)==log1=0。

事實上,搜索引擎檢索、重量計算,根據每個單詞分割來計算,例如:“SEO網站優化技術”這個詞。

假設:SEO頁面檢索數字20000000,網站優化搜索號碼是10000000,檢索技能的數量500000000

搜索引擎索引號被認為是10000000000。

SEO在這個網站www。ruihess。com頁面(頁面總共400字)出現8次,網站優化技術出現10次,16倍。

所以他們的頻率

特遣部隊(SEO)=8/400=0。02,

特遣部隊(網站優化)=10/400=0。025

特遣部隊(=20/400=0。04技術)

特遣部隊(年代)=上面已經提到的,屬于停止詞的高頻,重量是0。

做一個搜索“SEO網站優化技術”這個頁面的相關性:TF(總)=0。02+0。025+0。025=0。095。

IDF(SEO)=日志(10000000000/20000000)=2。69897

IDF(網站優化)日志(10000000000/10000000)=3=

IDF(技能)=日志(10000000000/100000000)=1。69897

這么算下來,每個單詞搜索“SEO網站優化技術”頁面權重和相對貢獻值分別為:

Tf-idf(SEO)=0。02*2。69897=2。69897

Tf-dif(網站優化)=0。025*3=0。075

Tf-idf(=0。04*1。69897=0。04技術)

因此,可以看到,盡管技術出現更頻繁,但承認不是搜索引擎優化和網站優化,所以頁面的貢獻并不太大的重量。

預測能力一個單詞的識別度較高,那么多字的重量,而更小,看到“網站優化”可能你已經有了一個基本的了解這個頁面說什么,但看到技能,您可能還不太了解的主題頁面。

當然,這支持點搜索引擎算法,我們結合標記實現舉重,如H標記,和周圍的關鍵詞詞將被傳遞,這指的是如一個標簽:SEO網站優化技術主要是一些搜索引擎優化的想法

杭州seo猜您喜歡

  • «
  • »
  • 作者:
    除非注明,本文原創:杭州SEO,歡迎轉載!轉載請以鏈接形式注明本文地址,謝謝。
    原文鏈接:http://www.ya0a.com/87.html

    發表評論

    北京赛车下载