2.500 份來自 Google Content Warehouse API 的內部文件已洩露,讓人們得以難得一睹該公司的搜尋演算法。與 Rand Fishkin 分享的洩露內容包括有關內容、鏈接和用戶交互的數據存儲的信息,缺乏有關評分功能的詳細信息,但提供了對 Google 排名機制的重要見解。 Fishkin 也與匿名消息人士進行了視訊通話。而聞名,一家SEO 軟體公司,並創建了“Whiteboard Friday”視頻系列。/a>與受眾情報平台。好吧,也許不再了。在之一個世紀裡,沒有Google搜尋部門曾報告過如此規模或細節的洩密事件。如果您在#SEO,您可能應該看到這個。 pic.twitter.com/JxEs55IV21

— Rand Fishkin(在主題上關注@randderuiter)(@randfish) 2024 年5 月28 日

正如菲甚金在SparkToro 部落格,洩漏的文件概述了廣泛的 2,596 個模組,這些模組具有 14,014 個屬性,連接到各種 Google 服務,包括 YouTube、Assistant 和 Web 文件。這些模組是整體儲存庫的一部分,這意味著所有程式碼都儲存在一個集中位置,並且可以由網路上的任何電腦存取。來自某人的電子郵件,聲稱可以從 Google 搜尋部門內部獲取大量洩漏的 API 文件。該電子郵件進一步聲稱,這些洩漏的文件已被前 Google 員工確認為真實,並且這些前員工和其他人分享了有關 Google 搜尋業務的其他私人資訊。多年來谷歌員工發表的公開聲明,特別是該公司一再否認採用以點擊為中心的用戶信號,否認在排名中單獨考慮子域名,否認為新網站提供沙箱,否認收集或考慮域名的年齡等等。年以來一直存在,並使用點擊資料來加強或降低排名。 hubspot.com/website/clickstream-data”>點擊流資料在早期用於提高搜尋結果品質。該數據包括瀏覽器訪問的每個 URL。 NavBoost 最初從 Google 工具列 PageRank 收集數據,這是創建 Chrome 瀏覽器的關鍵動機。該系統透過分析給定關鍵字的搜尋次數、搜尋結果的點擊次數以及區分長點擊和短點擊來識別趨勢搜尋需求。 en.wikipedia.org/wiki/Search_engine_optimization”>SEO 實務。例如,Google 的 Panda 演算法 使用基於使用者行為和外部連結的評分修正值,應用於各個級別,例如作為域、子網域和子目錄。谷歌還儲存作者訊息,強調了作者身份在排名中的重要性。各種降級適用於錨點不符、搜尋引擎結果頁 (SERP) 不滿意和完全匹配域等因素。連結仍然至關重要,sourceType 等指標根據連結的索引位置指示連結的價值。谷歌也衡量短內容的原創性並計算標記,強調將關鍵內容放在文字前面的重要性。根據洩漏的信息,Google使用了以下演算法降級:

錨點不匹配:具有不相關錨文本的連結將被降級。 SERP 降級:在 SERP 中顯示使用者滿意度較差的頁面將會降級。 完全匹配領域:這些領域的排名價值較低。 產品評論降級:可能與最近的產品評論更新有關。 位置降級:「全球」和「超級全球」頁面可以降級以支援本地相關內容。

誤導性公開聲明

與 Google 的公開聲明相反,這些文件揭示了該公司先前否認的多項功能。例如,一個名為「siteAuthority」的功能表明Google確實衡量了網站範圍的權威,儘管有相反的說法。 。該文件表明存在這種「沙箱」功能,可以隔離新的或不受信任的網站。 ,Fishkin 與Pullrank 的 Mike Kink 發表了對迄今為止所發現內容的詳細分析,據他稱,「 API 文件中包含2,596 個模組,在Google 的排名系統中具有14,014 個屬性。洩漏的文件概述了 API 的每個模組,並將它們分解為摘要、類型、函數和屬性。 Q* 排名系統」中,這表明谷歌確實計算並使用了網站範圍內的權威衡量標準,此次洩露似乎揭露了谷歌方面關於排名作品的一些謊言:

“谷歌發言人多次表示,他們不使用「網域權限」。我一直認為這是由於遺漏和混淆而造成的謊言。

通過說他們不使用域權限,他們可能是說他們特別不使用 Moz 的稱為“域權限”的指標(顯然)他們也可能會說,他們不會衡量與網站相關的特定主題(或領域)的權威性或重要性。排名系統被描述為一系列微服務而不是單一演算法。關鍵系統包括用於爬行的Trawler、用於索引的“Alexandria”、用於排名的“Mustang”和用於查詢處理的“SuperRoot”。 p>

Twiddlers 在重新排名中的作用

Google 使用所謂的Twiddlers,它們是在搜尋結果呈現給用戶之前對其進行調整的重新排名功能,這些功能的範例包括NavBoost、QualityBoost、這些機制根據各種因素(包括用戶參與度和內容品質)微調搜尋結果。點擊垃圾郵件,包括使用cookie 歷史記錄。這可能會導致提升或降級。 p>Google 也對點擊資料使用地理圍籬。如果某些地區缺乏數據,則該過程可以普遍適用。在 Covid-19 大流行期間,Google對出現在 Covid-19 相關搜尋中的網站使用了白名單。同樣,在民主選舉期間,Google對選舉相關資訊中顯示或降級的網站使用白名單。 King 在他的分析中推測 有用的內容更新與所謂的「小熊貓」和NSR(神經語義檢索)可能意味著「有兩個參考。被稱為「熊貓寶寶」的東西。 Baby Panda 是一個 Twiddler,這是初始排名後調整的一個螺栓”,他寫道。

“我認為我們普遍認為有用內容更新具有許多與 Panda 相同的行為。使用參考查詢、連結和點擊的系統之上,這些是您改進內容後需要關注的事情。 「我們現在對Google 用於建立排名的許多功能有了更好的了解。透過結合點擊流資料和特徵提取,我們可以複製比以前更多的內容。經過多年被告知我們錯了之後,很高興看到幕後並發現我們一直都是對的。而且,雖然這些文件中關於Google 工作方式存在一些有趣的細微差別,但沒有任何內容會顯著改變我策略性地進行SEO 的方式。文件主要用於幫助驗證經驗豐富的 SEO 長期以來所倡導的內容。了解你的受眾,確定他們想要什麼,盡可能地做到最好,使其在技術上易於訪問,並對其進行推廣,直到獲得排名。最近採訪的好時機。

Categories: IT Info