在臺灣時間5月5日時,Google在Twitter上預告,將會有核心演算法更新
網路使用者進行的每一次Google搜索都是Google當天收到的數十億美元之一。在不到半秒鐘的時間內,Google系統將會對數千億個網頁進行排序,以嘗試找到可用的最相關和有用的結果。
由於網絡和人們的信息需求不斷變化,因此Google對搜索算法進行了很多改進以使其與時俱進。實際上,每年數以千計。而且,無論是一項新功能,還是為Search 帶來了新的語言理解功能,Google一直在尋找使Google的結果更有用的新方法。
Google所做的改進經過了設計評估過程,使全世界的人們繼續發現Google對他們想要的東西有用。來自世界各地的人們的見解和反饋可以通過以下方式幫助您更好地進行搜索。
Google的研究團隊在工作
Google對搜索所做的更改旨在使人們更容易找到有用的信息,但是根據他們的興趣,他們說什麼語言以及他們在世界上的位置,不同的人有不同的信息需求。Google的使命是使信息普遍可訪問和有用,並且Google致力於為實現這一目標而服務於所有用戶。
這就是Google擁有一支研究團隊的原因,該團隊的工作是與世界各地的人們交談,以了解搜索如何變得更加有用。Google邀請人們就項目的不同迭代提供反饋,並且Google進行現場研究以了解不同社區中的人們如何在線訪問信息。
例如:多年來,Google已經了解到新興市場人士在在線訪問信息時所具有的獨特需求和技術限制。因此,Google開發了Google Go,這是一種輕量級的搜索應用程序,可與功能較弱的手機和連接可靠性較差的應用一起很好地工作。在Google Go上,Google還引入了獨特而有用的功能,其中包括一項可讓您大聲收聽網頁的功能,該功能對於學習新語言的人或可能不太喜歡閱讀長文本的人特別有用。如果沒有最終使用它們的人員的見識,則無法實現此類功能。
搜索質量評級者
評估過程的關鍵部分是從日常用戶那裡獲取有關Google的排名系統和建議的改進是否運行良好的反饋。但是,“運作良好”是什麼意思?Google發布了公開的評估者指南,其中詳細描述了Google的系統打算如何展示大量內容。這些準則的長度超過160頁,但是如果Google必須將其簡化為一個短語,Google要說的是Search旨在從最可靠的來源中返回相關結果。
Google的系統使用來自網絡本身的信號(例如,您搜索的單詞出現在網頁上的位置,或頁面在網絡上如何彼此鏈接)來了解與您的查詢相關的信息以及人們是否傾向於信任的信息。但是相關性和可信賴性的概念最終是人的判斷,因此要衡量Google的系統是否實際上正確理解了這些,Google需要收集人們的見解。
為此,Google在全球擁有10,000多人的小組,Google稱之為“搜索質量評估者”。評估者可以幫助Google評估人們可能如何體驗Google的結果。他們根據Google的準則提供評級,並使用他們的最佳判斷代表他們的語言環境,代表真實的用戶及其可能的信息需求。這些人在開始提供評分之前,已經學習並經過了Google的評分者指南的測試。
網站排名的評分如何運作?
評估者任務的工作方式如下:Google生成查詢樣本(例如幾百個)。一組評估者將被分配此組查詢,並為這些搜索顯示兩種版本的結果頁面。一組結果來自最新版本的Google,另一組結果來自Google正在考慮的改進。
評估者根據Google的評估者指南,審查結果集中列出的每個頁面,並根據查詢評估該頁面。他們基於對查詢所尋找內容的理解來評估這些頁面是否滿足信息需求,並考慮諸如該來源似乎在查詢主題中的權威性和可信賴性之類的事情。為了評估諸如專業知識,權威性和可信賴性之類的東西(有時稱為“ EAT”),要求評估者對來源進行聲譽研究。
這是實際的樣子:假設樣本查詢是“胡蘿蔔蛋糕配方”。結果集可能包括來自食譜站點,食品雜誌,食品品牌以及博客的文章。為了確定某個網頁是否滿足其信息需求,評估者可能會考慮如何輕鬆地閱讀烹飪說明,該食譜在視覺說明和圖像方面的幫助以及網站上是否還有其他有用的功能,例如購物列表創建者或用於加倍食譜的計算器。
為了了解作者是否具有主題專業知識,評估者將進行一些在線研究,以查看作者是否具有烹飪資格,是否在其他食品網站上進行了簡介或引用,或者是否產生了獲得好評或好評的其他精彩內容。食譜網站。基本上,他們會盡力回答以下問題:該頁面是否值得信賴,它是否來自信譽良好的網站或作者?
評級不直接用於搜索排名
評估者完成這項研究後,便會為每頁提供質量評估。請務必注意,此評級不會直接影響此頁面或網站在搜索中的排名。沒有人會確定任何給定的來源都是“權威的”或“可信的”。特別是,沒有為頁面分配等級來確定對其進行排名的方式。確實,這將是一項不可能完成的任務,對Google來說是一個不好的信號。隨著成千上萬的頁面不斷變化,人類無法對每個頁面進行反複評估。
相反,評分是一個數據點,當綜合考慮時,它可以幫助Google衡量系統在提供出色內容方面的工作狀況,這些內容與全國各地以及世界各地的人們對信息的評估方式保持一致。
僅去年一年,Google就使用搜索質量評分器進行了383,605項搜索質量測試和62,937項並行實驗,以衡量結果的質量並幫助Google對3600多種搜索算法進行改進。
產品內實驗
Google的研究和評估者反饋並不是Google進行改進時使用的唯一反饋。Google還需要了解在搜索功能中實際可用的新功能以及人們在現實生活中的使用方式後,新功能將如何工作。為了確保Google能夠獲得這些見解,Google通過實時實驗測試人們如何與新功能交互。
之所以將它們稱為“實時”實驗,是因為使用當前版本的搜索功能的少數隨機選擇的人實際上可以使用它們。為了測試更改,Google將針對所獲得的所有查詢中的一小部分啟動一項功能,並查看許多不同的指標來衡量影響。
人們是否單擊或點擊了新功能?大多數人只是滾動過去嗎?是否使頁面加載速度變慢?這些見解可以幫助Google相當了解新功能或更改是否有用以及人們是否會真正使用它。
在2019年,Google進行了17,000多次實時流量實驗,以測試Search的新功能和改進。如果將其與實際發生的發射次數(大約3600次,還記得嗎?)進行比較,您會發現只有最佳和最有用的改進才可以納入Search。
雖然Google的搜索結果永遠不會是完美的,但事實證明,在過去的二十年中,這些研究和評估過程非常有效。它們使Google能夠進行經常性的改進,並確保Google所做的更改代表了世界各地尋求信息的人們的需求。