自2002年推出以來,Google News已成為Web上最大的新聞內容聚合器。在去年9月《大西洋月刊》的一篇文章中,Google News的主管曾說該網站收集的新聞來源超過5萬個,每周的獨立訪客超過10億。該網站完全由計算機生成,每天都會收集和展示從全球數千個新聞來源的頭條新聞。
Google甚少透露相關的算法和規則,只是說為了保證顯示的內容質量會定期調整新聞排名。據信,Google自2003年以來已經三次調整了排名算法。
Computerworld 在美國專利辦公室網站查詢時碰巧發現了Google去年的一項專利申請—《改進新聞文章排名的算法與系統》,專利申請號為20120158711。通過對申請文檔的分析,從中可以了解到Google對新聞故事排名的一些指標。這些指標決定了哪些新聞可以被放在Google News的顯著位置。
專利申請中運用了超過12項指標來對其他網站的新聞文章進行排名。包括新聞網站定期產生的新聞數量、新聞來源的平均長度、新聞來源新聞報道的重要性、突發新聞得分、使用模式、輿論意見、流通量。