|
7月27日国际报道 据谷歌(Google)最近检测,互联网上独立页面的数量超过了1万亿个。
当地时间上周五,谷歌官员在公司博客上写道,这要感谢谷歌的搜索工程师,是他们发现了互联网上每天新增加数十亿个网页。
除了公布这一发现,谷歌还借机宣传了自己的索引数据库规模。谷歌互联网搜索基础架构团队的软件工程师杰西?阿尔帕特和尼桑?哈贾吉在博客中写道,“我们没有索引这1万亿个网页中的每个页面??因为许多页面都彼此相似,或代表自动生成的内容,这些对用户没多大意义。但令我们骄傲的是,我们拥有最完整的索引数据库。我们的目标是索引全球的数据。”
谷歌公开宣传其索引数据库的规模已经有一段时间了,几年前,各大搜索引擎厂商曾就这一话题争得面红耳赤。当发现搜索用户大多只翻看两页搜索结果后,围绕索引数据库规模进行争论的日子才算结束。
也就是说,最重要的是向用户提供10-20个相关度较高的链接,或者最好是直接给出实质性问题的答案,因为没有用户会从5000个搜索结果中查找所想要得到的信息。谷歌在其主流官方博客上公布这一信息能否引起竞争对手雅虎、微软和Ask.com的一连串反应呢?
阿尔帕特和哈贾吉还在博客中写道,“目前,谷歌在不停地下载web,收集更新页面的信息,每天对整个web链接图形进行多次重新处理。1万亿个页面的图形处理与由1万亿个十字路口组成的地图处理相似。” |