本文有了新的结论,请看:缓存的Vary设置引起的搜索结果的问题
首先声明,我既不用百度,也不用360,今天写这篇文章,纯粹是因为看了一篇报道360搜索的文章,于是决定亲自考证并对比,360搜索和百度搜索,到底那个更好一点。
由于只是一个简单的对比,并不能完全证明些什么,但是却发现了一个有趣的结果。请看:
1、百度搜索「Ubuntu Tweak」
首先在百度,搜索「Ubuntu Tweak」,结果如下(点击看大图):
搜索结果实际上还是令人满意的,第1个是主页,第4个是blog,最后一个是Github的地址。
但是,这里有一个说大不大,说小不小的问题,它的第一个搜索结果,竟然把网站的描述给搞错了!
Title是:Ubuntu Tweak - Let's rock with Ubuntu
Descrption是:TualatriX的个人主页(blog),讲述他的生活和事业……
这是本blog的描述啊,百度是怎么把它关联到Ubuntu Tweak主页的描述上去的?
有一个可能是,IMTX本站,和Ubuntu Tweak主页是放在一个服务器上的。让我们继续看360的结果。

2、360搜索「Ubuntu Tweak」
360搜索Ubuntu Tweak的结果看起来比百度的差一点,第一个是官方主页无疑,第二个是百度百科的介绍,最后一个才是官方blog,没有github的页面。
但是仔细一看,第一个结果,360是:
Title:Ubuntu Tweak - 一起与Ubuntu震动地球
Description: Ubuntu Tweak是一个设计用来方便所有人配置Ubuntu的工具。
完全正确!更令我惊叹的是,360的结果完全是按照本地语言的结果去处理的。我在设计Ubuntu Tweak的网站之初就是按多国语言去考虑的,浏览器的语言选项是中文的话,就会显示中文,是英文的话就会显示英文。而360的搜索结果默认显示了中文,而且完全正确。
这可以证明两点:
- 360的搜索结果是自己爬出来的;
- 360的爬虫会给自己设置「Accept-Language」的值,以爬出最优的结果;
不知道真实的情况是不是这样,至少呈现给用户的结果是这样,360的体验更好一些。
如果一个不愿意去看英文的用户用百度搜Ubuntu Tweak,他看见第一个搜索结果,点击的意愿不会太大,而如果他用360搜索,很显然,360给的结果(中文),和他点击进去的结果(也是中文)是一致的,这就是我所说的360的体验更好一点的原因。

3、还有Google呢?
分析到这里,百度除了弄错了description,还有没有呈现本地语言,其他并没有什么大错误,第一页的结果从整体的吻合度上也更好,可以说也是不差的。
但是,事情还没有完。前面我说过,我一直是用Google的,虽然在国内用Google已经越来越困难了,但是这丝毫不会阻挡我去用它。用Google搜索Ubuntu Tweak的结果如下:
Google的质量显然是不错的,Ubuntu Tweak的主页,下载主页,项目主页,Github主页都出现在了非常前面的位置,百度百科的中文页作文中文站访问的比较多的页面,也出现在了第四个结果。
然而,让我大跌眼睛的是……
Google的第一个结果,居然和百度一样,把Description搞错了,弄成了IMTX的Description!
等等!这说明了什么?
- Google和百度,肯定有一个是抄对方的结果;
- Google和百度用的搜素技术是一样的,所以才会有把description搞错的情况;
写到这里,光从这搜索「Ubuntu Tweak」的质量来看,还是360的用户体验好一点啊。
大家也可以测试一下其他关键词,来发表一下自己的见解。至于百度和Google是什么个关系,相信通过更多的案例,就可以看出来了……

更新:
这才是最搞笑的,Microsoft真的BING了……

<推广> 本站推荐使用使用 BandwagonHost 来搭建自己的虚拟主机和相关网络服务。
虽然我不愿意这么猜测,但是从网络上说到360的特性来说。。。
从用户浏览的数据来进行索引一样可以得到非常好的本地化效果。。。
嗯,以后google没法用的时候就试试360,360如果人工不干预,还是可以的
不会用360即使是google没法用时
Google和baidu对Ubuntu Tweak的快照都是你的blog...
对于搞错Description的问题,主席是不是在站长工具里弄错了什么?Google好像是优先使用站长工具里的设置。
…… 更像软文……
以事实为依据,哪里像软文
Bing笑死了= =
bing也没错是自己主页设置有问题,除非2次抓取否则都一样
我特意跑来回复原文。我第一次打开软件网站的时候,打开的页面是blog的首页内容,再次打开的时候才是真正的软件首页,这可能是和你服务器设置有关吧。
我进去也是看到blog内容,刷新之后才是ubuntu-tweak的首页。
+1, 我也是第一次先进入了Blog首页(但是CSS/图片丢失), 再次打开的时候才是软件主页. 是不是服务器什么地方的问题...
+1,同样第一次访问ubuntu-tweak,先看到blog(但无图片等),刷新才能看到ubuntu-tweak
+1,跟楼上几位一个症状.
同上 你自己的网站有问题 不是被劫持了吧
一样的情况。我还专门截了个图来恢复,可惜不能恢复图片....
这样来说,360的搜索很可能是牺牲了性能...
“回复图片”,上面打错了
明显是LZ自己网站的问题
主人,该看快照 了。
不知道你的server对爬虫做了什么
确实...Google给出的快照就是Blog内容而非软件首页= =|||
我觉得更大原因是下图所示:
http://troll.ws/image/66f09c31
缓存?
用360去搜索GBE就比不谷歌了。谷歌的第二项是我要的,360就不知道要第几项了
作者刚换过ip吧
被喷成这样了,而且确实是自己网站问题,还不删文。。这是一种什么样的精神。。
看来是主席自己的问题。。
关于google的结果不够准确。我从过google.com.hk检索出来的结果和博主不同。更真实,和度娘不同。
博主自己的问题,看快照即知
借此褒360贬低baidu,google就有点2
關鍵是由於
<meta content="V_-sQHxTTSWK6ljVQPlLthhBQjQRCYwRuM03bPaQjp8" name="google-site-verification">
這句話導致你的描述錯誤的.
https://www.google.com.hk/search?q=V_-sQHxTTSWK6ljVQPlLthhBQjQRCYwRuM03bPaQjp8&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:zh-TW:official&client=firefox-a&channel=fflb
你可以通過這個搜索看看就知道了.
为什么这个描述是错误的?
PS:我已经修复了过滤HTML的问题了
你的 Blog 過濾了 HTML = =
補上:
meta content="V_-sQHxTTSWK6ljVQPlLthhBQjQRCYwRuM03bPaQjp8" name="google-site-verification"
另一个问题貌似大家都没发现,博主你google帐号登录状态搜索Google,会对你的结果做个人的优化吧。多试验了一下,中文google,日本google,ncr的貌似结果都不尽相同。这个博文的搜索测试太不严禁了。
专业能力问题还是节操问题?
bing很正常啊,标题和描述都是正确的,不过是英文的。
google的搜索结果也是正常的。只不过显示的是英文。
BING 最高!