登陆注册
8158000000039

第39章 要练神功

如果撇开感情因素,单纯从技术和用户的角度出发,谷歌和百度的搜索引擎哪个更好,这个问题同样仁者见仁、智者见智。

百度一直宣称他比谷歌更懂中文,很多用户也发现,在搜索某些中文内容的时候,百度的表现的确比谷歌更胜一筹。

2008年,美国一个叫作Globalbydesign的专业博客就这个问题做了一个试验。他们选取了三个关键词:“许霆”、“次贷危机”和“看羹吃饭”,分别在谷歌的Google。com、Google。cn和百度网站上搜索。他们选取的这三个关键词十分有代表性。“许霆”因银行自动取款机出错而恶意取款一事成为当时的舆论焦点,但在中国以外没有受到多大的关注;“次贷危机”是一个由英语翻译过来的词,可以说是中国人自己造出来的新词;而“看羹吃饭”是浙江的一句方言(大致是有什么吃什么,不强求的意思),其他地区的中国人估计都不会用这个词。

搜索结果出来一比较,“许霆”在百度上有200万个结果,在Google。com上有144万个结果,在Google。cn上有133万个结果。但是直接比较搜索结果的总数是没有意义的,因为用户不会一条一条全部看完。在绝大多数情况下,用户一般只关注前3页的内容,即在前30条搜索结果中找自己所要的信息,第10页之后,也就是100条之后的内容基本上没有人会去看。

Globalbydesign分别比较了这三个网站对“许霆”的前20条搜索结果,发现都是高质量的网站链接,用户通过这些链接基本上能够对许霆案的来龙去脉有个了解。因此,谷歌和百度在“许霆”这个关键词的搜索上平分秋色。

接下来看“次贷危机”的搜索结果。“次贷危机”在百度、Google。com和Google。cn网站上分别有105万、38万和154万个搜索结果条目。同样,比较搜索结果的总条目数没有意义,主要还是看前几页的条目是否是高质量的网站。

这回百度要比谷歌做得好,因为在Google。com和Google。cn的前20条搜索结果中,分别有7条和5条是繁体中文。虽然谷歌允许用户在搜索结果中对简体中文和繁体中文进行设置,但是如果用户用“次贷危机”这四个简体字搜索的时候,很显然用户是在寻找简体中文网站的信息,这个时候谷歌显示繁体中文网站显得有点驴唇不对马嘴了。

而实际上,谷歌搜索结果中简体中文和繁体中文混杂的问题一直存在。繁体中文的出现或多或少让简体中文的用户感到有点碍事。现在谷歌在识别和处理简体、繁体中文上的技术进步了很多,但是这个问题还是存在。特别是对于一些简体、繁体中文书写完全一致的词语,如“痞子英雄”,谷歌就要乱很多。笔者在2010年3月份曾用“痞子英雄”作为关键词搜索,百度搜索的结果全部为简体中文,而Google。com的前几页全部为繁体中文的台湾网页,而Google。cn前几页则是简体中文和繁体中文各占一半。显然百度把这个问题处理得更好,这也是中国大陆的一些用户觉得百度比谷歌更好用的原因之一。

最后是这个“看羹吃饭”。这次关键词的搜索结果就很戏剧化了。Globalbydesign的试验发现百度只有207个条目,而Google。com和Google。cn则分别有400万和24万条结果。乍一看,谷歌厉害多了,但是仔细看一下,就发现不是那么一回事。百度的207个条目中几乎每个条目都是精准的“看羹吃饭”这个词,而Google。com和Google。cn各自前10页的搜索结果中,没有一条是精准的,只是这四个字撒落在句子中间。所以在这一回合的较量中,百度无可争议的比谷歌强。

这也是很多中国用户的共识,在对待“看羹吃饭”这样极其中国化的关键词上,百度确实比谷歌更懂中文。

但是换个角度,如果你是一个搞学术研究的,经常要查一些资料,这个时候,你可能会发现,百度未必比谷歌强。

比如,我们用“灵菌红素”作为关键词去搜索(2010年3月,下同),谷歌网站上第一条就是来自维基百科(Wikipedia)的。这个维基百科是一个网上的百科全书,涵盖几乎所有语言。虽然它的内容是用户自行编写的,但是也很有权威性,很多人遇到新名词第一个想到的就是查维基百科。所以用户如果搜索“灵菌红素”这样的专业名词,往往都能在谷歌最前面的几个搜索条目中找到维基百科的链接。但是百度把这个维基百科排到很后面,重要的一个原因就是百度自己也有一个类似的产品——百度百科,跟维基百科是直接的竞争对手。

但问题是百度百科的权威性要比维基百科差一截,而且覆盖面也没有维基百科广,如这个“灵菌红素”被维基百科所收录,但却没有被百度百科收录。所以从网站质量上来讲,维基百科要比百度百科高,但是百度还是把百度百科的链接放在最上面,而在谷歌上,百度百科的条目一般也出现在比较靠前的位置。这一点,谷歌做得比百度更公正,也更被用户认可。

同样,如果我们用“亥姆霍兹方程”作为关键词搜索,谷歌搜索结果中的前20条都是优质结果,点击这20个网站,里面都是对“亥姆霍兹方程”的详细介绍;而百度就逊色了不少,点击百度搜索结果中的前20个网站,有一半没有提供实质性的信息,有些需要再次点击才能到达有实质性内容的页面,有些就是翻译网站。

如果我们再用“后现代主义”作为关键词搜索,会发现百度做得更离谱。前20条搜索结果中居然有17条来自百度自己的网站,除了百度百科以外,大量的搜索结果条目来自“百度知道”,即百度的在线问答的内容。百度的在线问答就是用户有问题了可以在线提问,知道答案的人可以回答,的确有人在这里找到了解决自己问题的答案,但是这中间也会夹杂不少错误的答案,而且这种形式所提供的内容并不权威。所以如果你是一个正在写关于“后现代主义”论文的人,看到百度这个搜索结果,估计就只会摇头了。而如果使用谷歌进行搜索,前20个条目都是高质量的网站,点进去一看都是对“后现代主义”的介绍,提供的内容比百度有用多了。

此外,百度的搜索结果中夹带了大量的广告,这也是一些用户诟病百度的原因。比如,我们用“软密封闸阀”作为关键词搜索,结果发现百度的前10条搜索结果中都是用小字标出“推广”的广告。如果用户不留心,可能就把这10条也当作了正常的搜索结果,点进去一看,全是卖这个“软密封闸阀”的。如果你是一个想知道什么是“软密封闸阀”的人,估计会大失所望。

如果你要查找一下英文资料,那么百度跟谷歌完全是两个套路。假如你要研究一下本书中多次提到的“网络中立”(Net Neutrality),拿“Net Neutrality”作为关键词进行搜索。百度前几页的搜索结果中不少都是中英文混杂,其中还包括权威性不高的个人博客;而谷歌的搜索结果则无可挑剔,全是关于“网络中立”的长篇大论,就怕中国用户看不懂英文。这个结果从表面上看谷歌胜出,但是实际上,中国用户未必都觉得谷歌好,关键要看什么人在使用。如果你英语水平很强,而且正在研究美国网络中立的政策,那么毫无疑问会选择谷歌;但是如果你英语水平一般,甚至看见英语就反胃,只是偶然看到了“Net Neutrality”这个单词觉得好奇,想弄清楚是什么意思,那么百度的搜索结果更适合你,因为这些中英文夹杂的网站中就有用中文对这个词进行说明和解释的,你一看就明白了。

比较到这里,我们可以对百度和谷歌的搜索能力下一个初步的结论了。从技术的角度出发,越是中国的东西,越是八卦的内容,百度往往比谷歌更好;而对于一些专业的内容,谷歌则更强大。所以一般中国用户想查点吃喝玩乐或者明星绯闻,百度可以告诉你更多的东西;如果你要写论文做研究,还是找谷歌更对路。

这个差异好比QQ和MSN的区别。QQ的用户一般是大众用户,下到小学生,上至想跟孙子孙女聊天的大爷大妈们;而MSN的用户群一般都是公司白领,相对来讲属于“高端”用户。

但是谷歌和MSN同病相怜的是,虽然都拥有了“高端”用户,可市场却依然惨淡。因为在互联网中,高端用户只是少数,大部分用户只管自己吃好喝好,因此百度和QQ占了更大的便宜。

美国互联网企业在中国来一个死一个的现实让美国人感到很憋屈。一憋屈,就要找各种理由。比较盛行的一个理由就是中国政府和中国市场更偏爱自己本土公司的产品,并有意设置各种障碍让美国公司打不开市场。对于这个技术性问题,谷歌又该如何回答呢?

同类推荐
  • 地产大博弈

    地产大博弈

    金融危机肆虐全球、劳动力成本上涨、人民币升值、资本市场惨淡、银根紧缩、原材料涨跌难定……在内忧外患的双重重担之下,中国经济转型的困难辐射到各个角落,从资本市场到实体经济,无不随着中国经济转型的大潮起起落落。作为实体经济的重要组成部分,房地产业的调整自然也在所难免。
  • 国富论中文珍藏版(上)

    国富论中文珍藏版(上)

    本书继承了19世纪初以来英国庸俗经济学的传统,兼收并蓄,用折衷主义的方法把供求论、生产费用论、边际效用论和边际生产力论等完美地融合在一起,形成了以“完全竞争”为前提和以“均衡价格论”为核心的庸俗经济学体系。
  • 共和国的经济与周恩来

    共和国的经济与周恩来

    周恩来是新中国经济工作的卓越领导者和组织者。他的经济思想是马克思主义基本原理同中国具体实际相结合的产物,为马克思主义在中国的运用和发展作出了不可磨灭的贡献。他领导的经济建设实践,为我国社会主义事业的创建立下了不朽的功勋。周恩来的经济思想丰富了毛泽东思想,是党和人民极其珍贵的精神财富。我们认真学习和研究周恩来的经济思想和实践,不仅可以深刻地懂得新中国经济的奠基、创业和发展是来之不易的,而且,能够从中获得许多可资借鉴的历史经验,为建设有中国特色社会主义的伟大实践服务。
  • 中国制造业投资研究

    中国制造业投资研究

    以现阶段我国制造业投资为研究对象,详细分析了制造业投资规模、结构和效益以及相关影响因素。本书在简要回顾了我国制造业的发展状况后,详细阐述了继续加强制造业投资的客观必然性;通过计量模型分析和检验,定量研究了制造业投资对经济增长的拉动作用,以及制造业投资对不同地区经济增长的贡献程度
  • 微软的秘密

    微软的秘密

    本书以大量详实的材料为基础,对微软这个全球最大的软件公司进行了深入的剖析,作者将重点放在对微软内部运作机制和市场营销手段的分析上,为读者展示了每一个软件公司都想知道的秘密——软件开发和商业策略的之间的应该如可互动与协作,以赢得利润。专家评价“将成为计算机产业的标准参考书”。
热门推荐
  • 深蓝在那里

    深蓝在那里

    我们是八字不合的对手;他很冷漠,而我爱打抱不平;他的所有都很复杂,而我什么也没有所以简单;他活在镁光灯下华丽高傲,而我饱受折磨卑微渺小;一个人的生活,我没有怕什么!一个人生活,他在怕什么?生活中多了一个我,他没什么在乎!生命里再少了一个他,我要怎么办?
  • 花路落兮

    花路落兮

    花路花落,游人匆匆,知其美而不识其痛,终是匆匆过客,物是人非。穿越,有很多种方法,但是感觉都好像不能够实现,于是啊,穿越就只不过是想想就好了,那还会想到,这么想一想,就莫名其妙的去到了战国......
  • 交织在一起的梦

    交织在一起的梦

    梦里梦见梦不到的梦,习惯了不该习惯的习惯,我和你,不过是青春的一场邂逅。终究会散,莫强求,如果再来一次,我还会再次选择你,再次爱上你。我的那个他,回头,我就在我身后;我的那个她,转身,我就在你身边……
  • 寻前世今生之旅

    寻前世今生之旅

    为什么?她只是想做一个普通女孩,为什么命运对她如此不公?第一世,她与他相逢,最终却生死离别。第二世,因前世的她变得冰冷,为什么,让她又一次遇上了他。第三世,求求你不要再折磨我了,我不想再遇见你,从此以后,我们再见。第四世,他为了救她,用自己的生命作为代价,而她,只能看着他慢慢死去。第五世,你看,我们天生就是互相吸引的,不是么?如果连苍天都注定的话,那么,我们。穿越、玄幻、现代、明星小说剧,对于每一世的不同,他们又该如何呢?
  • 隋唐封神诀

    隋唐封神诀

    大隋年间,封家以《封神诀》成名然而世间并无人真正练成《封神诀》隋末,封家一名私生子横空出世《封神诀》再起争端武林封家力图接纳此子江湖豪强开始争夺此子然而这些人都不知道,其实《封神诀》从来都没有存在过!
  • 暗香浮动的午夜迷宫:光明古卷.流光劫

    暗香浮动的午夜迷宫:光明古卷.流光劫

    666,是恶魔的诅咒,还是天使的启示?最聪明的侦探,遭遇最完美的圈套。最痴情的男人,遭遇最绝望的爱情。最尖端的科技,遭遇最古老的神话。神秘的金色沙漏,阴森诡异的犀照馆,暗香浮动的异梦。一曲拨动时光琴弦的音乐,改变了几代人的命运。是功成名就,还是自我毁灭?是精神错乱,还是死于非命?不知不觉,这个世界已变得光怪陆离,死去的人再度复活,活着的人却早已死去……去过去,来未来。究竟是福?还是祸?尘埃落定之际,游戏却刚刚开局……
  • 伴歌而行

    伴歌而行

    职场就是江湖,直肠子的方媛在江湖上跌跌撞撞的闯荡,她不知道遇上音乐才子张铎是缘还是劫,她也不知道两个人应该修成侠侣还是应该相忘于江湖,后来在歌声中找到了答案。
  • 权门大少非常狂

    权门大少非常狂

    “你求我呀!”他阴沉着脸,视线紧盯着她提醒。“你知道的,只要你肯低下所有的尊严,自己乖乖躺到床上去,无论什么事我都一定会答应你。”全世界唯一配对弟弟血型的,就只有他,现在,弟弟人就躺在手术室里等着他的血救命。可,一旦这样做了,她又对不起深爱自己的竹马。这一刻,她有种快要被这个恶魔撒旦一般的男人给逼疯的节奏。没有他的血液提供,弟弟根本活不下去,在一次又一次的无奈下,她被逼着跟他不断发生关系。他想要她爱上他,可,越是逼迫,她越无法爱上他,反而觉得竹马给予的自由更令人向往。于是,一段揪心虐恋,虐身虐骨,就这样反复上演着。(本文纯属虚构,请勿模仿。)
  • 夺魂珠

    夺魂珠

    盘古开天之前,天地间是一片莽莽苍苍的混沌,乱世中的混沌有着强大的力量。女娲造人后,世界活了起来,是人类给这个世界增添了活力。有人就有魔,有魔就有神,这样天地才平衡。可是人和魔,生来就是对立的,此消彼长……江湖、仙界、魔道……魔界死灰复燃,卷土重来,江湖告急。无休止的争战,何时能够停息?
  • 秋梦

    秋梦

    我们每个人都在和命运做争斗,用内心最珍贵的东西,换回心中希望的结局。不同的人生有这不同的经历,在与命运撕扯未来的时候,回过头又有什么人在等待你陪伴你?