Google 搜索结果变得 less relevant - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
Kuso
V2EX    程序员

Google 搜索结果变得 less relevant

  •  
  •   Kuso 2014-03-26 08:40:42 +08:00 5840 次点击
    这是一个创建于 4303 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近越发明显地察觉Google搜索结果变得less relevant。搜索两三个关键词的时候,经常出现的是,第一个结果居然不能包括所有关键词,其他结果也很糟。
    搜了一下,发现从2011年就开始不停有人抱怨相关问题。最近的蜂鸟企鹅熊猫算法更新更是引起了这种抱怨。这篇http://www.idimmu.net/2013/10/15/google-becoming-less-relevant/列举了一个很典型的例子。Twitter上抱怨这个问题的也能搜出一把。
    而且即使我清空了G+圈子,不关注任何人,Google搜索结果里还是会出现不少G+相关的内容,而且很靠前,灰色小字标明该结果是by XXX - in XXX Google+ circles,摆明了就是在推G+红人的创造的内容。再加上同一个关键词每个人的搜索结果都不一样这个老早就被喷的问题,我简直快不能忍了。Duckduckgo的搜索结果质量虽不错但数量太少,而且中文搜索不怎么样。真心求Google替代品,找不到就还要忍。。。。Chrome我是快忍不下了,早晚换回Opera,反正扩展能通用了。其他Google产品的闹心事最近也有不少,但还是不提了。。。
    41 条回复    1970-01-01 08:00:00 +08:00
    Kuso
        1
    Kuso  
    OP
       2014-03-26 08:43:56 +08:00
    真心的,最近的搜索结果惨不忍睹,别告诉我只有我一个人是这样。
    zhouzm
        2
    zhouzm  
       2014-03-26 09:02:59 +08:00
    可以这么解释,开发人员认为研发出了更聪明,更强大的算法去代替旧算法,但实际上,新算法并没想像中那么厉害。

    要不是今天看到你的帖子,还真没注意到这个现象的,所以“惨不忍睹”的评价感觉有点过了。

    链接中提到的例子,如果给 SIP 加上引号变成 “SIP”,就算不能把目标页面提到第一,也能提到第二的位置了,反正这种非热门搜索结果,很少有机会一次就能搜到的,改变关键字组合反复搜是经常的事。
    Kuso
        3
    Kuso  
    OP
       2014-03-26 10:27:38 +08:00   1
    我懂得尝试不同关键词和加上搜索语法,也知道搜索经常是反复尝试才可能得到满意的结果。

    但是其Bing和Duckduckgo在相关性上至少不会第一条结果连两三个关键词都凑不齐。最近经常碰到这种情况,多个关键词之间关系稍一复杂或者关联度较小,Google就抽了(也就两三个关键词,不是特别多),加上引号会更抽,直接显示no results,而以前绝不会这样。因为习惯性清空历史记录,而且关闭了搜索历史,所以一时又找不到合适的例子。

    我感觉是Google在推conversational search,或者说在向基于语义网的搜索努力。所以不再那么重视关键词匹配,而是试图猜我的意思,直接给出我想要的答案。 但是,我有时候都不知道自己想要什么答案,只想获得尽可能多的相关信息并从中筛选。对于多个关键词组成的非热门搜索,猜测显然会失败,它应该并且能够自动判明这一点,切回传统模式的搜索结果,而不是坚持显示出一堆毫无关联的猜测结果。

    Google因为整合桌面和移动端而造成的矛盾越来越多(其实就是一切都移动化,谈不上整合)。至少要搞清楚桌面上的复杂查询和移动端的日常简单问答查询完全不一样,没有规律的行为模式和大量数据支持,很难猜中。
    est
        4
    est  
       2014-03-26 10:41:14 +08:00   2
    @Kuso

    其实你反过来想一想。现在能产生高质量内容的公开可索引网页还有多少?

    个人网站的时代早就死掉了。机构网站也基本都是摆设。公司网站都要么是营销bullshit要么万年不更新。

    公开互联网已经没有高价值内容了。
    Kuso
        5
    Kuso  
    OP
       2014-03-26 11:02:29 +08:00
    @est

    国内的情况确实如你所说。我也发现自己越来越频繁地换成英文搜或者跑到Google台湾用繁体字搜,以至于有时候一开始就直接搜英文,放弃用中文,尤其是搜比较关注的新闻的时候,不想看满眼一模一样的通稿,只是被各大媒体转载。
    yylzcom
        6
    yylzcom  
       2014-03-26 11:06:32 +08:00
    “同一个关键词每个人的搜索结果都不一样这个老早就被喷的问题”

    这个我觉得不应该被狠喷,每个用户的需求肯定是不一样的,推荐的结果也理应不一样才对。只不过搜索出来的结果还是没有很好满足客户的需求才使得结果差异化成为问题
    lm902
        7
    lm902  
       2014-03-26 11:22:43 +08:00
    换用Bing即可
    Kuso
        8
    Kuso  
    OP
       2014-03-26 11:23:50 +08:00
    @yylzcom
    理论上这样是不错,但实际上Google做的并不好,徒增SEO难度,对用户帮助也不大,带来的混乱更多。

    最要命的是,如果我经常浏览左派媒体,然后慢慢地右派媒体在搜索结果中出现的越来越少,我能接受吗?不能,我还想听到不同的声音,而不是在Google的“好心”帮助下变成固执己见的人。

    感兴趣的话可以搜一下这个话题,Google因为这个没少被喷,相比更好满足需求,客户更多感觉到的是越俎代庖。
    Keinez
        9
    Keinez  
       2014-03-26 11:24:53 +08:00 via Android
    长期英文完全没感觉到会有找不到资料的情况出现……反而经常会关联出更有价值的资料。
    Kuso
        10
    Kuso  
    OP
       2014-03-26 11:29:30 +08:00
    @lm902

    现在是GDB配合使用,觉累不爱。
    Kuso
        11
    Kuso  
    OP
       2014-03-26 11:38:38 +08:00
    @Keinez @zhouzm

    试试这个关键词“google search results less relevant” 同时在Google和Duckduckgo上搜,结果对比很明显。Google第一个结果不能完全匹配每个单词,紧接着的几个结果都是G+相关的结果,甚至还不如第一个。我不是在找答案,而是找信息,相关匹配的信息,Google这样搞显然是在自作聪明。
    est
        12
    est  
       2014-03-26 11:41:49 +08:00   5
    我来给你们说怎么让google听话:

    1. 把这个设为默认搜索引擎 https://203.208.36.19/search?gbv=1&tbo=1&as_qdr=all&hl=en&num=50&q=%s
    2. 关闭这个ip的Javascript执行和cookie读写权限


    你会发现搜索速度和结果都碉堡了。
    Kuso
        13
    Kuso  
    OP
       2014-03-26 11:58:58 +08:00
    @est 麻烦问下第二步要怎么做才能实现
    cbsw
        14
    cbsw  
       2014-03-26 12:01:01 +08:00
    不说还真没注意,搜索结果关联性的确降低了
    dorentus
        15
    dorentus  
       2014-03-26 12:12:19 +08:00
    搜「font alias」,「aliasing」和「smoothing」也变关键词了。
    前段时间搜「mruby+关键词」,必然会变成「ruby+关键词」,最近它终于知道 mruby 是和 ruby 不一样的了……
    搜「https CDN」,「http」也被匹配了……
    dorentus
        16
    dorentus  
       2014-03-26 12:13:19 +08:00
    Google plus 不用的话,注销掉就好了(然后除了登录 Gmail 的时候经常会被提示创建 G+ 档案之外,倒是没啥别的事)
    est
        17
    est  
       2014-03-26 12:20:31 +08:00
    @Kuso chrome://settings/content
    Kuso
        18
    Kuso  
    OP
       2014-03-26 12:23:06 +08:00
    @dorentus

    它在学习猜测并给出答案,但目前来看注定是差生。
    Kuso
        19
    Kuso  
    OP
       2014-03-26 12:27:44 +08:00
    @est got it! Manage exceptions.
    virushuo
        20
    virushuo  
       2014-03-26 12:27:51 +08:00
    @est 同意公开互联网有效信息越来越少的看法。所以我现在主要用ddg。他对几个目标社区比如so给了极高权重,结果我竟然发现大部分我要找的东西都在那几个社区里面,反而比用google省事。现在google搜索对我最大的意义是有一些讨论在google groups里面,别人索引的太少。
    myang
        21
    myang  
       2014-03-26 12:32:50 +08:00
    @Kuso 我搜索google search results less relevant第一个结果匹配了所有关键字并且翻了6、7页也没g+结果。我是在一个频繁使用g+的账号登陆状态下搜索的,和你说的情况怎么完全不一样。
    Kuso
        22
    Kuso  
    OP
       2014-03-26 12:48:47 +08:00
    @est 试了下,搜索结果有了下划线,字体变小,回到了老版搜索的界面,但搜索结果和搜索结果的排序还是没变,G+相关内容依然存在,只是没有用灰色小字标出来。
    Kuso
        23
    Kuso  
    OP
       2014-03-26 13:00:44 +08:00
    @myang

    Did Penguin Make Google's Search Results Better Or Worse?
    by Danny Sullivan - in 1,758,126 Google+ circles (注意这行灰色小字)

    这是第二个结果,第三和第四也是类似的,都有灰色小字标注G+帐号,点击进去就是记者的G+主页。当然文章本身不是在G+,但这无疑是在推G+记者创造的内容和G+本身。G+帐号成了很高的权重,占据2-4的位置,没有G+帐号的记者的文章可没这个待遇。所以我说这是“G+相关内容”而不是“G+内容”。
    dorentus
        24
    dorentus  
       2014-03-26 13:04:10 +08:00
    搜索 mrb_include_module,出来的结果还是挺正常的,不过提示「您是不是要找: mrb include_module」,于是「mrb include_module」和「mrb include module」的结果都是这样,哈哈:

    joyee
        25
    joyee  
       2014-03-26 13:06:47 +08:00
    这么一说确实察觉到最近用google搜索的时候用引号的频率提升了不少,都是因为开头的不少结果没把关键词包全,看标题似乎有点符合意向,兴冲冲点进去一页内搜索发现根本找不到想看的东西,中文英文都有这个现象。
    Kuso
        26
    Kuso  
    OP
       2014-03-26 13:13:41 +08:00
    @dorentus

    不登录Google帐号的情况下搜索,也会显示G+相关内容。这算是强推吧,已经把G+纳入权重了。
    RangerWolf
        27
    RangerWolf  
       2014-03-26 13:16:16 +08:00
    @est 确实碉堡了!
    vibbow
        28
    vibbow  
       2014-03-26 13:21:42 +08:00
    注销Google Plus即可。
    myang
        29
    myang  
       2014-03-26 13:24:02 +08:00
    @Kuso 不知道为什么大家对g+这么反感,事实上没有g+的时候你的搜索结果也无非是这样的,而现在有g+的时候,很多作者,特别是你这种搜索关键词属于it类别,it类的绝大多数作者都在g+上,然后google无非把作者给标记出来了而已,并不是因为给予了特别高的权重。当然我并不反对google搜索表现的起伏,只是觉得好多人反感g+于是无处不黑g+……
    est
        30
    est  
       2014-03-26 13:27:19 +08:00
    @virushuo 是的。虽然说newsgroup已经死了20多年了,但是死掉的骆驼比马大。没有archive机制的wwwi现在可以看成是快消行业。lol 之后就没有然后了。
    myang
        31
    myang  
       2014-03-26 13:33:52 +08:00
    @Kuso 你搜个别的试一试,随便想一个非it类的比如搜big bang,保准你翻n页也没有g+的灰字,这并非因为g+上没有big bang的内容,而是有价值的、搜索靠前的文章的作者多半不在g+上。所以要搞清楚这个灰字是什么意思,搞清楚先后关系,它并非推广g+,并非对搜索结果有什么粗暴干预,而只是简单的判断如果作者在g+上则给个连接,让你更容易去看同一作者的其他文章而已,连所谓“g+相关内容”都谈不上,只是因为大家看到g+这几个字产生了反感而已。
    Kuso
        32
    Kuso  
    OP
       2014-03-26 13:40:22 +08:00
    @myang

    你说的我理解,可关键是,它出现的太靠前了,相关性也很差,你可以换一些关键词,G+相关结果,如果有的话,一定是在第一页的前五名,大部分情况下还是第二。同一关键词,别的搜索引擎可不会给G+记者的文章这么高的权重。

    另外,G+没什么,强推就很难没有一点反感,而且我是在黑Google search。
    ChiangDi
        33
    ChiangDi  
       2014-03-26 13:46:36 +08:00 via Android
    我感觉越来越好le
    myang
        34
    myang  
       2014-03-26 14:00:54 +08:00
    @Kuso 或者回到你最先的例子google search results less relevant,用google、bing、yahoo、ddg同时搜索,结果是:

    1、google第一页全部是相关内容,而其他三个引擎在前五中就出现了无关内容,即google自己的宣传页面Facts about Google and Competition,ddg前5条中甚至有3个无关内容

    2、你说的那个结果did Penguin xxxx在我这里的搜索排名google里排第3,yahoo第4,bing第5,ddg第6,考虑到第一条yahoo、bing和ddg在前5中有无关内容,假设人为排除无关内容后yahoo第3,bing第4,ddg第3,和google的结果没有什么本质区别,唯一的区别是别的搜索引擎不会给作者加上g+链接而已

    3、google的结果起伏确实比较大,因为我推测google对于算法的调整和尝试比较频繁,但对搜索结果权重特别关照强推g+实在不能苟同
    virushuo
        35
    virushuo  
       2014-03-26 14:05:50 +08:00   1
    @est blog还是有价值的。社区是有价值的。SNS加剧了你说的“没有archive机制的www”。我一直有个看法就是信息中心会回归社区。
    est
        36
    est  
       2014-03-26 14:08:28 +08:00
    @virushuo 去你的blog看了一眼,8个右边的badge挂了3个。。。。写blog时间跨度越来越大。没有互动是主要原因吧?hahaha。。。
    Kuso
        37
    Kuso  
    OP
       2014-03-26 14:26:40 +08:00   1
    @myang

    1. Did Penguin xxxx在你那边排第3,在我这边是第2,所以真的是每个人的Google搜索都不同。(这个无关紧要)
    2. 我这边,紧接着还有2条也是有G+灰色小字的结果。和Bing、DDG的结果对比后,能够得出和你大致一样的的结论。但有G+提示的结果在Google中都比其他引擎要排的高出几名,当然也可以认为这不影响本质,差别也不大,可能是偶然。
    3. 我这边的第6条结果来自Quora 『Have Google Search results have become less relevant ... - Quora』,但相关性上要比2-5要好很多(我这边的2-5全都有G+提示),却只能屈居。当然这也不足说明什么,也可能是偶然。
    4. Google给G+高权重这个说法确实不对,我一开始那样讲是欠考虑。但我也真的不能认同Google对有G+提示的结果的排序。
    Kuso
        38
    Kuso  
    OP
       2014-03-26 14:39:26 +08:00
    @myang

    发现搜索结果相关性差,而且下面一水都有G+小灰字提醒的时候,真是感觉such a pain in the ass! 搜索时最反感事就是结果不公正了吧,Google不能避嫌么?或者说这样温馨提醒真的合适么?因为反正这些记者的文章大部分都是工作上的新闻稿,一般太可能发布在G+上,点进去看到的只是G+,没有其他文章。
    inee
        39
    inee  
       2014-03-26 15:59:04 +08:00 via Android
    这几天,google把他的blog选项隐藏了,不知道为什么
    vivianalive
        40
    vivianalive  
       2014-03-27 00:58:58 +08:00
    请用英文在英文的Google上搜索.
    Google的中文搜索结果, 有时候净是一堆百度的东西.
    robbielj
        41
    robbielj  
       2014-03-27 09:22:48 +08:00
    搜索结果不要private results不是可以设置么,左上角有个切换是否包含private results,就是有可能从G+这些相关产品中通过自己的profile推过来的结果。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5447 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 07:45 PVG 15:45 LAX 23:45 JFK 02:45
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86