写网站程序时, url 的页码数值超出最大页面数量,该返回什么对搜索引擎友好一些 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ranran
V2EX    问与答

写网站程序时, url 的页码数值超出最大页面数量,该返回什么对搜索引擎友好一些

  •  
  •   ranran 2014-12-13 09:04:28 +08:00 3387 次点击
    这是一个创建于 3986 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如说 分类下 有98页内容 但是却有一个url为99的被收录了

    简单说明,该列表为文章列表,目前数量有98页
    list.php?page=98

    但是搜索引擎收录了一个这样的网址(看了下快照,里面显示的是一个没有文章的列表页[也就是一个“没有可是显示的记录”的提示,是我自己当初判断页码超出最大页面值后输出的一个提示])
    list.php?page=99
    [内容和前面的列表页一样,没有返回500或者404错误,只是在列表内容部分显示了一个没有可以显示的记录]

    那么问题出来了,按理说这样的页面属于不存在的,应该返回404错误,但是如果返回404,搜索引擎会不会很长时间都跳过这一页不去收录了呢……

    返回500错误也不对,据说搜索引擎遇到这样的页面,会认定这个页面暂时发生错误,晚点会再来看看(502之类也会相同处理,可能频率上有所不同)

    那么还有可以选择的就是301和302,301是永久性跳转,告知该页面永久性迁移到某个网址……而302是临时性跳转……





    所以问题出来了,你们处理这种情况的时候,是返回什么错误代码呢,是否页面跳转到其他地方去呢?

    之所以要处理这样的情形,主要是因为这样的情况出现的可能性还是可能会多次存在……如果都让搜索引擎去判断和收录,那会造成重复收录的情况吧……(就是很多网址都是完全相同的内容)

    所以如何告知搜索引擎,这个页面是不存在的,但是以后它还是可能会存在的……

    我比较想用跳转,跳转到该栏目或者分类的第一页列表…… 但是不知道该选择301或者302,或者用js去跳转?
    10 条回复    2014-12-13 21:30:47 +08:00
    loveyu
        1
    loveyu  
       2014-12-13 09:36:34 +08:00
    应该直接404吧,既然没有这一页那这个链接怎么冒出来的。还有现在404不代表搜索引擎永远不来了吧,应该可以通过sitemap更新的
    Busy
        2
    Busy  
       2014-12-13 09:37:59 +08:00
    程序逻辑上去解决,而不是事后去补救,顺带耍一下搜索引擎。

    现在还有研究seo的啊,总原则就是把搜索引擎当作一个访客就行,搜索引擎越来越智能化了
    scys
        3
    scys  
       2014-12-13 09:59:22 +08:00 via Android
    第一页
    imn1
        4
    imn1  
       2014-12-13 10:15:57 +08:00
    如果搜索引擎已经开始收录,它会很频繁来爬的,不用担心“长时间”
    其实可以参考大站的做法,大站一般都是比总页数多一页的,最后这一页放同类题材的介绍、导航,特别是图片是这样,文章就很少这样,会算清楚
    RobberPhex
        5
    RobberPhex  
       2014-12-13 10:30:57 +08:00
    首先301肯定不能用,因为你没有**永久**重定向。
    其次50x也不能用,因为确实在程序预料之中。

    从语义上来说,404表示没有找到,302表示页面临时移动,所以推荐404。

    这个问题具有参考价值(不过没有讨论302和404直接的区别):
    http://webmasters.stackexchange.com/questions/43102/what-google-will-do-while-switching-from-301-404-to-200
    ranran
        6
    ranran  
    OP
       2014-12-13 10:47:24 +08:00
    @loveyu
    @RobberPhex 恩 综合考虑下也只能是用404了,不过在其他地方的404我都是用301跳转回栏目,因为那种404基本就是永久的404了,所以直接301就好了,这个就用404好了,谢谢!


    @Havee 虽然说是越来越智能了,但是还是考虑下比较好,真的……

    @scys = =!如果是直接显示第一页,还是会产生很多重复页啊……


    @imn1 嗯 决定用404了,本来就不是正确的页面
    bjzhush
        7
    bjzhush  
       2014-12-13 11:17:27 +08:00
    404 Not Found
    laoyuan
        8
    laoyuan  
       2014-12-13 12:25:00 +08:00
    最后一页内容
    dorentus
        9
    dorentus  
       2014-12-13 14:23:56 +08:00 via iPhone
    404

    另外按相关 RFC 里面的说法,user agent(浏览器、搜索引擎、代理服务器)必须把 404 当成一个临时状态。
    ranran
        10
    ranran  
    OP
       2014-12-13 21:30:47 +08:00
    @bjzhush
    @laoyuan
    @dorentus 谢谢,已经改成404状态码
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1004 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 19:26 PVG 03:26 LAX 11:26 JFK 14:26
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86