V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
WildCat
V2EX  ›  分享发现

百度真贱啊!用 Google 搜网盘,直接点链接百度直接出来 404,复制链接反而可以,看样子百度对 Google 的来源做了特殊处理

  •  
  •   WildCat · 2014-06-11 18:35:36 +08:00 · 7950 次点击
    这是一个创建于 3853 天前的主题,其中的信息可能已经有所发展或是发生改变。
    https://www.google.com.hk/search?q=coffescript+site%3Apan.baidu.com&oq=coffescript+site%3Apan.baidu.com&aqs=chrome..69i57.437j0j9&sourceid=chrome&es_sm=91&ie=UTF-8
    比如结果第一个链接,直接点链接提示404,复制URL pan.baidu.com/s/1BXdsa 就可以了。



    百度搜网盘资源,提示找不到;只能用Google搜。
    18 条回复    2014-06-13 00:16:59 +08:00
    niseter
        1
    niseter  
       2014-06-11 18:38:40 +08:00   ❤️ 1
    Referer:https://www.google.com.hk/ in Headers
    sneezry
        2
    sneezry  
       2014-06-11 18:49:40 +08:00 via iPhone
    我这边正常。百度如果不希望Google抓取结果,直接robots里写就是了,相反,googlebot是百度网盘允许的为数不多的蜘蛛之一。如果百度有意404来自Google的流量,用户不会认为这是Google的问题。
    vbs
        3
    vbs  
       2014-06-11 19:10:22 +08:00
    我这毫无压力,正常打开。
    lz看看404的那个url是不是和显示的不一样?
    Delbert
        4
    Delbert  
       2014-06-11 19:21:48 +08:00
    打开很正常啊, 用 hk 和 ncr尝试都没问题啊。
    RecursiveG
        5
    RecursiveG  
       2014-06-11 19:22:00 +08:00
    似乎的确是这样,用curl测试,如果加上google的referer就会跳转到404页面
    decken
        6
    decken  
       2014-06-11 19:35:57 +08:00
    同楼主,不过wap站点的可以正常访问
    11138
        7
    11138  
       2014-06-11 19:37:48 +08:00
    测试了前面几个连接,点击过去确实是404提示,如果复制链接直接打开就正常,证明百度针对Referer来自google作了特殊处理。

    是不是想让用户觉得google的结果不正确啊。。。

    http://pan.baidu.com/robots.txt
    既然允许googlebot,点击过去又是404, 作为上市公司。。。
    11138
        8
    11138  
       2014-06-11 19:41:58 +08:00
    更新一下:在bing点击过去也是404页面。
    goojia
        9
    goojia  
       2014-06-11 20:11:05 +08:00
    真的是这样,好无耻
    est
        10
    est  
       2014-06-11 20:25:05 +08:00
    这是为了规避美国、欧洲版权公司发现版权内容吧。。。。
    nilennoct
        11
    nilennoct  
       2014-06-11 20:29:22 +08:00
    safari 可用 gDirectLinks.
    can
        12
    can  
       2014-06-11 20:37:45 +08:00
    同意2L,是不是缓存什么的问题
    c742435
        13
    c742435  
       2014-06-11 20:38:28 +08:00
    RT @est 这是为了规避美国、欧洲版权公司发现版权内容吧。。。。
    YouXia
        14
    YouXia  
       2014-06-11 20:39:10 +08:00
    以前是可以的,无责任猜测下:
    因为上边指示要打击不健康东西,百度为了打击那些提供百度网盘搜索的网站,于是限制了referer。

    但是程序员逻辑没搞好,没有过滤掉几大搜索引擎的referer,于是就出现这种问题了。

    凭感觉,很大概率是因为程序员代码逻辑问题。
    xinhugo
        15
    xinhugo  
       2014-06-11 20:50:45 +08:00
    解决方案:Referer Control

    https://chrome.google.com/webstore/detail/referer-control/hnkcfpcejkafcihlgbojoidoihckciin

    「://*.baidu.com/」 From referer host 「[www.baidu.com]」
    andyhu
        16
    andyhu  
       2014-06-11 22:41:35 +08:00
    没关系,google可以毫不费力的报复他,在用baidu搜索google drive的时候,连404都不给它跳出来:)
    faceair
        17
    faceair  
       2014-06-11 22:49:33 +08:00
    @andyhu 百度上根本搜不到google drive XD
    oversleep
        18
    oversleep  
       2014-06-13 00:16:59 +08:00 via iPhone
    @est 感觉这个可能性比较大
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2576 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 07:19 · PVG 15:19 · LAX 23:19 · JFK 02:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.