怎样写爬虫才会吃公家饭(坐牢)?法盲求助 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
signal
V2EX    Python

怎样写爬虫才会吃公家饭(坐牢)?法盲求助

  •  1
     
  •   signal 2020-02-13 20:51:48 +08:00 9300 次点击
    这是一个创建于 2066 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景

    有一个上网课的网站,有的热门老师的课很抢手,所以写了个程序,帮人自动约课。

    严格上说也不是爬虫,但是也会定时抓取一些老师的课程信息。

    要素

    这个程序涉及的几个要素,我不确定有没有违法:

    1. 需要登陆才能获取老师信息(会不会涉及《非法获取计算机信息系统数据罪》?)
    2. 本来自用,后来放到网上,给其他人一起使用
    3. 需要约课需要用户提供账号密码(会不会涉及侵犯隐私?)
    4. 免费用户可以获得开课提示,收费用户可以自动约课(会不会涉及某种非法牟利?)
    5. 如果违法,是按利润处罚还是收入处罚,利润还没有,收入几个月了,才几百块钱

    这个程序,类似分流抢票这种工具,

    对不使用程序的人会造成一些不公平,但我不确定到底舍不涉及违法,甚至犯罪。

    所以在一些学生举报后,

    该网课公司应该收集了一些什么证据,前天,一个工作人员说,他们

    已经开始走法律程序了已经开始走法律程序了已经开始走法律程序了

    楼主没见过啥世面,慌的不行,马上暂时关了服务,在线求助。

    参考

    我看到分流火车票还做了一个声明,大意是,

    1. 免费
    2. 无害
    3. 免责
    4. 无毒
    5. 隐私

    因为分流火车票还可能被利用后,涉及倒卖火车票的违法风险,所以风险应该比我的更大。

    它也有 VIP 加速订票,不过是以赞助的形式。

    酬谢

    另外,我十分需要了解一下这个产品如果后面推广、量产后的刑事和民事风险。

    如果有熟悉数据、网络、反不正当竞争等这一块法律、提供咨询服务的律师,

    愿意接受 4 位数的价格,请联系邮箱:ikuaikan{at}outlook.com

    我需要规避风险的规划、出一个免责声明之类的东西。

    如果有引荐成功的,我也会发个 200 块钱红包表示感谢

    题外话

    本来是给其他同学免费用的,后来服务器不够用了,就收了点钱,贴补一下服务器费用。

    如果将来真的有利润,我也愿意捐助一半给失学儿童上学,并且公示,

    以此来填补之前所说的可能造成的选择老师的不公平。

    先行谢过大佬提点

    30 条回复    2020-02-14 17:27:21 +08:00
    andylsr
        1
    andylsr  
       2020-02-13 21:02:57 +08:00
    有商业行为了, 八成要凉凉
    rekulas
        2
    rekulas  
       2020-02-13 21:03:19 +08:00
    严格来说,是违法了,其实大部分的爬虫工作都在违法或在违法的边缘,只是大多数情况下对别人影响不大懒得理会而已,纵观近几年的爬虫判刑的,大多是给别人造成了损失 /或是同时还有其他违法事宜一并处罚的,真正单纯因为简单爬虫处罚的还没发现,还是如↑因为别人懒得理你,但是如果按你所说已经开始理你了,感觉你还是有风险的,对方网站还需要登录,你完全处于被动局面
    neurocomputing
        3
    neurocomputing  
       2020-02-13 21:07:03 +08:00
    恕我直言,屁大点事
    signal
        4
    signal  
    OP
       2020-02-13 21:13:43 +08:00
    @andylsr
    @rekulas
    能解释下分流抢票,携程抢票这些吗?
    比较疑惑的是,他们如果都是违法的,那 12306 为啥不告他们呢?
    em70
        5
    em70  
       2020-02-13 21:23:16 +08:00   2
    一般都是先发个律师函,你不理才走法律程序,毕竟走程序费用很高,如果不能稳赢或者赔偿足够高,没人愿意走,所以就算大公司都会发个律师函吓一吓,迫不得已才打官司

    针对楼主的事,既然已经停止服务了,就不用担心了,对方要举证挺难的,在线证据需要公证,得花个几千块
    rekulas
        6
    rekulas  
       2020-02-13 21:28:00 +08:00   4
    我的理解是,12306 不想告
    原因可能有很多 抢票软件在过去数年已经更新了数个版本,并做到了一个微妙的平衡状态,所谓的平衡就是在对 12306 造成较小压力的情况下,又能保证少部分用户确实能抢到票(刚出来的时候,抢票软件有点流氓,12306 压力山大,后面不知道他们是不是有个沟通,陆续更新降低了压力),如果 12306 起诉抢票开发团队,从法律上来说基本稳赢,但是 12306 会面临这些风险
    1 抢票开发团队有不少是来自国内知名的巨头团队,公开撕破脸可能会面临一段时间内大佬的敌视
    2 抢票在很多人的心中是正义行为,本来现在大家对 12306 就不满,如果起诉,那比上面的还严重了,会面临可能上亿人的批判
    所以现在大家都保持一个微妙平衡,只要你不做的太过分,睁一只眼闭一只眼了
    neurocomputing
        7
    neurocomputing  
       2020-02-13 21:40:21 +08:00   3
    这个事,其实包含了用户对你的一种授权,即授权为了抢课获取他登录后的一些内容;
    此外,你没有获得这个网站不同意其用户知晓的内容(比如一定要通过破解通过黑进去来获得的内容);
    另外,用户使用你这个工具,你应该没有获取与其抢课无关的信息吧。

    非法获取计算机信息系统数据罪的客观要件包括:“侵入”是指行为人采用破解密码、盗取密码、强行突破安全工具等方法,在没有得到许可时违背计算机信息系统控制人或所有人意愿进入其无权进入的计算机信息系统中,常见的方式是利用他人网上认证信息进入计算机信息系统。

    显然这个爬虫程序不符合“侵入”的定义,因为用户名和密码(或者 token )是用户主观自愿给的,而且通过此登录信息仅能看到该用户的信息,看不到其他用户及其他这个用户本不应看到的信息。
    zxcslove
        8
    zxcslove  
       2020-02-13 21:41:36 +08:00
    这个问题上,有话语权的都是外行啊,无奈不
    Haku
        9
    Haku  
       2020-02-13 21:44:50 +08:00   1
    我觉得你应该去咨询律师而不是过来问网友。。。。他们的回答肯定比这里的大多数人靠谱
    heiheidewo
        10
    heiheidewo  
       2020-02-13 21:48:28 +08:00
    本质上只要你没有侵害原创者的利益,基本不会去鸟你的,就像盗版小说网站和正版网站之间一个微妙的平衡一样,正版小说需要盗版网站去宣传知名度
    licoycn
        11
    licoycn  
       2020-02-13 21:58:15 +08:00
    最终解释权归 xxx 所有
    lc7029
        12
    lc7029  
       2020-02-13 22:00:41 +08:00
    最终解释权归 XX 所有,所以想办你不需要理由
    signal
        13
    signal  
    OP
       2020-02-13 22:18:10 +08:00
    @neurocomputing 谢谢,我理解的一致。
    我没有获取其他信息。
    但是我感觉但从法条上看的话很难认定,但案例又找半天没找到相关的。
    https://baijiahao.baidu.com/s?id=1638842773561706728&wfr=spider&for=pc
    这个新闻里面,抢车牌号的朋友已经吃公家饭了


    @Haku 已经咨询过律师朋友,但是律师不是所有范围的法律都熟悉,而我又不认识那么多律师,所以也是来求助的一个原因。
    如果您又合适的,可以帮我推荐一下,谢谢
    aydd2004
        14
    aydd2004  
       2020-02-13 23:09:19 +08:00 via iPhone
    这么说吧 只有人家求你爬的站 才不违法 比如那些盗版视频 ooxx 视频站 这些站不仅让你爬 还开放接口
    其他的 我们还是算了吧
    wwlweihai
        15
    wwlweihai  
       2020-02-13 23:29:38 +08:00   1
    根据我的经验,你有背景,怎么写都不吃牢饭。

    社会主义下正道只有一条,生产合法的产品,合法的销售,赚钱合理的利润,像外企一样;
    muzuiget
        16
    muzuiget  
       2020-02-14 00:06:10 +08:00
    我也想知道,有没有权威解答。怎么那些商业比价工具或网站抓淘宝和京东的数据,也是活得好好的?
    johnnyR
        17
    johnnyR  
       2020-02-14 01:29:03 +08:00
    @wwlweihai 什么都能扯到什么主义上去,世界上任何一个国家和地区都这样吧?生产合法的产品,合法的销售,赚钱合理的利润,难道有一些国家非法的不抓?还有,现在不是十年前!还背景,在里面啥人都有照样办你,送钱的少?最后还 TM 加重了
    johnnyR
        18
    johnnyR  
       2020-02-14 01:35:14 +08:00
    以我经验,强烈建议去咨询律师,律师也有很多种,有擅长刑事案件的,有擅长经济纠纷的,也有擅长交通事故的,更有擅长情感财产的...去咨询擅长网络案件的,通常这样的律师经常与网络赌场、网络诈骗等案件辩护,费用一般 800~1000,也有更低的 500RMB
    jadec0der
        19
    jadec0der  
       2020-02-14 02:44:54 +08:00
    vipkids?
    globetour
        20
    globetour  
       2020-02-14 09:04:14 +08:00
    收到律师函你终止行为就没事了,又没给他们带来什么损失,谁都不想麻烦。
    你只是辅助工具,并不是同行竞争网站。
    终止行为,并且把链接导向到他们的官方登录入口,态度诚恳一些,不会有问题。
    话说回来,如果别人较真,你肯定是败的一方,不管从哪个角度来说,你都不占理啊。
    这种事情,除非你给别人造成很大的损失,一般人家不会找你麻烦,不然他们自己也麻烦。
    mcfog
        21
    mcfog  
       2020-02-14 09:26:37 +08:00 via Android
    个人理解,这里核心不是爬虫(读数据)而是写数据,换句话说,篡改 /影响信息系统的运行,还收钱,做大必死

    @neurocomputing 只要是有正常法务的公司,出的 eula 里基本上肯定要求用户保管自己密码不得泄露,账号不得共享等等,用户是没有权利通过提供密码“授权”第三方进入 /使用自己的账号的
    iheshix
        22
    iheshix  
       2020-02-14 09:37:51 +08:00
    @Haku 正确答案!
    @signal 没让你找朋友。找律师的意思是,直接找到律师事务所,直接花钱咨询知识产权相关的律师。
    jayin
        23
    jayin  
       2020-02-14 09:57:50 +08:00
    四位数报酬留着给赔偿把。
    way2create
        24
    way2create  
       2020-02-14 11:04:19 +08:00
    不太懂 不过感觉有时候得看倒霉不倒霉 想不想搞你
    crella
        25
    crella  
       2020-02-14 12:26:12 +08:00 via Android
    这怎么看着有点像高考的内卷?最后逼到每个人都自学 python 或者 c#搞爬虫,服务器罢工,大家排队到办公室抢课.gif
    betulac
        26
    betulac  
       2020-02-14 14:32:18 +08:00
    别被人抓到就行,说实话几家 OTA 都是互相爬,而且是疯狂爬,也没看谁告了谁
    cocowind
        27
    cocowind  
       2020-02-14 15:24:34 +08:00
    这个真的是看别人脸色的...不想搞就不理,搞就一个准...,现在只能爬爬国外的网站...应该没人鸟我吧
    winglight2016
        28
    winglight2016  
       2020-02-14 16:11:09 +08:00
    恕我直言,在现在的大环境,lz 更应该考虑如何避免被直接抓到证据,比如,严格的会员推荐制度,代理池,以及控制运营规模,别想着靠这个“直接盈利”,就没什么大问题。

    会员量上去了,变现途径太多,我就不一一列举了。
    lyminghao
        29
    lyminghao  
       2020-02-14 17:09:58 +08:00
    不是律师,只谈谈个人想法。楼主上面发的抢注车牌号的案子,判决书在这里: https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=8ec7edb0df5c4c9ca051aa950164e45e

    可以看出现在爬虫类犯罪的成罪门槛很低:只要开发了爬虫工具并以此盈利,不需要其它情节就可能成罪。所以如果对方公司向警方报案的话,不排除被立案侦查的可能性。
    himesens
        30
    himesens  
       2020-02-14 17:27:21 +08:00
    违法,可大可小,看对方想不想管。
    这种灰色地带就不要考虑做大了,犯不着,自己和少数人用用就得了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     4048 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 00:13 PVG 08:13 LAX 17:13 JFK 20:13
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86