Python 传输大数据 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
jxwho

Python 传输大数据

  •  
  •   jxwho Feb 21, 2014 5227 views
    This topic created in 4454 days ago, the information mentioned may b changed or developed.
    想问一下,假如在两个点之间用python来进行数据传输,数据可能比较大,有什么好的模块可以用呢?
    类似的,可以用socket进行通讯,但是想要一个更high level的实现,请问有什么建议吗?
    14 replies    1970-01-01 08:00:00 +08:00
    clino
        1
    clino  
       Feb 21, 2014
    gaicitadie
        2
    gaicitadie  
       Feb 21, 2014
    FTP模块不行吗?
    nooper
        3
    nooper  
       Feb 21, 2014
    连数据的种类和数据的类型都没有说清楚。
    jxwho
        4
    jxwho  
    OP
       Feb 21, 2014
    @gaicitadie FTP模块我也考虑过...我想搜集多一点方法然后分析下取哪个比较合适

    @nooper 数据的种类和类型貌似不是很重要吧?
    xiaogui
        5
    xiaogui  
       Feb 21, 2014
    需要考虑:
    1、网络。两个点是服务器同一机柜、同一机房、公司内网或者其他?
    2、数据量。M?G?
    3、频率。一次结束?还是周期性?
    jxwho
        6
    jxwho  
    OP
       Feb 21, 2014
    @xiaogui 抱歉问题没描述清楚。
    是这样的,比如说我这里有一堆数据要处理,而另一台电脑上有合适的模块之类的可以用来处理(因为这个电脑是随机的,所以应该是不同的网络下,一般),然后我要把数据传送到这个机子上去,待它处理完之后,返回结果给我。
    数据量,我觉得上G应该不过分。
    频率:这个不是很理解你的意思。这个想法就类似复用,可能很多个用户需要的模块都在那一个用户的电脑上,就会全部向他请求。
    holmesabc
        7
    holmesabc  
       Feb 21, 2014
    RPC么
    jxwho
        8
    jxwho  
    OP
       Feb 21, 2014
    @holmesabc 啊,貌似是的。(其实我对这个还不是很了解
    clino
        9
    clino  
       Feb 21, 2014
    这种需求我觉得可以用自动构建,如用jenkins,buildbot之类的
    像buildbot的master和slave有接口可以交换文件或数据,slave的stdio也有web页面可以看
    wangfengmadking
        10
    wangfengmadking  
       Feb 21, 2014
    随便找个数据库不就解决了
    jxwho
        11
    jxwho  
    OP
       Feb 22, 2014
    @wangfengmadking 数据库,是个好办法,还有其他方案吗?
    winneryong
        12
    winneryong  
       Feb 22, 2014 via Android
    可参考rsync算法
    mapix
        13
    mapix  
       Feb 22, 2014
    考虑的因素: 如果简单容易维护可以考虑直接开rsync跑; 如果文件太大, 处理资源受限网络带宽足, 可以分块传输 ;当然如果你发送的目标机器很多而且经常这么干的话可以考虑实现一种BroadCast机制或P2P机制。
    wangfengmadking
        14
    wangfengmadking  
       Feb 22, 2014
    @jxwho 简单点的的就直接把上一阶段的数据结果保存成文本文件(用时间戳命名?),然后保存到一个http服务器(http可以几行代码就实现http server,不用apache也可以)下,然后另外一个程序轮询服务器下载文件列表就可以了。
    About     Help     Advertise     Blog     API     FAQ     Solana     2716 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 55ms UTC 13:52 PVG 21:52 LAX 06:52 JFK 09:52
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86