百万数量级小文件迁移怎么做? - V2EX
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
FenixVu
V2EX    Linux

百万数量级小文件迁移怎么做?

  •  
  •   FenixVu Jun 2, 2021 5810 views
    This topic created in 1806 days ago, the information mentioned may be changed or developed.
    服务器上有 3 个 t 的数据大概由百万级别数量的小文件构成,现在挂了一个 5 个 t 的硬盘想把 3 个 t 的数据备份到硬盘上有啥好方法么 cp mv rsync tar 都试过了 不太好使
    29 replies    2021-06-10 09:25:51 +08:00
    wtfcworld
        1
    wtfcworld  
       Jun 2, 2021
    dd ?
    AoEiuV020
        2
    AoEiuV020  
       Jun 2, 2021
    ghost?
    或者整个硬盘 dd 过去再 resize 分区,
    F281M6Dh8DXpD1g2
        3
    F281M6Dh8DXpD1g2  
       Jun 2, 2021
    tar
    doyel
        4
    doyel  
       Jun 2, 2021
    dd 最快
    hulala1021
        5
    hulala1021  
       Jun 2, 2021
    rsync 应该没问题诶,我现在同步上百万的文件,没啥问题
    不过我是从无到有增量同步的,不是一下字有上百万文件
    westoy
        6
    westoy  
       Jun 2, 2021
    dd 到新硬盘, 再 resize2fs 扩容
    lerry
        7
    lerry  
       Jun 2, 2021
    硬盘快照,具体要看是什么文件系统
    mingl0280
        8
    mingl0280  
       Jun 2, 2021 via Android
    partclone 好。
    liuguangxuan
        9
    liuguangxuan  
       Jun 2, 2021 via Android
    rsync 会碰到什么问题?
    kokutou
        10
    kokutou  
       Jun 3, 2021 via Android
    先看看你的 5t 硬盘是不是叠瓦。。。

    挂着不管放机房拷几天也就拷完了。
    FenixVu
        11
    FenixVu  
    OP
       Jun 3, 2021
    @kokutou 是个希捷的移动硬盘
    我刚才才想到 需不需要 重新格式化成 ext4 在挂载拷贝
    默认的应该是 ntfs
    kokutou
        12
    kokutou  
       Jun 3, 2021
    @FenixVu #11
    十有八九是叠瓦
    aloxaf
        13
    aloxaf  
       Jun 3, 2021
    @FenixVu #11
    建议格式化,ntfs-3g 是基于 fuse 的,性能不是很高,而你这有 3T 数据……、
    虽然有公司开源了一个 ntfs 的内核模块,但没有刚需的话还是建议格式化省事儿
    heguangyu5
        14
    heguangyu5  
       Jun 3, 2021   1
    机械硬盘的话试试这个 https://github.com/heguangyu5/qtar

    原理就是先给要 copy 的文件排序,让接下来 tar 读取文件时尽可能少地移动磁头什么的,时间有点久记不清楚了.

    我们用这个工具迁移了千万数量级小文件,比简单的 cp 什么地快很多.
    Variazioni
        15
    Variazioni  
       Jun 3, 2021
    @wtfcworld 不懂就问。。dd 是什么。。。
    MarkLeeyun
        17
    MarkLeeyun  
       Jun 3, 2021
    rm -rf .* 最快,哈哈。
    wangkun025
        18
    wangkun025  
       Jun 3, 2021
    dd: Copy and convert (called dd because cc is already in use by C compiler)
    wangkun025
        19
    wangkun025  
       Jun 3, 2021
    @MarkLeeyun 差评
    iphoneXr
        20
    iphoneXr  
       Jun 3, 2021
    只要是涉及到大量文件迁移备份和同步的 统一推荐使用开源软件 rclone 自带校验比对和状态输出。
    上面很多人回复都是没实践过,瞎扯淡。
    AoEiuV020
        21
    AoEiuV020  
       Jun 3, 2021
    @iphoneXr 本来就很慢了,再校验一下岂不是更慢了,一般硬盘对拷也不会出错,不需要这种东西吧,
    而且看了下官网也没提 dd 之类的,竞品只是 rsync, cp,怎么到你这里好像都能吊打 dd 了似的,
    X0ray
        22
    X0ray  
       Jun 3, 2021
    请问下楼主 cp / mv 哪里不好了
    wzq001
        23
    wzq001  
       Jun 3, 2021
    wzq001
        24
    wzq001  
       Jun 3, 2021
    [sudo] password for root:

    @MarkLeeyun
    newmlp
        25
    newmlp  
       Jun 3, 2021
    当然是硬盘对拷最快
    msg7086
        26
    msg7086  
       Jun 4, 2021
    叠瓦盘拷 3T 小文件可以拷一年……
    FenixVu
        27
    FenixVu  
    OP
       Jun 4, 2021
    @X0ray 我预估了下我这边估计 3000w 左右的文件个数 刚开始还好后面就夯死了,考一会歇半天
    maxbon
        28
    maxbon  
       Jun 4, 2021
    试试 unison,之前百万级别的文件用这个效率还行
    FenixVu
        29
    FenixVu  
    OP
       Jun 10, 2021
    @heguangyu5 谢谢老哥用你推荐的方法 成功了
    About     Help     Advertise     Blog     API     FAQ     Solana     3287 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 77ms UTC 11:52 PVG 19:52 LAX 04:52 JFK 07:52
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86