请教一下 shell 文本处理大神 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
toyst
V2EX    Linux

请教一下 shell 文本处理大神

  •  
  •   toyst 2023-02-21 19:35:09 +08:00 2975 次点击
    这是一个创建于 966 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想把这段

    DEFAULT_PACKAGES += asdf asdf wfqw sdfg \ jljldja ldoahf lajsdf \ lj.msaldj jlasd-ewk $(eval $(call BuildTarget)) xorrisofs -v 2>&1 | grep xorriso \ 

    替换成

    DEFAULT_PACKAGES += ghj65 dfg sfd \ ljdfg sdlgjl \ jsflj asda-sadf $(eval $(call BuildTarget)) xorrisofs -v 2>&1 | grep xorriso \ 

    用 shell 怎么写啊

    14 条回复    2023-02-22 18:13:48 +08:00
    zhlxsh
        1
    zhlxsh  
       2023-02-21 19:43:08 +08:00 via iPhone
    没看出来啥规律,DEFAULT_PACKAGES 完全替换掉吗?或者说说你遇到啥问题了
    toyst
        2
    toyst  
    OP
       2023-02-21 20:04:04 +08:00 via Android
    @zhlxsh 就是替换 后面到$(eval 前面那一坨
    yang3121099
        3
    yang3121099  
       2023-02-21 22:01:27 +08:00
    可以使用 sed 命令对文本进行替换。假设这个文本存储在名为 text.txt 的文件中,可以使用以下命令:

    vbnet Copy code
    sed -i 's/asdf asdf wfqw sdfg \\/ghj65 dfg sfd \\/g; s/jljldja ldoahf lajsdf \\/ljdfg sdlgjl \\/g; s/lj.msaldj jlasd-ewk/jsflj asda-sadf/g' text.txt
    这个命令将对 text.txt 中的文本进行替换,并将结果写回到原文件。具体来说,使用 sed 命令的 -i 选项表示原地编辑,s/old/new/g 表示将 old 替换为 new ,\\ 表示换行符,多个替换操作用分号隔开。

    注意,为了避免误操作,请先备份原文件

    chatgpt
    boboliu
        4
    boboliu  
       2023-02-21 22:24:39 +08:00
    a="input"
    echo "${a/DEFAULT_PACKAGES \+\=*$/DEFAULT_PACKAGES += aa $'\n' bb $'\n\n'$}"

    多看 man
    boboliu
        5
    boboliu  
       2023-02-21 22:25:35 +08:00
    @boboliu #4 忘了插 // ,自己解决一下.jpg
    jackmod
        6
    jackmod  
       2023-02-21 22:27:52 +08:00   1
    sed -z
    以 0 作为行尾,替换 DEFAULT_PACKAGES += 和 $(eval 之间的部分即可
    boboliu
        7
    boboliu  
       2023-02-21 22:29:27 +08:00
    @boboliu #5 应该插 \\,另:bash only
    koebehshian
        8
    koebehshian  
       2023-02-21 22:53:04 +08:00
    可以利用 awk 和记录分隔符 RS 和 ORS 来替换;但最后一条记录不需要分隔符,所以改良了一下:
    把要替换的字符串设为输入记录分隔符 RS ,把输出记录分隔符 ORS 设为空,awk 遍历记录回调中,读取当前记录索引 FNR ,如果为 1 ,则输入$0 和要替换的字符串,否则只输出$0
    listenerri
        9
    listenerri  
       2023-02-21 23:13:01 +08:00
    ```
    #!/bin/bash

    # 从以 DEFAULT_PACKAGES 开头的行开始,
    # 直到以非反斜杠结束的行为止,将其替换为指定内容
    sed '/^DEFAULT_PACKAGES.*/,/.*[^\\]$/c \
    DEFAULT_PACKAGES += ghj65 dfg sfd \\\
    ljdfg sdlgjl \\\
    jsflj asda-sadf' test.txt

    # 命令假设待处理文件名为 test.txt

    ```
    listenerri
        10
    listenerri  
       2023-02-21 23:16:58 +08:00
    @listenerri #9 如果需要直接修改目标文件,为 sed 命令增加 -i 参数
    pagxir
        11
    pagxir  
       2023-02-21 23:38:00 +08:00   2
    cat << "EOF" |
    DEFAULT_PACKAGES += asdf asdf wfqw sdfg \
    jljldja ldoahf lajsdf \
    lj.msaldj jlasd-ewk

    $(eval $(call BuildTarget))

    xorrisofs -v 2>&1 | grep xorriso \
    EOF
    sed '/DEFAULT_PACKAGES/{:l; N; /\\/{s#\\\n#@#g; bl;}}'
    Owenjia
        12
    Owenjia  
       2023-02-21 23:54:36 +08:00
    简单写了下,假设原文本保存在 testdata 中,使用 sed 匹配起始行,然后循环读取,直到读到空行,再匹配字符进行替换,将输出的文件重定向到新文件即可:

    sed -n '/^DEFAULT_PACKAGES / { h; :loop; n; H; s/^$//; T loop; x; s/+= .*$/+= ghj65 dfg sfd \\\nljdfg sdlgjl \\\njsflj asda-sadf\n/};p' testdata > newdata
    drwx
        13
    drwx &nbp;
       2023-02-22 10:37:59 +08:00
    @jackmod 原来 sed 也有类似`find -print0`这样的选项啊,第一次知道,学到了,感谢!

    原来也很头疼 sed 处理跨行的文本,网上搜到的方法要不就是要用 sed 的 hold space, pattern space 来操作,要不就是 awk 写一大片处理逻辑,用 sed -z 就方便多了。

    @toyst 我给个具体的语句:

    ```bash
    sed -z -i -e 's@asdf asdf wfqw sdfg \\\njljldja ldoahf lajsdf \\\nlj.msaldj jlasd-ewk@ghj65 dfg sfd \\\nljdfg sdlgjl \\\njsflj asda-sadf@' a.txt
    ```
    yiyu1211
        14
    yiyu1211  
       2023-02-22 18:13:48 +08:00
    awk '/DEFAULT_PACKAGES/{print("DEFAULT_PACKAGES += ghj65 dfg sfd \\");getline;print("tljdfg sdlgjl \\");getline;print("tjsflj asda-sadf");next} 1' text.txt
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2978 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 61ms UTC 13:42 PVG 21:42 LAX 06:42 JFK 09:42
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86