在 Linux 中如何判断一个进程是否存活? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lzdhlsc
V2EX    问与答

在 Linux 中如何判断一个进程是否存活?

  •  
  •   lzdhlsc 2020-12-26 10:38:54 +08:00 2878 次点击
    这是一个创建于 1754 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想写一个类似 watchdog 的程序,监听一个进程是否存活 (如果进程死亡就重启进程)。因为这个进程没有 health check,也不是 watchdog 的子进程 (因为 watchdog 也会重启),所以没想到什么好的方式判断。我能想到的方式有几种:

    1. 看 /proc/pid 是否存在 + /proc/pid/stat 里面的 status
    2. 调用 kill(pid, 0)

    想请教下大家最正确的判断方式是什么。

    14 条回复    2020-12-27 08:43:06 +08:00
    opensail
        1
    opensail  
       2020-12-26 10:51:17 +08:00 via Android   1
    static bool check_pid(char *pid_file) {
    struct stat stb;
    FILE *pidfile;
    if (stat(pid_file, &stb) == 0) {
    pidfile = fopen(pid_file, "r");
    if (pidfile) {
    char buf[64];
    pid_t pid = 0;
    memset(buf, 0, sizeof(buf));
    if (fread(buf, 1, sizeof(buf), pidfile)) {
    buf[sizeof(buf) - 1] = '\0';
    pid = atoi(buf);
    }
    fclose(pidfile);
    if (pid && kill(pid, 0) == 0)
    {
    return 1;
    }
    }
    printf("removing pidfile '%s',process not runing", pid_file);
    unlink(pid_file);
    }
    return 0;
    }
    opensail
        2
    opensail  
       2020-12-26 10:52:40 +08:00 via Android   1
    基本是和楼主思路一致,书上也是这样说的,判断 pid
    codehz
        3
    codehz  
       2020-12-26 10:57:33 +08:00 via Android   1
    用 pidfd,降低出问题的可能性(指竞争条件)
    love
        4
    love  
       2020-12-26 11:30:36 +08:00 via Android   1
    直接在所有进程列表查找对应的进程命令行 pattern 不就行了,pid 都不需要
    f6x
        5
    f6x  
       2020-12-26 11:46:35 +08:00   1
    kill(pid, 0) 标准用法
    ihipop
        6
    ihipop  
       2020-12-26 11:57:41 +08:00 via Android   2
    死亡的标准是什么?进程退出?那 systemd 就可以帮你自动重启,不需要什么 watchdog,至于 kill pid 也是不准,因为 pid 是可以被循环使用的,,pid 存在不代表那个 pid 就是你原来的程序
    lzdhlsc
        7
    lzdhlsc  
    OP
       2020-12-26 12:10:07 +08:00
    @ihipop 嗯,其实 systemd 是最好的。我想做的是一个类似 kubelet 的东西,根据 spec 来管理进程,不知道能不能用 systemd 。
    ysc3839
        8
    ysc3839  
       2020-12-26 12:16:32 +08:00 via Android   1
    @ihipop 担心 PID 重复使用,保险的做法还是使用 /proc,顺便读一下进程启动时间。
    lzdhlsc
        9
    lzdhlsc  
    OP
       2020-12-26 12:29:35 +08:00
    @ysc3839 请问为什么 使用 /proc 可以保证不会重复使用?
    ysc3839
        10
    ysc3839  
       2020-12-26 12:37:10 +08:00 via Android   1
    @lzdhlsc 保证不了,要通过进程启动时间来判断是否重复使用了。如果确认重复使用了,也能确认原进程退出了。
    codehz
        11
    codehz  
       2020-12-26 12:39:48 +08:00 via Android   1
    @ysc3839 pidfd 可以保证的(
    就算重用了也能拿到之前死了的通知,然后这个 fd 失效不能再读取
    mickeyworks
        12
    mickeyworks  
       2020-12-26 12:42:55 +08:00   1
    找两篇 liunx 挖矿分析文章,看一下里面监控模块怎么写的。。。
    julyclyde
        13
    julyclyde  
       2020-12-27 08:41:53 +08:00   1
    zombie 也有 status 文件的
    kill -0 是正确答案
    julyclyde
        14
    julyclyde  
       2020-12-27 08:43:06 +08:00   1
    @lzdhlsc 正确解法是 systemd 等 SIGCHLD 的方式
    从外部而不是上级检查进程是否存活,都是旁门左道。你还得考虑检查频度的问题呢!!
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2631 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 15:30 PVG 23:30 LAX 08:30 JFK 11:30
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86