怎样排查 Linux 下的系统盘是否掉盘? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
lithiumii
V2EX    Linux

怎样排查 Linux 下的系统盘是否掉盘?

  •  
  •   lithiumii 2022-08-23 13:54:22 +08:00 4390 次点击
    这是一个创建于 1144 天前的主题,其中的信息可能已经有所发展或是发生改变。

    新装的 Manjaro GNOME Kernel 是 5.15.60-1-MANJARO 机器是 NUC8i5BEK 装了一块 2T 的致态 TiPlus5000 买的时候看便宜就买了,没注意到差评里有人说这款会掉盘,毕竟以前用 PC005 挺好的。

    昨天用着用着忽然点啥都没反应了(图形界面都在,点按钮无反应),shell 里报错说"Read-only file system",按电源重启后恢复正常。 然后电脑开了一夜,早上起来看到正常的锁屏界面,但是来不及登录就黑了,重启后正常登入。 有用 Prometheus 监控,同时从本机和另一台机器上记录,另一台机器上温度记录的截图如下:

    黄色和绿色的线是硬盘的温度,在大约 8:59 到 9:35 (今天重启的时间)之间没有记录。是不是可以推测是硬盘在 8:59 左右掉盘了?同时间本机的 Prometheus 这一段全空了,推测是因为掉盘了所以啥都没写入。journalctl 也查不到任何相关的 log ,估计也是因为系统盘没了所以啥都没写下来。

    目前机器继续用着(重要数据都有备份),希望等下一次发生的时候能有针对性地排查一下。

    9 条回复    2022-10-18 18:01:21 +08:00
    mrzhiin
        1
    mrzhiin  
       2022-08-23 13:59:30 +08:00   1
    TiPlus5000 我在 Windows 下出现过两次掉盘,换新后仍有掉盘的情况,最后退了。这个月致态有发布新的固件,或许可以更新试试
    billlee
        2
    billlee  
       2022-08-23 16:18:45 +08:00 via Android   1
    终端预先开好 dmesg -w 等着,或者给把 journald 持久化存储关了同时 syslog 转发到其他机器。
    yanqiyu
        3
    yanqiyu  
       2022-08-23 19:19:37 +08:00
    让 journald 把日志写道别的盘?
    julyclyde
        4
    julyclyde  
       2022-08-24 13:45:52 +08:00
    smartctl 看看硬盘的状态吧
    不一定是温度,也可能是别的因素
    lithiumii
        5
    lithiumii  
    OP
       2022-08-24 19:44:26 +08:00
    @mrzhiin 在长江储存官网找到了升级工具,发现已经是最新版本了
    @billlee @yanqiyu 感谢指点,只能这样守株待兔了
    @julyclyde 不是说因为温度而掉盘,只是恰好温度监控记录里可以看到几点几分开始,没有来自 SSD 的温度传感器的数据了,怀疑就是在这个时刻掉盘
    julyclyde
       
    julyclyde  
       2022-08-25 14:07:09 +08:00
    @lithiumii 把监控数据存到别的地方试试?
    hootigger
        7
    hootigger  
       2022-10-17 19:28:19 +08:00
    @lithiumii 你的现在怎么样了 我装 pve ( debian )然后今天也出现了 系统无响应,重启正常。。日志查不到报错,也是出现了 什么写入都没有的情况。致钛 5000 1t 的盘
    lithiumii
        8
    lithiumii  
    OP
       2022-10-17 20:18:23 +08:00
    @hootigger

    确定了是硬盘的问题就找售后了,但我估计这盘搞不好是设计问题,没救了。

    京东换货第一次,没有任何改善(掉盘频率一周两三次)。
    第二次,掉盘频率下降了,大概一个月两次吧。
    所以前两天第三次找客服了,客服说又上线了新固件。刷上了,暂时还没掉,但还需要观察。
    hootigger
        9
    hootigger  
       2022-10-18 18:01:21 +08:00 via iPhone
    @lithiumii 我也是今天联系长江存储技术客服了,说 10 月 14 刚更新了固件,我刚才刷好了,观察中。主要是这硬盘温度控制的很不错,适合我这小主机希望能稳定
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1024 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 18:32 PVG 02:32 LAX 11:32 JFK 14:32
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86