故障解决方案最好长点的,太短不行,但是我想不到多少故障,百度搜索也就几个,大哥们帮忙想想办法吧
最好是 linux 故障 软硬件都行 tomcat 也行 我实在凑不够数
1 securityCoding 2022-11-19 11:57:32 +08:00 这是吃了不得消啊,没啥价值,还不如从业务场景找找 cpu/内存 /线程 case |
![]() | 2 treo 2022-11-19 12:05:35 +08:00 ![]() 人为故障:rm -rf /* 解决方案:跑路 |
3 ho121 2022-11-19 12:07:27 +08:00 via Android |
4 ho121 2022-11-19 12:08:16 +08:00 via Android |
![]() | 5 zfyp 2022-11-19 12:10:31 +08:00 这是要写故障分析报告?没故障发生的就瞎写? |
6 edis0n0 2022-11-19 12:12:14 +08:00 ![]() 故障:业务太稳定了 解决方案:没事干就随手 systemctl restart docker |
8 edis0n0 2022-11-19 12:13:20 +08:00 |
![]() | 9 zfyp 2022-11-19 12:18:32 +08:00 每天 1-3 次,估计都是相似的、重复的故障现象了,总结一下故障现象,深入排查提出解决方案把问题解决了。 |
![]() | 10 adoal 2022-11-19 12:18:45 +08:00 via iPhone ![]() 混沌工程搞起来,没故障也要有故障。 创造条件,创造条件。 |
![]() | 12 SimonOne 2022-11-19 12:31:47 +08:00 @zfyp #9 是要求 op 写 linux 的故障和解决方案,一天写一个,不是有 linux 故障一天 1-3 次要 op 解决。 op 就是因为没有遇到那么多问题,所以才苦恼写不出来。 |
![]() | 13 cmdOptionKana 2022-11-19 12:36:48 +08:00 去 StackOverflow 找找看? |
![]() | 14 xyjincan 2022-11-19 12:55:43 +08:00 ![]() 1.硬盘坏了 2.硬盘坏了,不上电 3.内存坏了,内核崩溃 4.内存坏了,不能开机 4.内存坏了,卡 bios 5.光模块坏了,灯不亮 6.日志满了,系统崩溃 7.软件内存溢出 bug ,系统内存满了 8.第三方服务假死崩溃,调用堵塞卡死 9.raid 卡坏了,,,, 10.mysql 文件损坏,疯狂报错 |
![]() | 15 Andreas8 2022-11-19 12:57:56 +08:00 ![]() 我第一反应是:奇葩公司 |
![]() | 16 Foxkeh 2022-11-19 13:22:40 +08:00 ![]() 无法开机: 没插电源 |
![]() | 17 zhangxs1989 2022-11-19 13:25:38 +08:00 是不是想逼你辞职啊 |
![]() | 18 lwjef 2022-11-19 13:36:00 +08:00 via iPhone 比如配置错误故障,能写好多吧 |
19 spr1ngs OP @zhangxs1989 和甲方要钱 一条故障最少 300 |
20 spr1ngs OP @zhangxs1989 主要甲方估计给的钱很多,但是系统这里体现不出工作量,就只能一天一条这么写 |
21 gchust 2022-11-19 14:42:35 +08:00 ![]() https://sadservers.com/ 这里有十几条 |
![]() | 23 aphrodite 2022-11-19 15:55:29 +08:00 猫咬坏了猫 |
![]() | 25 zhaogaz 2022-11-19 16:15:22 +08:00 领导挺好,写了交上去,你们不会被干掉。 |
27 liuxingdeyu 2022-11-19 17:54:19 +08:00 建议买一本红帽教材,很多知识点都能写 |
![]() | 28 msaionyc 2022-11-19 19:57:05 +08:00 via iPhone 编故障也是个技术活…瞎编到时候随机挑几个要复盘,要纪要,你们咋编,总不能几十个都编出来等着吧 |
29 8zip 2022-11-19 19:59:51 +08:00 via Android 老鼠把网线咬断了 |
30 superrichman 2022-11-19 20:00:46 +08:00 via Android 下个 aida64 ,每个硬件的参数都给成异常不就是了 |
31 0bing 2022-11-19 20:04:55 +08:00 HDD, 0:0 坏了,0:1 坏了,0:10 坏了...你懂了没? 还有那些热拔插的,大把! |
32 spr1ngs OP @msaionyc 每个都有纪要的 我现在就在补记录,2022 年差不多 500 个 还都要写详细问题 详细解决方法 还要打印出来装订 |
![]() | 33 itechify PRO 从软件层好多可以写,基础组件方向,例如: mysql ,jvm ,redis ,mongodb ,es ,nacos ,nginx ,mq 等等等 |
34 ration 2022-11-19 22:31:35 +08:00 via Android 软件升级打补丁?安全漏洞方面? |
35 freshmanc 2022-11-19 23:46:44 +08:00 最近似乎不偶然的。。。PCIE 设备挂掉然后让 CUP 报错机器 shutdown 了。。 解决方式:掉电重启。。。。 |
![]() | 36 danhahaha 2022-11-20 04:05:29 +08:00 去搜索各种 linux 未解决,无人回答的问题, 然后解决方案一律是"赋予文件权限之后问题解决" , 轻松够你用一年, 还挑不出毛病 |
![]() | 37 zhaogaz 2022-11-20 09:30:35 +08:00 你去搜翻翻那个 开源软件的 bugfix 呗。读一读,抄一抄,改一改。 反正你大概知道怎么回事儿,你能讲出来,别人讲不出来就行。。。 |
![]() | 39 qeqv 2022-11-20 13:35:53 +08:00 老说运维是个没用的部门,原来还有这种方式刷存在感 |
40 cnbatch 2022-11-20 21:07:37 +08:00 如果连 OpenSSH 都算的话,那就找一下 OpenSSH 的各种“故障”,然后把答案翻译成中文。 之所以加双引号,是因为其实很多“故障”其实不是故障,而只是没配置好而已。例如什么证书过期之类的,防火墙没打开相应端口,等等。 按照这个思路,可以把 Linux 的常见服务都列出来,然后去 serverfault superuser 进入 Linux 标签,把一些热门问题翻译成中文当成故障。 |
![]() | 41 bjzhush 2022-11-21 10:27:01 +08:00 造点呗,比如 crash 了,升级 or 打补丁后修复了 比如偶发网络故障,丢包,优化参数后修复了 反正看这个报告的人也看不懂,随便忽悠 |
![]() | 42 libook 2022-11-21 12:03:57 +08:00 看项目上用了啥,比如 MySQL ,就去搜索引擎搜索“MySQL 故障“,参考各种博客文章。 看系统里用了哪些软件包,然后去 Arch Wiki 上搜对应的词条,拉到最下面看 Troubleshooting ,绝大部分信息主流发行版通用。 另外逛 Stackoverflow 和 Super User ( StackExchange 旗下的)也可以。 |
![]() | 43 yklaxds 2022-11-22 12:19:25 +08:00 ![]() 建议随便找一个 Linux 相关贴吧,里面全都是各种故障。只有你想不到没有他没有的。 |
![]() | 44 JohnBull 2022-11-23 16:14:53 +08:00 真空衰变导致了宇宙再一次终结,服务下线无法恢复 |
45 levenwindy 2022-11-25 02:09:28 +08:00 via Android |
46 spr1ngs OP @levenwindy 并不是是故障 我就能用的上 就敢写上去 |