一个不小心打错字母,引发了系统崩溃,我真是史上最菜的程序员,求大神指点!
各位大佬,我完了… 事情是这样的:写个脚本手抖把 `grep` 写成了 `gerp`,于是想用 `alias`"修复",结果把 `grep` 误写成 `rm -rf /`!想用 `sed` 删除 `alias`,又把通配符打错了,系统文件全被修改了…慌了,拿了个装系统用的 U 盘,结果里面有个我早年写的自动化脚本,里面有一行 `chmod -R 777 /`! 整个根目录权限全乱了… 想备份数据,用 `tar` 命令备份整个 `/`目录,由于权限问题,开始备份 `/proc` 和 `/sys`… 系统变得极慢…
想杀掉 `tar` 进程,结果忘了数据库进程也叫 `TAR`… 数据库被杀掉了… 然后用 `nohup` 启动数据库,又忘了脚本会删除所有日志和临时文件… 数据库以为是第一次启动,开始初始化…
初始化过程中向消息队列发送大量事件,由于之前的一系列操作,消息队列权限变成了 777,实习生的测试脚本自动删除了所有消息…
想从备份恢复,由于权限问题,增量备份一直失败,只能用一个月前的全量备份… 没在测试环境验证,直接在生产环境执行恢复操作…
数据库回滚导致数据不一致,订单系统、库存系统、支付系统全部混乱… 用户全部被强制登出…自动化运维系统疯狂"修复"系统…
现在:系统文件权限全乱了,各种服务崩溃重启… 数据库数据混乱… 消息队列数据清空… 备份系统混乱… 自动化运维系统疯狂"修复"… 用户被登出投诉… API 被加入黑名单… 运维团队进不去系统…
大佬们,求救!应该先解决哪个问题?我该怎么办?跑路来得及吗?
页:
[1]