一元网络论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 128|回复: 0

一个不小心打错字母,引发了系统崩溃,我真是史上最菜的程序员,求大神指点!

[复制链接]

3万

主题

3万

帖子

9万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
96158
发表于 2024-9-10 03:37:12 | 显示全部楼层 |阅读模式
各位大佬,我完了… 事情是这样的:写个脚本手抖把 `grep` 写成了 `gerp`,于是想用 `alias`  "修复",结果把 `grep` 误写成 `rm -rf /`  !  想用 `sed` 删除 `alias`,又把通配符打错了,系统文件全被修改了…  
慌了,拿了个装系统用的 U 盘,结果里面有个我早年写的自动化脚本,里面有一行 `chmod -R 777 /`  ! 整个根目录权限全乱了… 想备份数据,用 `tar` 命令备份整个 `/`  目录,由于权限问题,开始备份 `/proc` 和 `/sys`  … 系统变得极慢…
想杀掉 `tar` 进程,结果忘了数据库进程也叫 `TAR`… 数据库被杀掉了… 然后用 `nohup` 启动数据库,又忘了脚本会删除所有日志和临时文件… 数据库以为是第一次启动,开始初始化…  
初始化过程中向消息队列发送大量事件,由于之前的一系列操作,消息队列权限变成了 777,实习生的测试脚本自动删除了所有消息…  
想从备份恢复,由于权限问题,增量备份一直失败,只能用一个月前的全量备份… 没在测试环境验证,直接在生产环境执行恢复操作…  
数据库回滚导致数据不一致,订单系统、库存系统、支付系统全部混乱… 用户全部被强制登出…  自动化运维系统疯狂"修复"系统…
现在:系统文件权限全乱了,各种服务崩溃重启… 数据库数据混乱… 消息队列数据清空… 备份系统混乱… 自动化运维系统疯狂"修复"… 用户被登出投诉… API 被加入黑名单… 运维团队进不去系统…  
大佬们,求救!  应该先解决哪个问题?  我该怎么办?  跑路来得及吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|一元网络论坛

GMT+8, 2024-11-27 12:30 , Processed in 0.056910 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表