事故分析2
来源:互联网 发布:存货管理的数据分析 编辑:程序博客网 时间:2024/04/29 05:06
影响:
小迪 xiaoditec@daemonrob.com 帐号 10.0.63.186 节点 主挂了 redis就挂了
9.29 8:40用户感知到了
值班人:
蔺育申 易弢 9.28
陈星宇 付业成 9.29
报警信息:
9.28 23:00 肖勤
onealert 没有报警
9.28 24:00 易弢
nq66 osd fd过高
gq1,gq3 osd报ERROR
9.29 8:27 op红牛
8:02 onealert
新告警通知–8014480
警告: [QCOS][bq] target_job_down - Target job gateway_metrics is down
告警内容:(bq30)firing: bq30, resolved: ; [bq30]: Target job gateway_metrics is down: 192.168.192.30:2100 ;
发生时间:08:02:08
已分配给:@付业成,@肖勤,@应治,@陈星宇,@易弢,@苏海,@马凯雄,@马思超,@宋文灏
所属应用:
查看详情:http://t.cn/RGrYU0a
————-OneAlert.com————–
群昵称与OneAlert用户名一致,告警提醒更及时哦~
+关键字 或 中文问号+关键字 来调戏机器人吧!
可能原因:?
1、 机器故障 硬盘坏了等问题 。 Bq 30盘硬件坏了 。
2、 根目录坏了 docker 的 opt根目录
3、 nq66 docker不工作 fd暴涨 osd重启后 fd还是暴涨
监控报警:
报警有了,处理 跟进不及时
跟进机制:
第一时间 迁移,
或者通知客户 是不是比让客户过来问 要好。
原因:根目录坏了 docker 的 opt根目录
导致小迪问题
4、 宕机、磁盘坏了、扇区坏了 。如何跟进 排查?
redis 主 目录 挂了,从 数据存在。迁移后 ,主可恢复。
6个节点 3个cluster 3个备份
- 事故分析2
- 事故分析
- 2012.10.19 事故分析
- 网络事故分析
- 翻车事故分析专栏
- Redis复制,事故情况分析
- 事故
- 日本福岛核电站事故分析报告
- Oracle(RAC)数据库调优和事故分析
- 一次共享内存引起的线上事故分析
- Kaggle 入门:探索泰坦尼克号事故幸存情况分析
- 小密圈产品事故@2017 No.2 --- 条件竞争提现
- 电力事故
- 事故总结报告
- 郭德纲事故的事故事故的事故的痛
- 欧洲核子研究中心公布强子对撞机事故初步分析
- Oracle(RAC)数据库调优和事故分析应关注的技术点
- 基于数据挖掘SVM模型的pre-incident事故预防预测分析报告
- EJB定时器
- Android源码基础解析之异步任务AsyncTask
- myeclipse10中文破解版10.7.1 官方正式版【32/64位】
- sql中的where 1<>1 和where 1=1的区别
- cookie
- 事故分析2
- Kotlin学习记录(三)—— 子线程获取数据,实现简单ListView
- 改改host,轻松登录dropbox!(For Windows)
- 16 《万用之物:盐的故事》-豆瓣评分7.5
- PHP的数组遍历总结
- php 获取ip地址所在的区域
- 重采样与重分类
- Java虚拟机运行时数据区域
- .net读取txt文件