用 system_health 来查看网络丢包的表现

来源:互联网 发布:ai后缀域名 编辑:程序博客网 时间:2024/05/16 08:54

有一台机, 昨晚是 21点~22点     今早上 2点~ 7点, CPU高, 数据库时间对不上, 各种不正常。 

后来发现有人重启过数据库服务器, 正常了。

查了一天都没找到原因, 因为显示慢的SQL 现在执行都比较快的了。 

后面问运维, 才发现这2个时间段网络丢包严重, 为些导致数据库不正常。 

拿到 system_health 的xel文件, 发现有两个是比较多的, 筛选了一下:


查SQL Server的错误代码:

5023 组或资源的状态不是执行请求操作的正确状态。

10054 远程主机强迫关闭了一个现有的连接。


虽然是事后诸葛亮, 但以后碰到类似的事情, 可以通过这两个来判断是否有网络丢包的情况发生, 也是一个技巧吧。

0 0