Intel MCE 之增强的CACHE ERROR REPORTING
来源:互联网 发布:网络协议分析器 编辑:程序博客网 时间:2024/06/06 06:39
从Intel Core Duo开始,开始引入了 cache error reporting的增强版本。在早期的Intel芯片中,cache的状态取决于一个cache中发生错误纠正事件的次数。在一个叫做“threshold-based error status”的规范中指出,cache的状态现在取决于同样的纠正错误在cache中影响到的cache line的数量。影响阀值的因素很多,由Intel给出这个值。如果IA32_MCG_CAP[11] (MCG_TES_P)为1,那么芯片就支持threshold-based error status
支持 enhanced cache error reporting的芯片都包含一个硬件可以用来跟踪某些cache的操作,并可以提供一个标志位来标识这些cache的健康信息。当相同校正事件发生的cacheline数量小于阀值的时候,就会报告为“green”状态;当超过了阀值的话,就会报告“yellow”状态。“yellow”状态意味着cache尚可正常操作,但是在短期内需要对服务器进行维护保养了
Intel建议我们使用threshold-base error reporting机制
CPU/system/platform不需要像相应uncorrected error那么紧急的相应"yellow"状态告警。一个uncorrected error意味着系统遇到了一个很严重的问题,然而yellow状态意味着收影响的cacheline超过了阀值,但本事不是一个严重的问题;发生了yellow状态的服务器上的错误已经被纠正了,系统尚可正常运行
对于同一个ECC校正多bit错误产生的 uncorrected error来说,green/yellow状态标识符并不一定会比uncorrected error来的快。这样的错误可能会在yellow到达阈值前先发出uncorrected error。当然,随着被影响的cacheline的忽略增加,uncorrected error先发生的记录也就随着增大。
0 0
- Intel MCE 之增强的CACHE ERROR REPORTING
- Intel MCE CMCI (二) CMCI的LAPIC接口
- Intel MCE CMCI (二) CMCI的LAPIC接口
- Intel MCE UCR ERRORS(三) UCR的错误分类
- 增强UIWebView的cache
- 取消Eclipse的Error Reporting
- Intel MCE CMCI (三) 系统软件中CMCI的相关实现
- Intel MCE CMCI (三) 系统软件中CMCI的相关实现
- Intel MCE UCR ERRORS(二) UCR的报告和记录
- 解读MCE(Machine Check Exception)和Intel CSR寄存器(configuration Registers)的代码含义工具
- Intel MCE CMCI (一) 概述
- Intel MCE CMCI (一) 概述
- Intel MCE UCR ERRORS(一) 概述
- 增强现实篇之英特尔实感技术-intel realsense
- Error Reporting Services
- Reporting Services Internal Error(诡异的问题)-【转载】
- Havok物理引擎 关于错误报告的信息(Error Reporting)
- MCE接收器,收发器的开发经历
- 知识的学习与管理
- Java – How to delay few seconds
- C++中输出有效数值位数问题
- [JQ权威指南]第十七天:show()与hide()方法
- iOS开发上架常用证书,appID,Provisioning Profiles配置说明及制作图文教程
- Intel MCE 之增强的CACHE ERROR REPORTING
- 随机优化工具 Stochastic Optimization Techniques
- Linux中find常见用法示例
- Recover Binary Search Tree
- IOS 后台无限执行任务
- 推荐算法类别概述
- android Phone中的消息处理过程
- ListView位置记录
- 在windows操作系统中,查询端口占用和清除端口占用的程序