酷睿2势不可挡 Merom处理器深度评测

来源:互联网 发布:mac word转ppt 编辑:程序博客网 时间:2024/04/30 18:06
时隔半年之后,英特尔于06年第三季度推出全新Core微架构处理器,其中桌面处理器Conroe、服务器处理器Woodcrest已经于刚刚过去的七月份问世。移动领域的Merom处理器步伐也日益临近,近日Core微架构移动处理器Merom将正式推出。为了区别在今年早些时候发布的Yonah核心处理器。两者在名称上略有区别。Yonah核心处理器也可以称之为Core Duo。Merom处理器则称之为Core 2 Duo,事实上就是第二代酷睿双核处理器。近日中关村在线评测室收到一款采用Merom T7400处理器笔记本电脑,相信大家一定充满了期待。



两代酷睿处理器标志


Merom处理器

        Merom处理器依然延续了酷睿微架构一些优良特性。英特尔酷睿微体系结构,是一款领先高效能的新型微架构,为用户提供性能和能效最佳平衡点。今天我们的主角便是Merom移动处理器。

 众所周知的是Yonah核心处理器自1月19日以来,已经再次印证了英特尔在移动处理器市场上的霸主地位。Merom移动处理器的推出依然让人振奋不以,同时消费者对Merom充满了诸多疑问?从之前得到的信息上看,在同Core Duo T2600从处理器的对比中,Merom同频率处理器在性能提升百分之二十的基础上,功耗却下降了百分之二十。实际测试结果是否如上所述?我们将在接下来的文章中找到答案。
 在测试之前,让我们一起先了解一下Merom处理器一些细节信息。Merom处理器同Yonah核心处理器相比,Merom支持EM64T、最高支持4MB L2 SmartCache、FSB包括533MHz、667MHz、800MHz的产品、Macro Ops Fusion(宏融合操作)运算能力、micro-ops fusion(微操作融合)。Direct L1 /L2 Cache Transfer、更高速的L2 Cache to Core频宽、128Bit SSE2/3支持,单一周单可运算8个FP。对EM64T指令集的支持,在竞争对手一直宣称在64位运算的优势地位不复存在,为未来将要上市的Vista操作系统做好的准备。



Merom处理器规格表(*为不支持虚拟化VT技术)
以往英特尔在移动处理器,英特尔处理单元将指令分解为更小、更易于执行的单位。2003年问世的Banias使用了一种名为微融合的技术将来自同一指令的操作粘合起来,这减少了处理器为完成一个任务需要执行的操作数量。

        采用Core微架构的芯片能够融合更多的微操作,Merom能够将更多更大的指令融合为一条指令,即宏操作融合,这种技术在提高了性能的同时还降低了能耗。

        在大家比较关心的Merom处理器接口上,其采用的是mPGA478针设计。英特尔酷睿双核处理器采用插座微型倒装芯片针脚栅格阵列(Micro-FCPGA)和表面安装微型倒装芯片球栅格阵列(Micro-FCBGA)封装技术。微型FCPGA封装可插入479孔,即mPGA479M插座。从封装形式上看Merom处理器可以兼容英特尔945系列芯片组。

作为Yonah核心处理器的后续产品,Merom同样具有酷睿微体系架构一些优良特性。此外Merom并不是Yonah简单的升级产品,Merom具有更加智能的指令处理能力。新一代采用酷睿微体系架构的Merom究竟在那里给我们带来了惊喜,我们一起来探究一下。

英特尔宽位动态执行(Intel  Wide Dynamic Execution)

    英特尔宽位动态执行指的是通过提升处理器每个时钟周期完成的指令数量,达到提升处理器执行效率的目的。直观的可以理解为,采用酷睿微体系架构的Merom能够在每个时钟周期能够完成更多的指令。英特尔酷睿微架构拥有4组解码器,相比上代Pentium Pro (P6) / Pentium II/Pentium III / Pentium M架构拥有3组可多处理一组指令。此外处理器两个处理单元同时工作,进一步提升处理器整体执行效率。

除了拥有多达4组解码器以外,英特尔酷睿微体系结构为了增强在实际执行中的效率。加入宏融合(Macro-Fusion)技术,此技术可以让处理器在解码同时,将同类型指令合并为单一的指令。然后将合并后的一条指令作为一条指令执行,这样可以让处理器在每个时钟周期内处理更多的指令。此外为了配合宏融合(Macro-Fusion)技术能够顺利高效执行,酷睿微体系结构改良了ALU(算术逻辑单元),处理器可以迅速掌握同类型指令情况。

英特尔智能功率能力(Intel Intelligent Power Capability)

    在移动处理器领域,提升性能与功耗控制称为同等重要的问题。那么Merom做到如何保证处理器在提供更好性能的前提下,达到最佳的能效比?首先新一代处理器在制作工艺上全面升级至更为先进的65nm应变硅技术、加入低K栅介质及增加金属层,相比上代90nm制程减少漏电达1000倍。

英特尔加入了逻辑控制机能独立开关各运算单元。酷睿微体系结构采用先进的功率门控技术。此技术可以通过该特性,可以智能地打开当前需要运行的子系统,而那些不进行操作的部分则处于休眠状态,有效控制处理器功耗。

英特尔高级智能高速缓存(Intel Advanced Smart Cache)

    早期的英特尔双核处理器,虽然采用了多核心设计的处理器,其每个核心的二级缓存是各自独立的,当多个核心之间需要数据交换时,必须要通过共享的前端串行总线和北桥来进行数据交换,影响了处理器工作效率。

  英特尔酷睿微结构体系结构采用了共享二级缓存,两个核心可以共享二级缓存,大幅提高了二级高速缓存的命中率,从而可以较少通过前端串行总线和北桥进行外围交换机会。

    此外每个核心都可以动态支配全部二级高速缓存。当某一个内核当前对缓存的利用较低时,另一个内核就可以动态增加占用二级缓存的比例。甚至当其中的一个内核关闭时,仍可以保持全部缓存在工作状态,另外也可以根据需求关闭部分缓存来降低功耗。

英特尔智能内存访问(Intel Smart Memory Access)

 英特尔智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。英特尔智能内存访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。

英特尔酷睿微体系结构中加入一项名为内存消歧的能力,它可以对内存读取顺序做出分析,智能地预测和装载下一条指令所需要的数据,这样能够减少处理器的等待时间,减少闲置,同时降低内存读取的延迟,而且它可以侦测出冲突并重新读取正确的资料及重新执行指令,保证运算结果不会出错误,大大提高了执行效率。

特尔高级数字媒体增强(Intel Advanced Digital Media Boost)

    英特尔高级数字媒体增强是为了提高每个时钟周期的指令数而诞生,它可以提高SIMD流指令扩展指令(SSE/SSE2/SSE3/SSE4)的执行效率。Intel酷睿微体系结构则拥有128位的SIMD执行能力,一个时钟周期就可以完成一条指令,效率提升明显。相对于之前的每个时钟周期64位的SIMD执行能力,可在一个时钟周期内完成

单周期128位SIMD处理器能力令处理器拥有高能效表现。当前SSE指令集已经十分普遍地用于主流的软件中,包括绘图、影像、音频、加密、数学运算等用途。

英特尔动态总线暂停(Intel Dynamic Bus Parking)

        此技术还是针对整个系统的功耗。在处理器处于低频模式状态时,芯片组自动断电,可以延长电池的使用时间,从而降低平台能耗。

增强型英特尔SpeedStep技术

        支持增强型英特尔SpeedStep技术。包含从最低频率模式(LFM)到最高频率模式(HFM)的多个性能模式,可在最低功耗时提供最佳性能。根据CPU的需求,在多个性能模式之间实时动态切换电压和频率。无需重启电脑,即可通过转换总线倍频、内核工作电压和内核处理器速度实现以上切换。

延用了Core 微架构的Merom处理器,无论是在性能提升方面,还是在功耗的控制上均表现相当抢眼。在测试过程中,我们感受到了采用新一代Core 微架构,在能效比方面的优秀表现。在抛弃了单纯依靠提升频率来提高性能模式之后,英特尔高级智能高速缓存、智能内存访问、宽位动态执行等技术的运用,让英特尔在Core 微架构处理指令更加高效。

        在处理器领域,特别是移动处理器领域。Core 微架构让性能提升与电池续航时间上不再作为一对矛盾同时出现。在大幅度提升了能效比之后,英特尔在移动处理器领域给竞争对手上了很好的一课,那就是坚持不懈的创新。相信英特尔会在将来的移动处理器领域走的更远。