上周,海外知名科技频道Gamers Nexus曝光英特尔13代酷睿和14代酷睿桌面处理器出现了工艺缺陷问题,以致使用这些CPU的桌面PC会出现多种系统崩溃现象。
英特尔也迅速做出了回应,近日在社区中宣布已经找到问题原因,并表示修复补丁预计会在8月中旬推出。同时英特尔澄清,问题原因并不是工艺缺陷,而是处理器电压异常,超出安全范围。
CPU不稳定问题由来已久
实际上,13代酷睿处理器不稳定的问题不是近期才发现的,早在去年年中,就有一些硬件论坛上有用户反馈13代酷睿高端处理器在高负载场景下,比如游戏等经常出现崩溃报错的现象。
也有一些网友在论坛中表示其i9 13900K在使用一年半时间后,开始出现频繁蓝屏,更换内存后无法解决,到最后彻底无法开机,检测发现是CPU坏了。
事件到今年4月,开始有多家科技媒体开始报道,同月英特尔联合主板厂商在BIOS中加入了Intel Baseline Profile,也就是英特尔基准配置,这个配置据称能解决13代和14代酷睿CPU的游戏稳定性问题。
不过在测试中发现,使用该基准配置后,处理器性能会有8%到10%的损失,也就是相当于通过降频和限制功耗来提高稳定性。
据统计,这次问题造成的故障现象包括系统突然出现蓝屏或崩溃重启、开机自检无法通过、需要禁用部分失效的核心才能使用等。
到了7月,处理器崩溃造成的影响越来越大,有消息称部分游戏企业也遇到了CPU崩溃的问题,游戏企业用到的服务器有部分高频的需求,所以除了传统的服务器CPU外,还采用了不少消费级的旗舰CPU,比如13代和14代的酷睿i9系列。据称在服务器中的崩溃现象尤为严重,尽管服务器主板上为了系统稳定性,电压和CPU频率设定都极为保守,但仍未能避免CPU崩溃。
澳大利亚游戏开发商Alderon Games更是表示,其公司内部的英特尔酷睿13代和14代处理器崩溃率高达100%。
关于酷睿13代和14代处理器的不稳定问题,英特尔一直在官方论坛上更新报告,但一直未能彻底解决。比如在6月份英特尔曾表示问题在于微代码,并提供新的源代码供用户更新,但很快英特尔又表示更新源代码无法解决问题,原因仍在调查。
直到近日,英特尔在社区中表示问题的直接原因是存在错误的微代码,导致CPU不断请求升高电压水平。
外界推测芯片ALD工艺出现问题,导致铜通孔氧化
根据Gamers Nexus的曝光,他们猜测这次英特尔酷睿13代和14代处理器的崩溃现象原因是晶圆制造过程中的工艺缺陷,ALD(原子层沉积)工艺缺陷导致CPU内部的铜通孔发生氧化,从而产生高阻抗,导致CPU出错。
ALD是一种先进的薄膜制备技术,它通过交替引入不同的化学前驱体,逐层在基材表面沉积薄膜,实现原子级别的精度控制,薄膜厚度极为均匀。
在CPU等逻辑IC中,晶体管数量一定程度上代表了CPU的性能。而位于栅极电极和晶体管沟道之间的栅极介电层,其厚度和质量对晶体管的性能有着直接的影响,ALD技术可以沉积均匀且厚度一致的高介电常数材料,以减少漏电流,提高晶体管性能。
ALD工艺在芯片中的其中一个目的也是在铜通孔周围形成完整的保护层,如果工艺出现问题,比如出现孔隙或裂纹,那么这些缺陷可能会成为氧气渗透到铜通孔的路径,导致氧化。
在半导体制造中,铜通孔氧化是极为严重的问题,这会导致电阻增加,进而影响电流传输效率和芯片的整体性能。
有意思的是英特尔在最近的回应中也提到,铜通孔氧化的制造问题在酷睿13代处理器早期曾出现过,但早在2023年就已经解决,并表示这与CPU不稳定的问题无关。
确实,英特尔提到的电压过高问题,也较为符合处理器崩溃现象主要出现在台式机版本上的表现。因为笔记本处理器相比台式机,功耗限制会较大,同时频率也较低,所以可能会避免出现电压过高导致崩溃。
英特尔面临信任危机,国产CPU也有新进展
虽然这次事件未证实为硬件缺陷,但对于英特尔来说,可能是要面临史上最严重的信任危机。
这给竞争对手带来了提高口碑的机会。尤其是近期AMD也表示在新品审查中发现首批产品不符合质量预期,决定采取措施通过更严格测试和筛选来纠错,并推迟锐龙9000系列CPU的发售时间。AMD还强调,这是“为了让每一位锐龙用户都能享受到最高质量的体验”。
国产CPU方面,龙芯近期宣布其3C6000服务器CPU流片成功,实测相比上一代龙芯3C6000处理器性能成倍提升,已经达到英特尔至强Silver 4314处理器水平。
龙芯3C6000单芯片集成16个LA664核心,32线程,支持双路、四路、八路直连。同时支持龙链(Loongson Coherent Link)技术,可以通过龙链构成片上互连,形成32核或更多核的版本,以扩展多芯片互连支撑多路服务器方案。