10nm IceLake 落地 英特尔 10 代酷睿深度解析

业界
2019
05/30
22:24
中关村在线
分享
评论

在中国人的观念里,"10" 这个数字象征着完美,十全十美是对于人或事物的最高评价。

10,对于英特尔来说同样重要。10nm 关系着英特尔在半导体芯片行业未来能否更进一步,10 代酷睿也关系到英特尔能否正面迎接来自竞争对手、来自舆论的压力。而将 10nm 与 10 代酷睿联系在一起,能够做到十全十美呢?

接下来,让我们通过对英特尔 10nm IceLake 10 代酷睿处理器技术细节解析,来找找答案。

英特尔酷睿架构回顾

在 10nm 制程之前,英特尔严格遵循摩尔定律以及 Tick-Tock 战略,通过制程工艺与架构技术迭代来稳步推进 PC 半导体制程技术与性能的发展。65nm 到 45nm 用时 2 年,45nm 到 32nm 用时 3 年,32nm 到 22nm 用时 2 年,22nm 到 14nm 同样用时 2 年,然而在 14nm 到 10nm 推进过程中,英特尔却经历了更久的时间—— 4 年。

随着制程工艺不断演进,相关技术迭代速度也逐渐放缓。光刻机技术、晶体管技术、新材料等诸多领域的研发速度放缓,加之英特尔对 10nm 制程额外看重,希望通过 10nm 技术积累为 10nm 到 7nm 制程演进做铺垫,因此耗费了更久的时间。

10nm IceLake 晶圆

不过,时间终究是推动历史前行的车轮,英特尔 10nm 制程工艺,以及英特尔第 10 代酷睿处理器,即将与我们见面!

一、10nm IceLake 制程架构特性解析

首先我们需要弄清楚两个问题:

其一,英特尔 10nm 制程工艺代号为 IceLake,但架构名称不再用 IceLake 来统一命名,其架构名称为 Sunny Cove。

其二,英特尔 10nm IceLake 处理器正式落地之后,没有意外的话,首批将全部是移动级处理器,也就是 U 系列或 Y 系列处理器,暂时没有桌面级处理器,这也意味着英特尔第九代酷睿没有 U/Y 系列低电压处理器,同时新的桌面级处理器很可能依旧是 14nm 制程,此前曝光代号为 Comet Lake。

接下来我们看看 10nm 制程架构的详细特性:

首先来看 IceLake 平台。全新的 10nm IceLake 平台在性能表现上借助了 AI 功能,支持 DL Boost、支持 Dynamic Tuning 机器学习,它能够动态地分配 GPU 与 CPU 的负载与功耗,虽然并非 10nm 平台新技术,但对于 IceLake 处理器的性能表现有明显的帮助。

此外,10nm IceLake 平台全面支持雷电 3 接口、Wi-Fi 6 无线通信模块、4K 60FPS HDR 视频播放、更快的、更高质量的 HEVC 编码,并借助全新的 GEN 11 核显,支持 1080 分辨率电竞游戏的流畅运行。

IceLake 平台特性

在新特性方面,10nm IceLake 平台具备以下几点:

一,全新的 Sunny Cove 微架构;

TIPS:以下是关于 Sunny Cove 微架构技术特性的分析

Sunny Cove 微架构主要聚焦在 ST 单核性能、全新 ISA 及并行性三个方面的优化和改进,Sunny Cove 微架构主要解决以下四个问题:

其一、增强的微架构,可并行执行更多操作。

其二、可降低延迟的新算法。

其三、增加关键缓冲区和缓存的大小,可优化以数据为中心的工作负载。

其四、针对特定用例和算法的架构扩展。例如,提升加密性能的新指令,如矢量 AES 和 SHA-NI,以及压缩 / 解压缩等其它关键用例。

对于处理器来说,IPC 强弱与 CPU 性能有直接关系。英特尔在 Sunny Cove 微架构 IPC 性能提升方式上给出了三个字:更深(deeper)、更宽(wider)、更智能(smarter)。

更深方面,Sunny Cove 微架构表现在 L1 容量的增加,从 32KB 增加到 48KB,而且 L2 缓存、uop、TLB 缓存都更大;

更宽主要体现在执行管线上,Sunny Cove 微架构分配单元从 4 个增加到 5 个,执行接口从 8 个增加到 10 个,L1 Store 带宽翻倍。

而想要让更深、更宽发挥出应用的实力,那么就需要有更好的算法。Sunny Cove 的 smarte 就是为此而设计。英特尔研究院院长宋继强在解答这个问题时主要提及两个方面,其一是提高分支预测精度,其二是减少延迟。另外英特尔还为 Sunny Cove 微架构配置了加密解密指令集,并在 AI、存储、网络、矢量等方面进行全方位改进。因此对于 PC 用户来说,无论是消费级还是服务器用户,Sunny Cove 微架构带来的变化要比 10nm 这个制程节点数据更有意义。

Sunny Cove 微架构示意图

二,高带宽、低延迟特性;

三,全新的内存控制器,支持 LP4/x-3733 和 DDR4-3200 高速内存;

四,搭载性能更强,最高拥有 64EU、1TFLOP 运算能力的 GEN 11 核芯显卡;

五,支持 10bit 4K 60FPS、10bit 8K 30FPS 视频编码;

六,支持 5K 60FPS 或 4K 120FPS、DP 1.4 以及 BT.2020 色域

七,高达 16MP 图像处理器单元。

从新特性来看,10nm IceLake 平台的主要升级点除了新架构之外,最重要的是提升了图形、显示部分的性能表现。

10nm 制程工艺新特性及芯片架构示意

10nm IceLake 将 PCH 封装到一个芯片上,而 PCH 芯片则由 14nm 制程工艺打造。集成 Wi-Fi 6 GIG+ 和新的电源管理,整合 802.11ax,并能够更好的控制 CPU 和 PCH 的能耗和功耗。

PCH 采用 14nm 工艺打造

此外,Audio DSP 是英特尔第 8 代酷睿时候就具备的功能,它的主要作用是支持低功耗下的语音唤醒。而相对于 8 代酷睿来说,英特尔对 10 代酷睿的 Audio DSP 做了进一步优化,在功耗表现更好。另外在 I/O 接口方面没有新的变化。

二、10 代酷睿处理器封装规格与基本参数

了解了制程架构相关信息之后,我们来看看英特尔 10 代酷睿的相关规格。

首先来看处理器封装规格。英特尔 10 代酷睿针对 9W 和 15W 功耗处理器进行了不同规格的封装,9W 处理器芯片规格为 26.5 × 18.5 × 1.0mm,针脚间距 0.43mm;15W 芯片规格为 50 × 25 × 1.3mm,针脚间距 0.65mm。二者均采用 BGA 封装,插槽规格分别为 1526 和 1377。

处理器封装规格

两种尺寸的 10 代酷睿芯片

英特尔 10 代酷睿首批产品拥有酷睿 i3、酷睿 i5 以及酷睿 i7 三个型号,没有酷睿 i9。TDP 主要为 9W、15W、28W,采用 4 核 8 线程,缓存为 8MB,最高频率 4.1GHz。

其中,英特尔酷睿 i3 全部、以及酷睿 i5 绝大部分处理器显卡为 UHD 核显,酷睿 i5 极少数型号以及酷睿 i7 最高支持英特尔 Iris Plus 核显,且最高支持 64EU 锐炬核显。

此外前面也提到了,10 代酷睿支持 LP4/x-3733 以及 DDR4-3200 规格高速内存条。

英特尔 10 代酷睿基本参数

TIPS:关于基本参数的分析

从基本参数来看,英特尔 10 代酷睿在核心数上与第 8 代酷睿相比没有变化,TDP 基本保持一致。9W 主要放在 Y 系列上,相对 8 代酷睿的 Amber Lake Y 系列 7W TDP 来说,略有提升;15W 主要放在 U 系列处理器上,与 8 代酷睿相比保持不变。

不过细心的朋友可能发现了,英特尔 10 代酷睿频率有所下降,Max Turbo 最高到 4.1GHz,这可能会导致英特尔 10 代酷睿在跑分上与 8 代酷睿相比提升较少。

另外,之所以降低频率,主要原因是一部分 TDP 分配给了 GEN 11 核显,为了平衡功耗,降低主频是必须去做的妥协。

三、GEN 11 核显规格分析

GEN 11 核显是英特尔 10 代酷睿非常重要的一个新要素。在年初的 CES 上,英特尔透露了 GEN 11 核显的基本信息。在架构层面,英特尔 GEN 11 核显最高集成 64 个执行单元(EU),而第 9 代核显只有 24 个。它们分为四个区块 ( slice ) ,各有两个媒体取样器、一个 PixelFE、载入 / 存储单元,每个区块又细分为两个子区块 ( sub-slice ) ,都有自己的指令缓存、3D 取样器。

GEN 11 核显架构渲染图

英特尔对 EU 内的 FPU 浮点单元进行了重新设计,不过 FP16 单精度浮点性能没有变化,同时每个 EU 继续支持七个线程,共 512 个并发流水线,同时重新设计了内存界面,三级缓存增大至 3MB。

Iris Plus 最大能达到 64EU

另外 GEN 11 核显支持 Adaptive Sync(适应性同步)技术,相对于 NVIDIA G-Sync 来说成本更低。

伴随 GEN 11 核显而来的,还有全新的显卡控制界面。该界面除了针对显卡的各项调试功能之外,还支持超过 40 款游戏的入库和快捷启动。同时我认为,全新的显卡界面也是在为英特尔 Xe 独显做准备。

全新的显卡控制面板

Command Center 细节

TIPS:关于 GEN 11 核显更多信息

其实除了最大的 64EU 规格,再向下也有 32EU 规格核显,主要放在酷睿 i3 和低端的酷睿 i5 处理器上。

Iris Plus 也是 10 代酷睿的一大亮点,64EU 主要放在酷睿 i7 处理器上。另外,高端的酷睿 i5 处理器和酷睿 i7 处理器也会搭载 Iris 核显。

此外,显卡主频提升到了 1.1GHz

四、10nm IceLake 创新生态解读

与以往新制程平台单纯聚焦处理器芯片不同,英特尔 10nm IceLake 更强调整个创新生态。因此在 10nm IceLake 处理器、GEN 11 核显之外,Wi-Fi 6 GIG+、Optane H10 混合固态盘、Thunderbolt 3 扩展以及 AI 层面的性能、功耗辅助等,应该与处理器放在一起去看,这才是一个完整的 10nm IceLake。

首先来说 Thunderbolt 3。

3 月初,英特尔宣布向 USB Promoter Group 开放 Thunderbolt 协议规范,从这一刻开始,无论是 PC 设备、平板设备,还是任何形式的外接扩展设备,都可以免版税的形式构建兼容 Thunderbolt 标准的芯片。与此同时,USB Promoter Group 宣称将发布基于 Thunderbolt 协议的 USB 4 规范。

这意味着,在该标准协议框架下,USB 4 物理连接器将与 Thunderbolt 3 和 TYPE-C 相同,带宽方面得到提升,达到 40Gbps,这与 Thunderbolt 3 接口一致,也就是说,USB 4 规范将兼容 Thunderbolt 3。

雷电 3 接口功能强大

Thunderbolt 3 是目前最强的物理接口,双向带宽达到 40Gbps,是现有速度最快的 USB TYPE-C 3.1 Gen 2 接口的四倍,且雷电 3 接口支持 4K 60fps 视频传输,支持 100W PD 协议供电,支持外接桌面级显卡,因此可以说是目前最为强大的接口扩展标准。

现有的雷电平台架构

全新的雷电平台架构,主要优化了 CPU 和 PCH 通路,使其具备更高的效率

在 10nm IceLake 平台上,英特尔对 Thunderbolt 3 架构做了新的优化,对比上面两张架构图,其实大家可以很明显的看出以往和现在雷电平台架构的差异。主要就是优化了 CPU、PCH 到接口物理层的结构,使得数据传输效率更高,延迟更低。

同时,英特尔在 10nm IceLake 平台上直接植入 ThunderBolt 3,包括入门级的酷睿 i3 平台。

Wi-Fi 6 GIG+ 也是英特尔 10nm IceLake 的重要组成部分。

目前,Wi-Fi 5 为 802.11AC 标准,QAM 最高为 256;Wi-Fi 6 为 802.11AX 标准,QAM 最高为 1024。拥有更快的响应速度、更强的稳定性和更快的速度。延迟降低 75%、覆盖范围提升 4 倍,支持更多设备的稳定连接。

性能方面,160MHz 频宽 Wi-Fi 6 GIG+ 最高可以做到 1.68G 传输速度,相对于 80MHz 频宽标准的 2 × 2 Wi-Fi 6 有 3 倍的速度优势。同时相对于 80MHz 频宽标准 2 × 2 AC 而言,速度提升 40%。

标准 2 × 2 AC 与 AX 速率对比

英特尔 Wi-Fi 6 无线网卡拥有两种规格,采用了全新的设计,如下:

两种规格的 Wi-Fi 6 模块

左侧是基于 14nm 制程打造 2230 规格无线网卡,右侧是基于 28nm 制程打造的 1216 规格网卡。

总体来说,英特尔 Wi-Fi 6 具有以下两大明显优势:

其一,支持多设备连接,更稳定;

其二,对延时有更好的管理和控制。

年初 CES,英特尔公布了全新的傲腾 H10 混合固态盘,相对于以往的 Optane Memory 来说,傲腾 H10 混合固态盘主要在于把 Optane Memory 与英特尔 QLC 固态硬盘整合在了一起。因此将 Optane Memory 的非易失性存储特性以及低延迟、快速响应、性能一致性等特点。与英特尔 QLC 3D NAND 技术的高单元密度、低成本特性,很好的结合在了一起。

傲腾混合式固态盘特性

作为 10nm IceLake 生态上的重要一环,英特尔傲腾 H10 混合式固态盘,可将文档打开速度提高 2 倍;多任务处理状态下,游戏启动速度提高 60%;媒体文件打开速度提高 90%。相对于普通 NAND 固态硬盘而言,傲腾混合式固态盘拥有更快的速度、更好的性能。与独立的 TLC 3D NAND 固态盘系统相比,英特尔傲腾混合式固态盘不仅能够更快地访问常用应用和文件,还能加速后台活动的响应。

傲腾 H10 混合固态盘拥有三种规格:16GB(英特尔傲腾内存)+256GB(存储)、32GB(英特尔傲腾内存)+512GB(存储)、32GB(英特尔傲腾内存)+1TB 存储。

五、10nm IceLake 性能标准

目前,英特尔 10nm IceLake 只是处在发布状态,产品还未正式落地,不过 10nm 整体进程的推进速度应该有所加快。所以在性能层面,目前我们只能通过英特尔的官方数据来窥知一二。

英特尔在发布 10nm IceLake 处理器与 GEN 11 核显的同时,特意强调了 1080P 电竞游戏的流畅运行。通过下面图标可见,搭载 Intel Iris Plus 核显的 10 代酷睿处理器能够在相应的画质模式下,较为流畅的运行一些常见的电竞游戏,如 CS:GO、彩虹六号、坦克世界、堡垒之夜等,相对于现阶段 8 代酷睿的 UHD 620 核显来说,图形性能提升还是比较大的。

1080P 电竞游戏运行帧数

在处理器性能上,英特尔目前只给出了 15W 单线程的表现,从下图可见,10 代酷睿性能提升接近 1.5 倍,大概为 1.48 倍左右。如果以相邻代数性能提升倍数做参考的话,性能提升幅度不算很大。

15W 单线程性能

IPC 是处理器性能的重要指标。Sunny Cove 微架构为 10 代酷睿带来了 18% 的 IPC 性能提升,相对于 SkyLake 微架构有 1.4 倍的提升。另外这里需要说明的是,英特尔给出的 IPC 提升 18% 数据是通过 5 个 Benchmark 测试出来的结果,18% 是一个平均下来的水平线。

另外,结合单线程 1.48 倍性能以及之前提到的主频来看,其实可以看出英特尔 10 代酷睿为了保证 GEN 11 核显的性能,因此将 CPU 与 GPU 之间的功耗分配做了一定的平衡。

IPC 提升 18%

此外,10 代酷睿在引入 AI 加速之后,能够更好的动态控制能耗和功耗,智能化的挑选最优核去做高负载任务,给处理器核心效率(注意是核心效率)带来不小的提升。

英特尔 AI 加速有三个层面:一是 CPU 通过深度学习降低延时;二是也可以用 GPU 来进行智能的应用加速;三是拥有更好的性能表现。

TIPS:关于英特尔 AI 加速功能的说明

英特尔 AI 加速功能主要是通过 AI 技术,分析并判断出哪些核心处于最优状态,在高负载任务时会优先选择这些核心来承担负载。

而以往英特尔加速功能是随机选择核心来承担负载,这些核心可能并未处在最优状态,所以有可能造成效率的滞后。

DL Boost AI 加速

六、结语

英特尔 10nm 制程工艺可谓是 " 千呼万唤始出来 ",而英特尔第 10 代酷睿又是第一代 10nm 制程落地的产品,所以其重要性不言而喻。无论是关注这个领域的普通消费者,还是行业内的合作伙伴,亦或是竞争对手都在盯着英特尔 10 代酷睿,其最终表现究竟如何,还是需要产品上市之后再做检验。

英特尔 10 代酷睿

不过,英特尔通过 10 代酷睿给业界带来了一个新的信号,即生态化、平台级的创新或将主导未来 PC 产业的方向。

伴随 10 代酷睿处理器,英特尔还带来了新的无线网络技术、新的存储技术、新的 AI 技术、更强大的图形技术以及最先进的接口技术,这些技术将为基于 10 代酷睿平台打造的 PC 产品带来全方位的体验,而不仅仅是局限在处理器一个部件上的比拼。

其实对于占比极大的普通消费者来说,处理器计算能力已经足够满足 90% 以上的应用需求。相反,存储瓶颈、接口瓶颈、网络瓶颈却在影响着我们的体验、制约着效率的提升,Wi-Fi 6、Thunderbolt 3、Optane H10 正式解放这些瓶颈的关键所在,相比一味提升处理器性能,全方位的提升才能带给我们体验更好、更全面的设备,这才是英特尔 10nm、10 代酷睿的价值所在。

【来源:中关村在线】

THE END
广告、内容合作请点击这里 寻求合作
业界
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

早在今年三月份的时候,华为高级副总、消费者终端部门 CEO 余承东接受了德国媒体 Welt 采访,采访中余承东表示—— " 我们准备好了自己的操作系统,如果我们不能再使用(安卓、Windows)这些系统,我们就...
业界
今年的苹果全球开发者大会(WWDC19)将于北京时间 6 月 4 日凌晨 1 点在美国加州圣何塞开始举行,届时 IT 之家将应邀前往参会并全程直播,敬请关注。
业界
现在用无人机或无人车来送货,已经成了一件很普通的事。
业界
海盗船宣布推出采用 PCIe 4.0 的 MP600 NVMe SSD,这也是全球首批量产消费级 PCIe 4.0 高速固态硬盘的硬件厂商。
业界
华为创始人任正非今晚接受央视采访,提到华为不会死,他们的一些高端产品并不靠美国而是靠自己。在华为遭遇的断供问题中,ARM 指令集授权、蓝牙、WiFi 认证等问题并不是最严重的,华为最薄弱的一环是先进...
业界

相关推荐

1
3