电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

2026世界杯

2026世界杯

6686体育官方网站 存储器行业加大对下一代技能“HBM-PNM”的接洽力度

发布日期:2026-05-13 13:16 来源:未知 作者:admin 浏览次数:

6686体育官方网站 存储器行业加大对下一代技能“HBM-PNM”的接洽力度

HBM4的推出,逻辑芯片的制造工艺已领受5纳米或更小的先进工艺,裁汰了PNM技能的实施门槛。

跟着HBM4行将量产,存储器半导体行业正全力进入下一代技能“HBM-PNM”的接洽。此举备受关怀,被视为为以“可筹画存储器”为中心的新期间作念准备,该期间平直在存储器里面责罚筹画,突破了以显卡(GPU)为中心的架构的截至。

据业内东说念主士11日显露,由三星电子、英伟达、加州大学圣地亚哥分校、哥伦比亚大学和延世大学构成的连结接洽团队最近在arXiv上发表了一篇对于AMMA(多芯片内存中心架构)技能的论文,展示了HBM-PNM技能的可行性。

PNM(近内存责罚)技能通过将畸形的筹画单位摈弃在HBM堆栈的逻辑芯片上,平直在内存足下实验筹画。现存的PIM(内存内责罚)依次将筹画电路摈弃在存储单位里面,而PNM的上风在于省略在保握内存容量的同期,完了更复杂、更无边的筹画。

现在,大型谈话模子(LLM)奇迹的最大瓶颈在于解码阶段的着重力机制。在对长高下文进行解码着重力时,GPU向上95%的筹画智商处于闲置现象,导致内存带宽着实被饱和诈欺。

即使是Rubin GPU,分析也自大,其筹画中枢(占封装面积的67%,功耗的73%)在永劫期运转的情况下内容诈欺率仅为4%至5%傍边。这变成了资源滥用,亦然导致功耗加多和发烧问题的主要原因。

跟着HBM4的推出,逻辑芯片的制造工艺已领受5纳米或更小的先进工艺,裁汰了PNM技能的实施门槛。该接洽团队提议的AMMA决策移除了现存GPU的筹画芯片,NBA篮球投注app官网下载并将16个HBM-PNM立方体以4×4网格结构贯串起来。这使得封装内的内存带宽进步至44TB/s,约为现存架构的两倍。

在内容接洽中,与NVIDIA H100比拟,AMMA架构将着重力延伸裁汰了15.5倍,能耗裁汰了6.9倍。其速率也比下一代Rubin GPU快1.8到2.5倍,能效提高了2.6到3.1倍。尤其值得一提的是,它在责罚百万级(1M Context)的超长高下文推理和智能体使命负载方面进展出色。

接洽团队暗示:“通过这项接洽,咱们旨在解释以内存为中心的架构有后劲成为GPU除外的新式架构,并促进对下一代系统的接洽,在这些系统中,6686体育官方网站以内存为中心的加快器在异构平台中施展着关节作用。”

中国开云体育一站式服务入口

在摩尔定律的发展的几十年里,责罚器、存储器等组件箝制发展,责罚器算力、存储器存储量齐得到了大幅进步。但与之而来的,就是“存储墙”、“带宽墙”、“功耗墙”等问题。由于责罚器的峰值算力每两年增长3.1倍,而动态存储器的带宽每两年增长1.4倍,存储器的发展速率远过期于责罚器,进出1.7倍。CPU时钟速率与片外内存和磁盘驱动器I/O速率之间的差距越来越大。比如,动态立地存储器DRAM(Dynamic Random Access Memory)是芯片领域“最巨额单一产物”,精密工业制造的王冠之一,被喻为贯串中央责罚器(CPU)的“数据高速公路”。其功能是暂存正在运转的多样门径和数据,是一种易失性存储器,即断电后数据就丢失。DRAM由于其较差的可扩张性和极高的假想资本明锐性(每比特资本),其发展相对较慢,在10nm技能节点就遭受了天花板。

存储墙导致访存时延高,后果低,存储器的数据拜谒速率跟不上责罚器的数据责罚速率,存算性能失配。为了坑害存储墙,如故提议了大齐的接洽使命来优化DRAM架构,上文提到的近存筹画就是一种,此外还有存内筹画等道路。

存内筹画是在内存中完成部分筹画,在责罚器中完成部分筹画。相较于内存筹画将筹画所需的所终点据放入到内存中,通盘筹画由责罚器完成,存内筹画裁汰了数据在内存与高速缓存,高速缓存与CPU之间挪动的能耗,提高内存筹画系统的性能。其中枢上风在于高算力、低功耗、低延伸,主要分为端侧(小算力低功耗)、边侧(中算力及时责罚)和云侧(高算力)。典型应用领域包括:末端及物联网(IoT)场景、角落筹画及AI忖度场景以及云表/大范畴筹画场景。

*声明:本文系原作家创作。著述内容系其个东说念主不雅点,自身转载仅为共享与扣问,不代表自身推奖或招供,如有异议,请辩论后台。

思要取得半导体产业的前沿洞见、技能速递、趋势理会6686体育官方网站,关怀咱们!