英特尔打造全球最大的神经拟态系统,以实现更可持续的人工智能

发布时间:2024-04-19      浏览量: 271

image.png

最新动态: 4月17日,英特尔宣布已打造出世界上最大的神经拟态系统。这个代号为Hala Point的大规模神经拟态系统最初部署在桑迪亚国家实验室,采用英特尔 Loihi 2 处理器,旨在支持未来类脑人工智能(AI)的研究,并解决与效率和可持续性相关的挑战当今的人工智能。 Hala Point 推进了英特尔第一代大型研究系统 Pohoiki Springs的发展,其架构经过改进,神经元容量提高了 10 倍以上,性能提高了 12 倍。

“当今人工智能模型的计算成本正在以不可持续的速度上升。该行业需要能够扩展的全新方法。因此,我们开发了 Hala Point,它将深度学习效率与新颖的类脑学习和优化功能相结合。我们希望与 Hala Point 的研究能够提高大规模人工智能技术的效率和适应性。”

           ——Mike Davies,英特尔实验室神经拟态计算实验室主任

用途:  Hala Point 是第一个在主流人工智能工作负载上展示最先进计算效率的大型神经拟态系统。表征表明,在执行传统深度神经网络时,它可以支持每秒高达 20 千万亿次操作,即 20 petaops,效率超过每秒每瓦 15 万亿次 8 位操作 (TOPS/W)。这可以与基于图形处理单元 (GPU) 和中央处理单元 (CPU) 的架构相媲美并超过其所达到的水平。 Hala Point 的独特功能可以实现未来人工智能应用的实时 持续学习, 例如科学和工程问题解决、物流、智能城市基础设施管理、大语言模型 (LLM) 和人工智能代理。

如何使用: 桑迪亚国家实验室的研究人员计划使用 Hala Point 进行先进的大脑规模计算研究。该组织将专注于解决设备物理、计算机体系结构、计算机科学和信息学方面的科学计算问题。

“与 Hala Point 合作提高了我们桑迪亚团队解决计算和科学建模问题的能力。使用这种规模的系统进行研究将使我们能够跟上人工智能在商业、国防和基础科学等领域的发展步伐。”桑迪亚国家实验室 Hala Point 团队负责人 Craig Vineyard 说道。

目前,Hala Point 是一个研究原型,将提高未来商业系统的功能。英特尔预计这些经验教训将带来实际进步,例如法学硕士能够从新数据中持续学习。这些进步有望显着减轻广泛人工智能部署带来的不可持续的训练负担。

为什么重要: 最近将深度学习模型扩展到数万亿个参数的趋势暴露了人工智能领域令人畏惧的可持续性挑战,并强调了在最低硬件架构层面进行创新的必要性。神经形态计算是一种全新的方法,它借鉴了神经科学的见解,将内存和计算与高粒度并行性集成在一起,以最大限度地减少数据移动。在 本月举行的国际声学、语音和信号处理会议 (ICASSP)公布的结果中 ,Loihi 2 展示了新兴小规模边缘工作负载1的效率、速度和适应性方面的数量级提升。

Hala Point 在其前身Pohoiki Springs 的基础上进行了大量改进,现在为主流传统深度学习模型带来了神经拟态性能和效率提升,特别是那些处理视频、语音和无线通信等实时工作负载的模型。例如,爱立信研究中心正在应用 Loihi 2 来优化 电信基础设施效率,正如今年世界移动大会上所强调的那样。

image.png

image.png

关于 Hala Point:  Loihi 2 神经形态处理器构成了 Hala Point 的基础,应用了受大脑启发的计算原理,例如异步、基于事件的尖峰神经网络 (SNN)、集成内存和计算以及稀疏且连续变化的连接实现能源消耗和性能的数量级提升。神经元直接相互通信,而不是通过内存进行通信,从而降低了总体功耗。

Hala Point 将在 Intel 4 工艺节点上生产的 1,152 个 Loihi 2 处理器封装在一个微波炉大小的六机架单元数据中心机箱中。该系统支持分布在 140,544 个神经形态处理核心上的多达 11.5 亿个神经元和 1,280 亿个突触,最大功耗为 2,600 瓦。它还包括 2,300 多个用于辅助计算的嵌入式 x86 处理器。

Hala Point 将处理、内存和通信通道集成在大规模并行结构中,提供总共 16 PB/s 的内存带宽、3.5 PB/s 的内核间通信带宽和 5 TB/s 的带宽( TB/s)的芯片间通信带宽。该系统每秒可以处理超过 380 万亿个 8 位突触和超过 240 万亿个神经元操作。

应用于仿生尖峰神经网络模型时,该系统可以以比人脑快 20 倍的速度执行其 11.5 亿个神经元的全部容量,并且在较低容量下的速度最高可达 200 倍。虽然哈拉点并非用于神经科学建模,但其神经元容量大致相当于猫头鹰大脑或卷尾猴的皮质。

基于 Loihi 的系统可以使用比传统 CPU 和 GPU 架构快 50 倍的速度执行 AI 推理并解决优化问题,能耗减少 100 倍。通过利用高达 10:1 的稀疏连接和事件驱动的活动,Hala Point 的早期结果表明,该系统可以实现高达 15 TOPS/W 2的深度神经网络效率 ,而无需将输入数据收集到批次(这是一种常见的优化)对于显着延迟实时到达的数据(例如来自摄像机的视频)的处理的 GPU。尽管仍处于研究阶段,未来具有持续学习能力的神经拟态法学硕士可以通过消除使用不断增长的数据集进行定期重新训练的需要,从而节省千兆瓦时的能源。

下一步:  Hala Point 向桑迪亚国家实验室交付标志着英特尔计划与其研究合作者共享的大型神经拟态研究系统新系列的首次部署。进一步的开发将使神经形态计算应用程序能够克服限制人工智能功能在现实世界中实时部署的功率和延迟限制。

英特尔与由 200 多名英特尔神经拟态研究社区 ( INRC ) 成员组成的生态系统(包括全球领先的学术团体、政府实验室、研究机构和公司)一起,致力于突破类脑人工智能的界限,并从研究原型开始推进这项技术未来几年行业领先的商业产品。


从设计到生产

灏域为您提供

全产业链解决方案

开始我们的合作

+86 18600523371