苹果 M3 Ultra + 双英伟达 DGX Spark 并联,AI 性能提升 2.8 倍

  发布时间:2025-11-06 13:56:05   作者:玩站小弟   我要评论
IT之家 10 月 17 日消息,EXO Labs 昨日展示了其“分布式推理”新成果,解决了被部分网友戏称为“世纪难题”的选择问题 —— 买 AI 小主机究竟是买苹果 Mac Studio 还是买英伟 。

IT之家 10 月 17 日消息,苹果EXO Labs 昨日展示了其“分布式推理”新成果,双英解决了被部分网友戏称为“世纪难题”的伟达鄂州市某某洗涤用品售后客服中心选择问题 —— 买 AI 小主机究竟是买苹果 Mac Studio 还是买英伟达 DGX Spark?

如图所示,EXO Labs 同时使用了两台 NVIDIA DGX Spark 与一台搭载 M3 Ultra 芯片的并联倍 Mac Studio,在 AI 大语言模型推理测试中取得 2.8 倍性能提升。提升


该成果基于 EXO Labs 的苹果开源项目 EXO,该框架旨在让大语言模型(LLM)能够高效运行于不同硬件的双英混合环境中。

与传统仅依赖单一 GPU 或加速器的伟达推理方式不同,EXO 可将工作负载自动分配到多种设备上,并联倍使台式机、提升笔记本、苹果鄂州市某某洗涤用品售后客服中心服务器甚至平板电脑与智能手机组成类似 WiFi Mesh 网络的双英“AI Mesh”。

DGX Spark 与 M3 Ultra 的伟达互补组合

正如 EXO 所述,3999 美元(IT之家注:现汇率约合 28505 元人民币)的并联倍 DGX Spark 侧重计算性能,而 5599 美元(现汇率约合 39910 元人民币) Mac Studio 则在数据带宽上更具优势。提升在这里,EXO 直接将两台 DGX Spark 与一台 Mac Studio 组合成统一的 AI 系统。


大型语言模型的推理过程通常分为两个阶段:

  • 预填充(prefill)阶段:模型读取和处理输入提示,这一阶段主要受计算性能限制;
  • 解码(decode)阶段:模型逐个生成新词元(token),此过程更依赖内存带宽。


EXO 的方案是将两阶段分配给不同设备执行:

DGX Spark 负责计算密集的预填充任务,而 M3 Ultra 负责带宽敏感的解码任务。系统通过逐层传输模型的内部数据(称为 KV 缓存),实现两台设备的同时工作,而非依次等待。

在使用 Meta Llama-3.1 8B 模型进行的基准测试中,该混合架构相较单独使用 Mac Studio,推理性能提升 2.8 倍。测试中 DGX Spark 的预填充速度比 Mac Studio 快 3.8 倍,而 Mac Studio 的生成速度又比 DGX Spark 快 3.4 倍,实现了性能互补。


“分布式推理”助力低成本扩展 AI 算力

EXO 的实验展示了一种不同于传统单机加速的 AI 扩展思路。未来 AI 性能的提升,或不再依赖单一大型加速器,而是通过更智能的硬件协同实现整体算力的提升。

类似的理念也出现在 NVIDIA 自家的新一代 Rubin CPX 平台设计中:计算密集型的上下文构建由 Rubin CPX 处理器完成,而具有高带宽 HBM3e 内存的标准 Rubin 芯片负责解码阶段,与 EXO 在现成硬件上实现的原理一致。

EXO 1.0 仍处早期阶段

EXO 当前的早期访问版本 1.0 仍属实验性质,尚未全面公开。现有的开源版本 0.0.15-alpha 发布于 2025 年 3 月,后续版本计划引入自动调度、KV 流式传输和异构硬件优化功能。

目前 EXO 仍是研究级工具,尚不适合普通消费者直接使用,但其演示结果表明:通过智能调度不同硬件资源,分布式推理架构能在无需大型数据中心的前提下显著提升 AI 性能。

相关文章

  • 加沙地带卫生部门:以方移交巴人员遗体有遭虐待痕迹

      加沙地带卫生部门11月1日表示,以色列所归还的巴勒斯坦在押人员的遗体有遭受枪击、破坏和虐待的痕迹。目前巴方只辨认出了75具遗体身份。  另据加沙城市政部门1日表态,加沙城市区街道上所堆积的垃圾达到
    2025-11-06
  • 伊姐周日热推:综艺《向往的生活

    综艺《向往的生活-戏如人生》正在热播《向往的生活-戏如人生》是湖南卫视推出的生活服务纪实节目,由黄磊、何炅、彭昱畅、张子枫担任常驻嘉宾。伊姐看点:节目以“戏剧”为核心主题,在家人般的默契互动与治愈日常
    2025-11-06
  • “这条裙子”才是今年的顶流,怎么搭都时髦

    秋天的裙子,总带着一种独有的氛围感。风吹落叶,光影斑驳,人们总想穿上一条裙子,以飞扬的裙摆回应季节的流转。今年秋天的裙子有一个非常明显的变化,下摆的设计不再循规蹈矩,而是愈发丰盈而灵动。不规则的裁片、
    2025-11-06
  • 特斯拉进入平价棋局,起售价不足4万美元的新车又是鲶鱼?

    【导语:近日,特斯拉在美国市场正式推出廉价版Model 3参数丨图片)和Model Y,以36990美元的起售价突破价格壁垒。这一战略看似是对市场竞争的积极回应,但取消了座椅通风、后排屏幕等科技配置,
    2025-11-06
  • 英伟达GTC华盛顿夜:黄仁勋撒钱、造芯、造梦

    出品 | 网易科技《态度》栏目作者 | 崔玉贤编辑 | 丁广胜扩张还在继续,英伟达又撒钱了,这次撒向的是电信行业。GTC2025华盛顿站,英伟达CEO黄仁勋宣布向诺基亚投资10亿美元,重构电信版图。消
    2025-11-06
  • 今年秋冬最流行的外套竟然是它?谁穿谁时髦!

    秋天,是适合穿皮衣的季节。气温微凉,空气干净清透,阳光的温度撒向大地,而皮革的质感在光影之间被放大——既有温度,也有力量。此时,街头开始涌现形形色色的皮革单品......穿上一件皮衣,它能让女人的柔软
    2025-11-06

最新评论

pjd.laoying.sbs