全文 —— 我之前已经诠释过,,LPX 的应用场景并不普遍,,主要面向拥有大宗差别 Token 效劳组合的客户,,针对高 Token 速率的高端效劳,,客户数目未几,,但 Token 速率极高。。。。。
这与我此前的表述完全一致,,我仍维持这一判断。。。。。我预计 LPX 和其他基于流解码、专注高 Token 速率天生的加速器,,在未来一段时间内仍将是小众产品。。。。。
如你们所知,,Grace Blackwell和Vera Rubin支持人工智能的全生命周期,,从数据处置惩罚、训练准备、预训练、微调、强化学习一直到推理。。。。。
Grace Blackwell是全球完成所有这些使命的最佳平台。。。。。在某些情形下,,只要效劳提供商已拥有高 Token 速率效劳,,我们就可以搭配 LPX,,让其效劳体现更精彩。。。。。

至于市场份额是 20% 照旧 10%,,取决于人工智能的生长阶段。。。。。现在远低于 20%,,未来高端 Token 场景可能抵达 20%。。。。。
我们已准备好与效劳提供商相助,,实现这一能力,,我对此感应兴奋。。。。。美银美林证券剖析师Vivek Arya:谢谢列位接受提问。。。。。关于用于署理应用的CPU,,现在有许多令人兴奋的新闻,,同时也有许多关于CPU数目现实上凌驾GPU数目的讨论。。。。。
我希望能听听你们的看法:首先,,这是否是增量事情负载,,是否会蚕食GPU原本应该肩负的事情负载????其次,,你给出的200亿美元的数字,,是指自力的Vera CPU,,照旧已经包括在Vera Rubin中的Vera部分????
我们正在加速全球所有工具、数据处置惩罚引擎和数据库引擎,,由于智能体使用这些工具,,且它们的耐心比人类更低,,要求快速响应。。。。。因此我们推动所有工具基于 CUDA 运行在 GPU 上,,速率更快。。。。。
我们未来需要大宗 CPU,,而Vera是专为智能体设计的 CPU。。。。。已往的 CPU 设计拥有大宗焦点,,便于租赁,,云盘算的古板经济模式是按焦点收费。。。。。
而未来人工智能的经济模式是按 Token 收费,,即每美元能爆发几多 token。。。。。我们未来需要做的是尽可能快速地天生和处置惩罚 Token,,而Vera在这方面体现极为精彩。。。。。
因此,,我们期待NVLink72能够大获乐成,,它需要极其强盛的清静性和保密盘算能力,,这也是Vera Rubin成为全球首个端到端保密盘算平台的缘故原由。。。。。
并且,,你知道的,,它还需要强盛的CPU。。。。。我们已经准备好了,,所有方面都已笼罩。。。。。