
Xin Zhiyuan报告编辑:KingHz [Xin Zhiyuan简介]推理模型开始“自言自语”,计算的数量进入关键点... AI导航期已经开始。这不是产品发布会,而是未来的预测。在巴黎GTC会议上,黄·雷克森(Huang Renxun)开始演讲!这次他脱下了皮夹克。 Huang Renxun告诉巴黎:“ AI是世界上最大的平等工具。”他说,人工智能将无法控制反乌托邦或垄断灾难,这是解放人类的工具。在巴黎GTC会议之后的新闻发布会上,Huang Renxun认为AI改变了工作场所,但拒绝了Dario Amodei最近关于AI的预测,导致了重大失踪:扩大整个Teksto
每个人的工作都会发生变化。尽管将更换一些职位,但也会出现大量新比赛...
当公司提高生产力时,他们会雇用很多人。
在这个时间,NVIDIA还签署了一个巨大的主持人:它直接销售10,000 GPU!
这些GPU将用于开发全球范围内的第一个工业AI平台,该平台加速了制造欧洲工业巨头的应用。
许多人在前往欧洲的旅程中获得了NVIDIA,包括在法国,德国,意大利和其他国家进行合作。
关于
此外,我们已经与一些公司和研究机构建立了合作关系,包括与Mistral合作以生产AI云服务。
Huang Renxun还宣布了DGX LEP Projectton,以帮助欧洲扩大其AI影响力:
DGX Cloud Lepton将欧洲开发商与全球AI基础架构联系起来。我们与来自欧洲的合作伙伴合作,为开发人员,研究人员和企业建立AI工厂网络,以扩大全球变化的本地成功。
这意味着客户将自动从不同的云平台转移急诊工作负载介绍用户界面和软件体验的理论维护。
如果DGX Lepton成功,它将为所有新云创造标准的用户体验,价值和绩效水平,这将导致激烈的价格战,最终将把收入降低到超低级别的商品。
这是NVIDIA首次在巴黎举行GTC会议,该会议踢了2025年Vivatech,并宣布了从代理系统到AI工厂的AI计算的下一个阶段。
从感知AI到自主AI
这是NVIDIA的GPU,使AI革命成为可能。
AI长期以来一直是Nvidia注意的重点。
在巴黎GTC上,Huang Renxun研究了AI的发展,强调了理解,理解,推理,计划和实施活动的进步。
AI的第一波:知觉智能
早在2012年,NVIDIA与开发商合作时,新算法在“深度研究”中出现,Alexnet诞生了,这是认真的D一个很棒的AI时刻。
Alexnet的Alex Krizhevsky,Ilya Sutskever和“深度学习的教父” Hinton使用CUDA和C ++开发
在过去的15年中,AI取得了非常快的发展。
第一阶段是让计算机理解玛哈,说话和识别模式。这是“感知智力”。
第二波:生成AI
在过去的五年中,AI进入了第二阶段 - 生成人工智能Genai。
不仅可以识别AI,而且还会生成语言的图像和内容。
它具有同时理解图像和文本的能力,因此我们可以使用文本来“提示” AI创建图像。
这种能力大大提高了我们生产内容的效率。
它可以写,画,说和行动,即“内容的内容革命”开始。
为了支持开放的资源生态系统并允许开发人员和企业拥有大型世界模型,NVIDIA创建了Nemo Framework和Nemotron项目。
NEMO是由NVIDIA开发的全栈大型模型平台,Nemotron是一个特殊计划,可以提高开放资源的质量。
Llama nemotron以开源美洲驼模型为目标,该模型极大地提高了效率和准确性。
在许多领域,Nemotron模型排名第一,并且具有良好的性能。
第三波:代理AI
现在,我们进入第三波 - 代理AI(代理AI)。
情报不仅是关于内容的识别或发展,还涉及“理解,推理,计划和执行任务”。
我们开始新的AI波。
最初,智能是关于理解,理解,推理,计划任务(如何解决问题),然后执行任务。
真正的智能由三个主要循环组成:
理解
推理
规划
理解
推理
规划
这允许应用一些以前学习的规则来解决尚未看到的问题。
这就是为什么聪明人很聪明的原因。他们可以解决复杂的问题,br降低步骤 - 步骤,并考虑如何解决问题;也许他们可以进行研究,也许知道一些新信息,寻求帮助;使用工具,并求解步骤步骤。
代理AI(代理AI)具有这些功能,可以应用新问题中所学的知识,逐渐破坏复杂的问题并找到解决方案。例子:
面对看不见的问题,可以考虑步骤,寻找工具,查找信息,调用其他代理,结合上下文和完整的步骤 - 步骤任务。
NVIDIA提供了完整的Plangent形式。
企业客户使用它来生产独家代理系统:
Ciscossection):用于商业安全智能的AI平台;
SAP:在业务自动化中包括AI;
DEEPL:翻译系统的AI平台;
Photoroom:用于AI图像和视频编辑;
Kodo(以前为Kodium):AI中的AI;
IOLA:语音联系系统;
全球最大的试用自动化平台:也使用Nemo来生产代理。
思科:AI商业安全情报平台;
SAP:在业务自动化中包括AI;
DEEPL:翻译系统的AI平台;
Photoroom:用于AI图像和视频编辑;
Kodo(以前为Kodium):AI中的AI;
IOLA:语音联系系统;
Buthe World中最大的试用自动化平台:也使用Nemo来生产代理商。
第四波:进入机器人时期
在实际实现中,AI代理的体现和当前一代的功能会产生运动。
此AI不形成视频,图像或文本,而是局部运动。它可以走路或达到东西,使用工具。人工智能将自己纳入物理形式的能力通常是机器人技术。
这些功能,尤其是AI(物理机器人)实施代理(通常是信息机器人)的基本技术,就在我们面前。
从虚拟世界到现实,这是“体现AI”的世界。机器人是这种智能的物理显示。
现在,我们处于两个主要AI领域的交集:
(1)机器人信息(Chatgpt Chatgpt助手);
(2)固体机器人(可以在物理世界中起作用的AI)。
两种类型的智力都已成为现实,我们正在提供新的AI开发时期!
对于AI来说,这是一个真正激发的时刻。
但这一切始于NVIDIA的第一张图形卡:GeForce 256。
Geforce 256
加快数千个行业
GeForce携带图形图形。
这是开发的计算的第一个加速应用,图形图形的开发令人难以置信。
Geforce将CUDA带入了世界,使研究人员可以研究机器和AI研究人员在深度研究中促进。
后来,深入研究彻底改变了图形图形,使我们可以将图形图形提高到一个全新的水平。
Huang Renxun显示了计算机模拟:光子模拟,物理模拟和谷物模拟。
一切都是开始模拟,而不是动画,或艺术。
之所以如此美丽的原因是世界是美丽的,数学是美丽的。
因此,让我们一起看看。
它本质上是一个模拟,看起来非常漂亮。现在,它可以模仿几乎每个人的规模和速度,它可以 - 在数字双胞胎中。
因为每个人都可以数字化,所以我们可以在将其放置在物理世界中之前设计,计划,优化和完全工作。
一切都是建立在软件上的,Nvidia现在已经提出了这个想法:
所有物理物品都将被数字化建造。
所有伟大的事情都将是数字化的。
所有大规模运行将首先建造,并且将有数字双胞胎来操作它们。
当前的“ GB300 NVL 72”就是这样。
计算设备重2吨半,12,000个零件,约300万美元。 120千瓦,由150家工厂制成,由200个技术合作伙伴与NVIDIA合作完成
它完全放在劳动中。它被设计为思维机器。
这意味着它原因,计划和像一个人一样,花很多时间自言自语。
加速AI的推理
理解模型是自我传达的,我们需要提高性能的30至40倍。
这不再是chatgpt Q&A的类型,现在它是一种推理模型,当思考时,它会形成更多的令牌。
它将破坏步骤 - 步骤的问题和原因;尝试不同的路径:也许是思想链,也许是充满思想的最佳结果。
它反映了自己的答案。
也许您看到了这些弓箭研究的肠子,反映了答案,并说:“这是一个很好的答案吗?你能做得更好吗?”然后推理模型会说:“哦,是的,我可以做得更好。”然后回来思考更多。
因此,思维模型和识别模型实现了令人难以置信的性能,但这需要更多的计算功能。
最终,MVLink 72 Blackwells的架构为性能带来了巨大的飞跃,实现了30至40倍的性能提高仅一代。
根据摩尔定律,半导体物理学每三到五年的性能几乎两倍。
解释下图的方法是:X轴代表其思维速度。 Y轴代表同一时间支持大量用户时的工厂输出。
加速计算
NVIDIA曾经梦想着创建一个新的计算平台来完成传统计算机无法完成的任务。
他们加快了CPU的速度,并创建了一种全新的计算形式,称为“加速计算”。
他们的初步应用之一是分子动力学的模拟。从那以后,他们长期以来就生产了无数的图书馆。
实际上,使其成为唯一计算的独特计算的原因不仅是新处理器,也是您可以通过编译代码运行的软件。
您需要完全重新设计计算并重新恢复您的算法。对于大多数P来说,这是非常困难的e
说不容易以高度平行的形式重建thesoftware和算法。
因此,它们创建了不同的库,以帮助加快每个行业和每个应用领域。
每个这样的库将为开发人员打开新的可能性。
例子:
计算光刻,也许是当今半导体设计中最重要的应用之一;它运行在TSMC和三星等大型织物上,并在制作芯片之前,基于反状物理算法的过程,称为计算光刻。
稀疏的求解器,代数多网格求解器等。
CUOPT:一个新的开放资源应用程序库,可以加速决策并优化数百万变量和障碍,例如旅行者问题。
计算光刻,也许是当今半导体设计中最重要的应用之一;它正在运行大型织物,例如TSMC和三星,并在制作芯片之前,基于反状物理算法的过程,称为CO模拟光刻。
稀疏的求解器,代数多网格求解器等。
CUOPT:一个新的开放资源应用程序库,可以加速决策并优化数百万变量和障碍,例如旅行者问题。
这些只是它们提供的一些图书馆。
他们拥有超过400个类似的图书馆,每个图书馆促进了特定的应用领域,每个库都为该行业开放了新的可能性。
另一个非常重要的是CudaQ。它在数量王国中扩展了CUDA。
数量的数量计算
Nvidia已经开发了Cudaq多年了。
Huang Renxun认为:“计算量提出了重点。”
众所周知,大约30年前显示了第一个物理Qubit。
第一个误差校正算法是在1995年发明的,在2023年,大约30年后,Google显示了世界上第一个逻辑量子。从那时起,几年后,逻辑摩擦数(由大量物理磨牙代表H误差校正)开始增长。
作为摩尔定律,完全可以预期,逻辑吉比特人每5年将增加10次,每10年增加100次。这些逻辑烟草最好得到纠正,更稳定,更有能力,更灵活,当然也将继续是可生气的。
NVIDIA正在以许多不同的方式与世界各地的计算公司合作,欧洲实用的实践数量最多。
现在,NVIDIA很明显:“在未来几年中,我们可以应用计算数量,经典计算的数量,在将解决一些有趣的问题的领域。”
这是一个真正的卡帕纳时刻。
在接下来的几年中,或者至少是下一代超级计算机,它们具有QPU,并且QPU连接到GPU。 QPU当然会执行计算量,而GPU将用于预处理,控制,错误校正(这将是计算密集的),后处理,ETC。
像超速CPU一样,现在您正在音乐会中QPU和GPS来实现下一代计算。
参考:
https://www.youtube.com/watch?v=x9chonwkkn4%20
https://www.nvidia.cn/gtc/paris/keynote/
https://nvidianews.nvidia.com/news/nvidia-bilds-worlds-first-undustrial-i-cloud-cloud-cloud to-advance-european-european-obharufactriving
https://media.iprsoftware.com/219/files/20255/gtc-paris-2025-ceynote-deck.pdf
https://fortune.com/2025/06/11/nvidia-jensen-huang-sagress-sagress-thropic-ceo-ceo-dario-amodei-aig-工作/
https://abcnews.go.com/technology/wirestory/nvidia-crief-calls-calls-i------------- equalizer-equalizer-warns-europe-122745910
https://x.com/semianalysis_/status/1932802502069755956
https://blogs.nvidia.cn/blog/nvidia-dgx-cloud-bepton-crenects-europes-developers-to-global-nvidia- compute-compute-compute-compute-compute-Ecosystem/返回SOHU,以查看更多