英伟达的AI PC方案在RTX for AI交流会上首次亮相

更新时间：2024-04-25 20:39:37作者：zsbaocheng

在过去的十年里，人工智能（AI）技术已经从理论研究和小规模应用迈向全球性的技术革命，彻底改变了我们生活和工作的方式。无论是智能手机上的语音助手，还是复杂的数据分析和自动化生产线，AI 的影响无处不在，其带来的效率提升和成本降低正推动着一场前所未有的生产力革命。

为了抢占 AI 生产力的先机，不少品牌都快马加鞭拿出了自己的 AI 硬件：有的手机品牌利用 AI 技术消除拍摄照片时的运动拖影，有的用 AI 去除图片中不想要的元素，有的企业更是抢先一步发布所谓的「AI PC」标准。

这么一对比，低调行事、默默耕耘的 NVIDIA 似乎有些不合群。为了改变这一「酒香巷更深」的局面，NVIDIA 近年来也在努力增加自己在 AI 领域的曝光机会，想办法让更多的用户意识到 NVIDIA 在游戏显卡之外的领先技术——2024 年 4 月 24 日，NVIDIA 在深圳举办了名为 RTX For AI 的线下交流会，让大家能亲身体会 NVIDIA 是如何「撑起 AI 半壁江山」的。

图片来源：雷科技

尽管 NVIDIA 不是第一个提出 AI 这一概念的企业，但从产品和技术的角度看，包括 AI 在内的众多计算机历史性节点，背后都或多或少有着 NVIDIA 的支持：2008 年，NVIDIA发布了 GeForce 8800 GTX 显卡。

很显然这张显卡的性能放在现在早已不值一提，但这张显卡上，NVIDIA 提出了「CUDA」（统一计算架构）这一概念。CUDA 的出现让 GPU 不仅可以用来处理图形运算，还可以用来执行、加速基于 CUDA 的通用计算，让电脑成为真正的「通用工具」。

图片来源：雷科技

除了 CUDA 外，NVIDIA 在 2018 年还进一步对 GPU 的算力进行「细化」，引入了RT Core、Tensor Core 的概念，让光线追踪和专门的 ML 计算成为可能——Tensor Core 通过高效执行大规模矩阵运算，显著加快了 AI 模型的训练和执行速度。深受 NVIDIA 用户喜爱、可以显著提高游戏 FPS 的 DLSS，就基于 Tensor Core 来实现，可以说是广大游戏玩家最早接触到的「真 AI」用例了。

算力是一切 AI 的基础

在 AI 时代出现之前， NVIDIA 就开始想办法用 Tensor Core 实现 AI 功能，加速了 AI 时代的到来；那么和 6 年前的自己相比，现在的 NVIDIA 在 AI 领域又实现了怎样的技术飞跃呢？

根据 NVIDIA 的介绍，现阶段 RTX AI 已经对 10 种不同的 AI 场景实现覆盖，分别为：AI 绘画、AI 平面设计、AI 视频编辑、AI 3D 创作、AI 视频体验、AI 会议、AI 文档助手、AI 应用开发、AI 游戏和 AI 游戏开发。

图片来源：雷科技

尽管这十大场景各有不同，但他们对电脑却有着一个共同的需求：算力。而出色的算力，恰恰就是 RTX 硬件的最广为人知的特性。

图片来源：雷科技

毫无疑问，和 6 年前刚刚发布 RTX 显卡、引入 Tensor Core 时相比，性能是 NVIDIA 在 AI 领域最容易看到的提升。以最常见的文生图（T2I）用例为例，有试过在自己电脑上部署 StableDiffusion 等模型的朋友应该知道，当前绝大多数模型或多或少存在「命中率低」的问题，导致用户需要用同一组关键词反复生成图像，用类似手游「抽卡」的方式来生成自己想要的图片。

图片来源：雷科技

针对这种「抽卡」的场景，NVIDIA就在分享会上展示了其旗舰消费级显卡 RTX 4090D 的强大性能：基于 TensorRT 的加速功能，RTX 4090D 最快可以实现 120fps 的 StableDiffusion 图像生成。

精细控制是 AI 生产力的标志

不知道大家有没有发现一个细节，在刚刚提到的十大场景中，NVIDIA 把 AI 绘画和 AI 平面设计区分开了。这并不是 NVIDIA 想用更多的用例撑场面，而是因为 AI 绘画与 AI 平面设计其实标志着 AI 技术的两个不同的阶段：

以文生图为代表的 AI 绘画，由于命中率较低，用户需要不断生成大量图片来「抽卡」，才有可能得到自己想要的成品。而这种「不可控性」意味着这些 AIGC 作品的用途非常有限：要么用于娱乐，要么用来给设计师找灵感，或者充当训练 AI 的物料。

但真正用于「生产力」的 AIGC 却容不得这种「不确定性」，毕竟谁也不想用 AIGC 向客户展示时装上身效果时，AI 在衣服上生成三只手；或者设计师用 AI 向客户讲解室内装潢风格时 AI 把屋顶复式豪宅画成地下室。

换句话说，能否实现对 AIGC 的精细控制，会是区分「娱乐 AI」与「生产力 AI」的最大区别。

我们知道，「娱乐 AI」主要用于提升用户体验和互动性。例如，在视频游戏、社交媒体和在线娱乐等领域，AI 被用来推荐内容、生成音乐、模拟对话等。这类 AI 的核心目标是增强娱乐性和参与度，而不那么侧重于输出的严格性和可预测性。这类 AI 生成的艺术作品或音乐不需要符合严格的商业应用标准，其创造性和新颖性更为重要。

相比之下，「生产力 AI」则应用在更为严格和要求高的商业及工业环境中，如制造业、医疗、金融分析等。在这些领域中，AI 的任务是提高效率、减少成本和错误率，以及提供可靠的决策支持。比如利用 AI 在医疗诊断中用于分析影像和识别疾病模式，这要求极高的准确性和可靠性。在这些应用中，精细控制不仅关乎 AI 系统的效能，更关乎其决策质量对人类生活的直接影响。

图片来源：雷科技

在分享会上，NVIDIA 也演示了一个「生产力 AI」应有的样子——即致 AI。作为一款面向建筑设计领域的 AI 应用，即致 AI 提供了多种适用于不同建筑风格、场景的预训练 AI 模型，同时基于 RTX 硬件的强大性能，即致 AI 能以近乎零时延的速度对设计师的导入草图或绘制的线条进行 AI 生成，用近乎实时的方式为客户讲解建筑外部设计内部装修风格。

AI 遇到的问题，应由 AI 来解决

当然了，刚刚提到的用例只不过是 NVIDIA RTX 在 AI 领域应用的一小部分。从偏向娱乐性质的文生图、DLSS 3.5，到改变游戏交互方式的 NVIDIA ACE、声音克隆，再到改变创作模式的 AI 视频剪辑、改变工作模式的 Chat with RTX，无论是游戏还是工作，AI 技术早已渗透到我们生活的方方面面。

图片来源：雷科技

在分享视频创作过程中 AIGC 的具体应用时，著名视频特效团队「特效小哥 Studio」也提到了一个非常有趣的观点——用 AI 来解决 AI 遇到的问题。据他们分享，在重建 AIGC 图片的景深时，他们没有选择用传统的人工标记深度图，而是直接把图片丢给 AI，让 AI 绘制 AIGC 的深度图，并将结果输出给另一个 AI 模型。

图片来源：雷科技

这种「用魔法打败魔法」的解决方案，在我看来不仅仅是 AIGC 行业化，正规化的标志，同时也是未来 AI 的发展方向之一。

首先，AI 模型的训练需要大量的计算资源，由于高质量数据的获取往往成本高昂且不易实现，使用合成数据生成技术如生成对抗网络（GANs）可以创造大量逼真的训练数据，这对于提升 AI 系统的训练效率和效果非常有帮助。此技术不仅可以用于生成图像数据，也能扩展到文本、音频甚至是虚拟环境的生成，极大地丰富了数据来源，为AI训练提供了更多可能。

其次，AI 模型的解释性也是一个重要的技术挑战，因为许多高效的模型如深度神经网络往往像黑盒一样，难以理解其内部的决策逻辑。通过发展解释性 AI 技术，可以使模型的决策过程更加透明，增加用户的信任，同时也方便开发者找到并改进模型的不足。