时间:2022-02-19|浏览:499
最伟大的是什么?
最伟大的是善待他人的人。
在英伟达 GTC 2021 大会上,黄仁勋的开幕演讲以哲学与未来的对话结束。
回答者不是黄仁勋本人,而是基于黄仁勋的对话虚拟形象——Toy Jensen。黄仁勋在开幕演讲中介绍,这种虚拟形象是基于最大的自然语言处理模型和精致的光跟踪图像。
有一些最近才实现的惊人技术,Toy-me 以前几乎不可能建造这些技术。
Toy Jensen 的呈现揭示了英伟达的元宇宙愿景。此外,按照惯例,英伟达这次还在GTC推出了一系列AI技术及产品:
到目前为止,最先进的端到端网络平台 Quantum-2.多节点分布式推理功能 NVIDIA Triton 推理服务器,NVIDIA A2 Tensor Core GPU加速器是世界上最小、功能最强大、能效最高的下一代超级计算机NVIDIA Jetson AGX Orin 等系列产品等。
Omniverse 更新升级,加速 2D 互联网向 3D 演变
在去年的 GTC 会上,英伟达宣布推出 Omniverse,它是世界上第一个基于英伟达 的RTX 的三维模拟和合作平台整合了物理和虚拟世界的细节,实时模拟现实和现实。艺术家和人工智能都可以在不同的世界里使用不同的工具来创造一个新的世界。
经过近一年的发展,已有7万多名创作者下载,500多家公司的专业人士使用 Omniverse 公测版,宝马集团,CannonDesign、Epigraph、Ericsson、建筑公司 HKS 和 KPF、Lockheed Martin 以及 Sony Pictures Animation 都包括在内。
其中,Ericsson 正在使用Omniverse 平台创建数字双胞胎,模拟和可视化信号传输,加速 5G 网络功能开发与洞察。
与此同时,Omniverse 本身也更新升级。
Omniverse Avatar 是英伟达推出的交互式 AI 虚拟化身技术平台连接英伟达语音 AI、计算机视觉、自然语言理解、理解、推荐引擎和模拟技术Metropolis 的感知能力,Riva 语音识别能力,Merlin 的推荐能力,Omniverse 动画渲染能力相结合。
其中,NVIDIA Riva 语音 AI 软件新增了一项 Riva 定制语音功能,只需要 30分钟的音频数据,就可以在一天内创建一个类似于现实生活的定制语音,几乎类似于科幻爱情电影《她》中的萨曼莎,拥有斯嘉丽迷人的声音线和超级学习能力。
企业可以在具体应用中使用 Riva 定制语音打造专属语音的虚拟助理,开发具有辨识度的品牌语音,开发者也可以借助其创建各种各样的应用程序,为有语言障碍的人提供支持。
基于 Omniverse Avatar 这个平台原本在 2D 状态的虚拟助手有能力成为常识、推理和生动的 3D 视觉图像,理解各种语言,在与人类的交流中给出更智能的答案。正如我在直播中看到的,当英伟达的 3 工作人员分别向 Toy Jensen 当这个小家伙提出气候变化、天文学和生物蛋白质等棘手问题时,他可以回答。
再者,英伟达演示了基于对话操作台 Tokkio 基于 Omniverse Avatar 平台应用程序,当两位顾客同时点餐时,客户服务的虚拟化身可以与顾客进行眼神交流,并根据两位顾客的用餐需求提供推荐菜单。
而 Omniverse 本身也更新了包括 在内的四个功能Showroom、Farm、AR和VR。
其中,Showroom 作为 Omniverse 公测版中的应用程序允许非技术用户使用 Omniverse 技术演示,实时物理实时物理渲染技术;
Farm 允许团队同时使用多个工作站或服务器,支持渲染、合成数据生成或文件转换;
VR 推出领先的完整图像和光跟踪 VR,支持开发者在平台上建立自己的 VR 功能,最终用户可以直接享受 VR 功能;AR 同理。
此外,英伟达还宣布 Omniverse Enterprise 已进入正式发布阶段。它允许跨多个软件套件工作的全球 3D 设计团队通过共享虚拟空间中的任何设备实时合作。Omniverse 生态系统不断扩大。
最新 Triton 推理服务器有助于实时开发和部署大型语言模型。
建立如此自由的交流 Toy Jensen,也离不开强大的自然语言处理模型,其背后的技术逻辑也在本次会议上展现出来。
为了训练具有数万亿参数的语言模型,英伟达推出了 NVIDIA NeMo Megatron 框架可定制大型语言模型进行新领域和语言训练(LLM)Megatron 530B 还有多 GPU、 多节点分布式推理能力NVIDIA Triton 推理服务器。
基于这些工具,不仅可以构建 Toy Jensen,企业还可以在特定领域建立自己的聊天机器人、个人助理等 AI 应用程序,高水平理解语言的细微差异。
NVIDIA NeMo Megatron 是在 Megatron 开发的开源项目由 开发NVIDIA 研究人员领导,研究大规模转换语言模型的有效培训。Megatron 530B 是世界上最大的定制语言模型。
NeMo Megatron 框架可以优化 NVIDIA DGX SuperPOD 扩展大规模加速计算基础设施。
有了大型语音模型,如何存储和运行?特别是这些模型对内存的需求很大,超过了单个 GPU 甚至多个GPU 服务器可以提供的内存在实际应用中对推理的实时性有很高的要求。
NVIDIA Triton 推理服务器的出现解决了这个问题,英伟达在会议上发布了最新的 NVIDIA Triton 具有多 GPU、多节点特性,使大型语言模型推理的工作负载实时在多个 GPU 扩展节点。
借助 Triton 推理服务器,Megatron 530B 可在两个 NVIDIA DGX 系统运行时间从 CPU 服务器上的 缩短到 01分钟以上.5 秒可以实时部署大型语言模型。
事实上,许多企业已经在使用 NVIDIA DGX SuperPOD 构建大型复杂语言模型,SiDi、京东探索研究所和VinBrai包括在内。
其他AI新进展:Quantum-2 和 Jentson AGX Orin
展望元宇宙的英伟达,在其他产品线上不断更新。
首先,可以进行云原生超级计算的 Quantum-2 平台,即 4000Gbps 的 InfiniBand 网络平台,包括 NVIDIA Quantum-2 交换机、ConnectX-7 网卡、BlueField-3 数据处理器 DPU(数据处理器)和所有支持这种新架构的软件。这也是迄今为止最先进的端到端网络平台。ConnectX-7 将于明年1月出现。
其中,Quantum-2 InfiniBand 开关基于新 Quantum-2 ASIC,台积电 7nm 节点,包括 570 1亿晶体管,超过 540 1亿晶体管A100 GPU。
Quantum-2 InfiniBand 拥有 400Gbps 吞吐量高,网络速度提高 1 倍,网络端口数量增加 3 倍。在性能提高 3 倍的同时,数据中心网络所需的交换机数量也减少了 6 倍。同时,数据中心的能耗和空间也减少了 7%。
此外,世界上最小、功能强大、能效最高的新一代 AI 超级计算机 NVIDIA Jetson AGX Orin,算力高达 200TOPS 边缘嵌入式计算用于机器人、自主机器、医疗器械等形式。
Jetson AGX Orin 基于 NVIDIA Ampere 结构,与其前身 Jetson AGX Xavier 一直保持外观和引脚的兼容性,但处理能力扩大到 6倍,每秒可提供 200 万亿次操作,类似于支持 GPU 服务器,但大小只相当于人的手掌。
新的 Jetson 计算机可以加速完整的 NVIDIA AI 软件栈使开发人员能够部署最大、最复杂的模型来解决自然语言理解问题D 感知、多传感器融合等边缘AI 机器人任务。
上周,英伟达市值超过7000亿美元。许多分析师表示,在其市值上升的背后,元宇宙正在帮助它。GT C英伟达在会议上的表现确实证明了这一点Omniverse以平台为基础,构建元宇宙愿景。
但别忘了,英伟达还是一家人AI除了性能计算领域积累了深厚积累的科技公司,除了热元宇宙外,还将在会议期间呈现更多关于加速计算和深度学习的内容。
用戶喜愛的交易所
已有账号登陆后会弹出下载