NVIDIAGPU为Meta的下一代Llama3模型提供动力并在包括RTX在内的所有平台上优化了AI
发布时间:2024-04-19 11:02:58 编辑:郑旭军 来源:
新闻稿:NVIDIA今天宣布对其所有平台进行优化,以加速最新一代大语言模型(LLM)MetaLlama3。开放模型与NVIDIA加速计算相结合,使开发人员、研究人员和企业能够在各种应用程序中进行负责任的创新。
接受过NVIDIAAI培训
Meta工程师在包含24,576个H100TensorCoreGPU并与Quantum-2InfiniBand网络连接的计算机集群上训练Llama3。在NVIDIA的支持下,Meta为其旗舰LLM调整了网络、软件和模型架构。
CoreWeave通过将NVIDIAH100GPU作为“抵押品”1成功获得23亿美元债务
为了进一步推进生成式人工智能的最先进水平,Meta最近描述了将其基础设施扩展到350,000个H100GPU的计划。
企业可以使用NVIDIANeMo对其数据进行微调Llama3,这是一种适用于法学硕士的开源框架,是安全且受支持的NVIDIAAIEnterprise平台的一部分。自定义模型可以使用NVIDIATensorRT-LLM进行推理优化,并使用Triton推理服务器进行部署。
将Llama3带到设备和PC上
Llama3还在JetsonOrin上运行,用于机器人和边缘计算设备,创建类似于JetsonAI实验室中的交互式代理。此外,适用于工作站和PC的RTX和GeForceRTXGPU可以加快Llama3上的推理速度。这些系统为开发人员提供了全球超过1亿个NVIDIA加速系统的目标。
使用Llama3获得最佳性能
为聊天机器人部署LLM的最佳实践涉及低延迟、良好的读取速度和最佳GPU使用以降低成本之间的平衡。这样的服务需要以大约用户阅读速度的两倍(大约每秒10个令牌)提供令牌(大致相当于法学硕士的单词)。
上一篇:质量效应粉丝和开发者利用2023年N7Day向BioWare传达裁员和低遣散费的信息
下一篇:最后一页
- 数百个连接器烧毁的GeForceRTX4090GPU仍被送往维修店进行修复
- InfinixNote40Pro5G系列将彻底改变无线充电具体方法如下
- 据报道三星计划在4月份修复GalaxyS24Ultra的相机问题
- 监测淡水质量的新方法可以识别污染源并预测其影响
- 苹果高管为公司配备8GB统一RAM的MacBook系列辩护称这种配置适合许多任务
- 现实生活中的GTA6预告片绝对是杰作
- 当沃丁顿遇见亥姆霍兹EPR-Net用于构建复杂非平衡系统的潜在景观
- 小米RedmiPadPro和RedmiTurbo3特别版设计公布附带限量配件
- 配备OLED显示屏和新设计的AppleiPadPro彭博社透露发布日期细节
- 苹果向开发者发布macOS14.5 watchOS10.5 tvOS17.5 visionOS1.2Beta1
- 苹果现在认为iPhone6Plus已过时iPadMini4已过时
- WhatsApp状态更新可能会有一个简化的赞按钮以便快速反应
- Pixel9ProXL将成为第三款Pixel手机谷歌从三星页面上拿下一本并推出了三种变体
- 宜家刚刚让所有快速充电器看起来价格过高
- 竞争对手D&DRPG探路者 辐射和战锤最高优惠357美元