【48812】NVIDIA消费互联网职业处理方案架构师负责人谈大模型规模化布置_解决方案

近来，由智东西举办的GTIC 2023我国AIGC立异峰会在北京满意举办！当时，预练习言语模型、分散模型等要害算法和模型的呈现与演进，推动了生成式AI的加快速度进行开展，相关这类的产品在极短的时刻内招引了全球的重视。NVIDIA消费互联网职业处理方案架构师负责人徐添豪表明，“硬件算力的进步不只依托芯片工艺的进步，更依托精确捕捉AI模型算法演进的需求和趋势。（重点是）找到核算加快的要害点，并不停地改善改造满意未来的事务需求。软硬件协同能使大规模集群练习GPT3时算力有用性超50%。”

进入大模型年代，一张卡远远无法承载一个模型的练习，需求愈加多个别组成能相互协作的机器节点。NVIDIA引进NVLink，NVSwitch和IB技能，其间Ampere和Hopper架构便是依据NVSwitch构建节点，经过IB网络进行集群组网，使得这些实力微弱的个别能高效协作完结同一件事。

其间底层硬件是底座，为了开发者把硬件用起来并真实处理问题，需求软件的协同。因而，NVIDIA在曩昔一直在构建SDK和场景应用以处理各行各业的问题，其间NeMo Framework就为了处理大模型练习和推理布置问题。

那么，怎样评价练习GPT-3究竟要多少资源？徐添豪讲解了一个公式：耗费的时刻=做大模型需求的FLOPS/硬件发挥的有用算力。根据并行方法的有用集成及一系列的优化，NVIDIA的NeMo Framework在练习GPT-3过程中能使得硬件算力有用功能到达50%以上。

特别声明：以上内容(如有图片或视频亦包含在内)为自媒体渠道“网易号”用户上传并发布，本渠道仅供给信息存储服务。

连沙漠里都“堵人了”！游客占领多个旅游城市，本地人：最大奉献便是把景点让出来

知情人谈“小孩打碎近12万瓷瓶被免赔”：事发地不是博物馆是商业场所瓷瓶系现代著作

国产闻名奶茶品牌火了！曝旗下产品在日本超市标示：请日本政客把核污染水喝了！

谷歌Pixel 8a手机完好标准曝光：6.1@120Hz屏幕、Tensor G3 芯片

Q1全球智能手机均价2679元：苹果三星创前史新高我国前三大品牌均未合格

三星可能为Galaxy S24 FE开发Exynos 2400+ 新SoC可将能效进步10%

首页 > 解决方案

【48812】NVIDIA消费互联网职业处理方案架构师负责人谈大模型规模化布置

产品导航

技术支持

解决方案