【48812】NVIDIA消费互联网职业处理方案架构师负责人谈大模型规模化布置_解决方案_米乐m6手机网页版|首页地址

首页 > 解决方案

【48812】NVIDIA消费互联网职业处理方案架构师负责人谈大模型规模化布置

来源:米乐m6手机网页版    发布时间:2024-05-05 01:14:50

  近来,由智东西举办的GTIC 2023我国AIGC立异峰会在北京满意举办!当时,预练习言语模型、分散模型等要害算法和模型的呈现与演进,推动了生成式AI的加快速度进行开展,相关这类的产品在极短的时刻内招引了全球的重视。NVIDIA消费互联网职业处理方案架构师负责人徐添豪表明,“硬件算力的进步不只依托芯片工艺的进步,更依托精确捕捉AI模型算法演进的需求和趋势。(重点是)找到核算加快的要害点,并不停地改善改造满意未来的事务需求。软硬件协同能使大规模集群练习GPT3时算力有用性超50%。”

  进入大模型年代,一张卡远远无法承载一个模型的练习,需求愈加多个别组成能相互协作的机器节点。NVIDIA引进NVLink,NVSwitch和IB技能,其间Ampere和Hopper架构便是依据NVSwitch构建节点,经过IB网络进行集群组网,使得这些实力微弱的个别能高效协作完结同一件事。

  其间底层硬件是底座,为了开发者把硬件用起来并真实处理问题,需求软件的协同。因而,NVIDIA在曩昔一直在构建SDK和场景应用以处理各行各业的问题,其间NeMo Framework就为了处理大模型练习和推理布置问题。

  那么,怎样评价练习GPT-3究竟要多少资源?徐添豪讲解了一个公式:耗费的时刻=做大模型需求的FLOPS/硬件发挥的有用算力。根据并行方法的有用集成及一系列的优化,NVIDIA的NeMo Framework在练习GPT-3过程中能使得硬件算力有用功能到达50%以上。

  特别声明:以上内容(如有图片或视频亦包含在内)为自媒体渠道“网易号”用户上传并发布,本渠道仅供给信息存储服务。

  连沙漠里都“堵人了”!游客占领多个旅游城市,本地人:最大奉献便是把景点让出来

  知情人谈“小孩打碎近12万瓷瓶被免赔”:事发地不是博物馆是商业场所 瓷瓶系现代著作

  国产闻名奶茶品牌火了!曝旗下产品在日本超市标示:请日本政客把核污染水喝了!

  谷歌Pixel 8a手机完好标准曝光:6.1@120Hz屏幕、Tensor G3 芯片

  Q1全球智能手机均价2679元:苹果三星创前史新高 我国前三大品牌均未合格

  三星可能为Galaxy S24 FE开发Exynos 2400+ 新SoC可将能效进步10%