北京pk10官方网站 性能擢升3倍: 微软推出Maia 200芯片, 以更快、更低资本驱动AI推理
跟着聊天机器东谈主用户范围达数百万,微软正押注推清醒散如今比原始考试算力更为垂危。 微软发布了其第二代自研AI芯片Maia 200,此时行业正围绕驱动大模子的资本伸开浓烈竞争。与早期专注于考试体式的硬件鞭策不同,这款新芯片对准了推理体式,即抓续向用户提供AI响应的历程。推理已成为AI公司日益增长的资本项。跟着聊天机器东谈主和智能副驾(Copilot)奇迹膨大到数百万用户,模子必须不拒绝驱动。微软示意,Maia 200恰是为这一滑变而想象。 {jz:field.toptypename/} 该芯片...

跟着聊天机器东谈主用户范围达数百万,微软正押注推清醒散如今比原始考试算力更为垂危。

微软发布了其第二代自研AI芯片Maia 200,此时行业正围绕驱动大模子的资本伸开浓烈竞争。与早期专注于考试体式的硬件鞭策不同,这款新芯片对准了推理体式,即抓续向用户提供AI响应的历程。推理已成为AI公司日益增长的资本项。跟着聊天机器东谈主和智能副驾(Copilot)奇迹膨大到数百万用户,模子必须不拒绝驱动。微软示意,Maia 200恰是为这一滑变而想象。
{jz:field.toptypename/}该芯片本周在微软位于爱荷华州的数据中心上线,并谋略在亚利桑那州进行第二次部署。
为推理范围而想象
Maia 200基于微软2023年发布的Maia 100打造。新版芯片扫尾了显贵的性能跃升。微软示意,该芯片集成了跨越1000亿个晶体管,在4比特精度下可提供跨越10千万亿次的经营性能(10 petaflops)。在8比特精度下,其算力约为5千万亿次。这些数据针对的是内容责任负载,而非考试基准测试。推理需要速率、踏实性和能效。微软称,单个Maia 200节点就能驱动咫尺最大的AI模子,并为改日发展留出空间。
芯片想象反应了当代AI奇迹的运作神态。即使面临用户流量激增,聊天机器东谈主也必须快速响应。为知足这一需求,Maia 200集成了大皆SRAM(静态就地存储器),这是一种高速内存类型,可减少重叠查询时的蔓延。一些较新的AI硬件厂商也依赖大内存想象。微软似乎采用了这种算作来擢升大范围奇迹时的响应能力。
Maia 200也奇迹于政策方向。据报谈,北京pk10官方网站主要云奇迹提供商但愿减少对英伟达的依赖,后者的GPU主导着AI基础设施。尽管英伟达在性能上仍处于最初地位,但其硬件和软件堆栈影响着扫数这个词行业的价钱和供应。谷歌已通过其云奇迹提供自研的张量搞定单位。亚马逊收罗奇迹也在施行其Trainium和Inferentia芯片。如今,微软凭借Maia芯片加入了这一阵营。
微软进行了径直比拟:称Maia 200的FP4性能是亚马逊第三代Trainium芯片的3倍,并声称其FP8性能强于谷歌最新的TPU。
与英伟达行将推出的Vera Rubin搞定器访佛,Maia 200由台积电采用3纳米时刻制造。它也使用了高带宽内存,不外采用的是比英伟达下一代芯片更早一代的版块。
软件弥合差距
微软在发布芯片的同期,也推出了新的开辟者器用,旨在减轻长久以来使英伟达软件受益的上风差距。其中一个要道器用是Triton,这是一个开源框架,可匡助开辟者编写高效的AI代码,OpenAI为此技俩作念出了垂危孝顺。微软将Triton定位为英伟达主导的编程平台CUDA的替代选拔。
Maia 200已在微软自家的AI奇迹中驱动。公司示意,它相沿其超等智能团队开辟的模子,并为Copilot提供助力。微软还邀请了开辟者、学术界和前沿AI实验室来测试Maia 200的软件开辟器用包。
通过Maia 200,微软传递出AI基础设施更平时的调动信号:更快的芯片天然垂危,但对软件和部署的规定权如今不异垂危。
要是一又友们心爱,敬请眷注“知新深切”!


备案号: