
最近AI圈的竞争依然不光是拼模子了,底层算力成了新战场。英伟达在COMPUTEX展会上亮出RTX Spark PC超等芯片,把算力从云霄班师塞进个东谈主电脑。谷歌也出头出面,在Cloud Next大会上推出第八代TPU,考验芯片性能翻倍,推理芯片每好意思元性能进步80%。这些巨头的作为讲明啥?通用GPU和专用TPU运转单干配合了——GPU剖释天真多变的端侧任务,TPU专攻云霄大模子考验,俩昆玉联手扛起AI算力大旗。Anthropic公司以至砸下2000亿好意思元采购TPU算力,黑石集团还拉着谷歌搞AI云公司,TPU终于走出谷歌自家后院,成了行业香饽饽。
昔日英伟达GPU占了九成商场,谷歌TPU mostly我方用。咫尺风向变了!斟酌本年谷歌TPU能卖600万片,加上英伟达的700多万片,俩巨头要吃下大致商场。更扯后腿的是Meta、苹果这些大厂王人运转自研TPU。国内这边,中昊芯英成了独一量产高性能TPU的原土企业,他们的“一瞬”芯片2023年就结束量产,咫尺金融、医疗、考验行业王人能看到它的身影。民众说得直白:若是国内TPU掉队,不仅错过产业转型窗口,还可能被卡脖子。好在中昊芯英依然兼容Qwen、GLM这些国产大模子,算是蹚出条路。

算力暴涨带来新用功——数据中心快被烤熟了。维谛时间的田军博士掰着指头数五大挑战:电力和冷却得同步接洽、单芯片功耗飙到500瓦、机柜功率打破100千瓦、委用周期要压到百天内、故障反应必须90秒解决。传统风冷早不够用了,咫尺流行液冷时间,有的以至搞起芯片内微流体冷却。更绝的是运维时分从30分钟缩到90秒,出问题必须秒级反应。好在时间也在升级,比如电冷耦合接洽、模块化部署,总算给AI算力上了谈保障。说白了,将来的竞争不光看芯片多猛,还得看谁能把数据中心稳稳hold住。