你搜张猫图,背后是谷歌定制芯片在狂算矩阵
你刷个照片搜‘猫’,背后跑的不是普通芯片,是谷歌自己搞的TPU——张量处理单元。它不干别的,就专啃AI那套海量矩阵乘法和张量运算。
TPU十多年前就开始这么干了。通用芯片上一堆用不上的逻辑门?直接砍掉。省下的晶体管全塞进数学流水线,像饭馆后厨只留炒锅、不要洗碗池。
最新一代峰值算力121 exaflops,带宽翻倍。以前得拆任务、排队等资源,现在一口气算完。队列?快没了。
它没走CPU堆核、GPU拼显存的老路。谷歌吃饱了,干脆把‘算得快’的定义从底层改了——数据通路按AI数学重新铺一遍。牛皮吹爆了?反正我试过用TPU跑模型,确实快得离谱。