起源:孙俪:我们家的狗装死把邓超吓晕了作
DeepSeek V4一颁布,黄仁勋的预言成真了
"一旦DeepSeek率先在华为平台上颁布,对美国而言将是苦难性的了局"。
这里的"我国"指美国
这不是托尼说的,而是英伟达黄仁勋在某个播客上的原话。如今DeepSeek V4的出现,让老黄的预言成真了?
作为各人苦等了一年多的 DeepSeek 大版本迭代,只看机能差友们可能会略有绝望。但 DeepSeek V4 是真便宜,价值对比国表模型直接腰斩属因而。
关于模型的具体内容,在白日的文章中已经提到,就不沉复了。
但托尼感触,随着这次颁布,意思更沉大的,是深度求索选择在华为昇腾平台上进行首发,结合下午的直播,这意味着 DeepSeek 实现了在国产硬件上的训练适配。
凭据网友爆料,这次最先支持国产硬件训练的是 DeepSeek V4 Flash 的后训练过程,基于国产硬件的预训练也有望在今年下半年实现。
换句话说,从今天起头,各人嚷嚷了很久的 AI 全流程使用国产硬件,一下子就实现了!
各人能够把华为的昇腾平台理解为连 AI 芯片都是国产的 AI 推算平台。
如果一年以前有人跟我说,纯国产的AI平台可能支持一款旗舰模型的全链路研发,托尼我也不敢相信。
但此刻它就是成了,这对于国产AI的发展影响是很深远的。
之前老黄没少拿这个事儿游说美国当局 让自己卖货 ,依照老黄的意思,在 AI 军备较量中,从底层的电力,冷却,消防这些基础设施,到芯片、服务器等算力设施,再到软件生态和模型的架构演进,这些身分都缺一不成,样样都赢能力赢麻到最后。
AI 是一块“五层蛋糕” - NVIDIA 博客- 英伟达
而咱们的优势,无疑是祖国壮大的基建能力,以及充足的人才储蓄。这些能让我们打造出好多高性价比的模型。
但不得不认可,PokerStars扑克官网芯片造程离世界顶端,的确有些差距。好在 AI 必要的芯片,打的是规模战、集群战。所以工程师们想了些法子,来解决造程上的不及。
一来,固然造程工艺有限度,但芯片能够在不计成本的情况下,通过暴力堆规模,来提升算力。而在配套的内存上,国产也有自研 HBM(高带宽内存),来保障带宽没有瓶颈。
二来,固然单颗芯片机能有限,但架不住量大管鼓啊,把大量的芯片利用起来,组合成一个"推算中心",塞进机柜里,其实就是这两年火热的超节点。
超节点的概想就是英伟达提出的,老黄也做了相应的布局,NVL72 系统把 72 个Blackwell GPU 集成到一个液冷机柜中,达成了约 180 PFLOPs 的 FP16 算力。
而国产芯片们想要堆出近似算力,就必要拿出更多的芯片。所以去年华为昇腾拿出了 384 超节点,通过 12 个机柜,每个机柜 32 张卡,硬是堆出 300 PFLOPs 算力,靠近 NVL72 的两倍了。而今年差评更是在 MWC 现场看到了华为最新的 Atlas 950,也就是 8192 卡互联的超节点。
可最严沉的一环,其实是生态。
托尼不得不认可,老黄是真有远见的。20年前,英伟达就起头为了 CUDA 生态埋伏笔,甚至就义掉了 GeForce 游戏显卡的利润,导致有一段功夫差点在和 ATi/AMD 的竞争中死掉。
但英伟达成功熬到了平明。所以差友们能看到,此刻险些所有 AI 有关的基础模型和优化都基于 CUDA 来运行、后起的 GPU、TPU 等 AI 推算生态都要向它低头。
甚至蕴含之前 DeepSeek 亲手打造的护城河之一:PTX 底层说话优化,也是为了把NVIDIA GPU 的机能榨干,让模型效能更高,从而让 DeepSeek 模型更有性价比。
也因而,对于国内来说,在造裁的大布景下,不论是华为昇腾的 CANN,还是摩尔线程的 MUSA,目前还要做对 CUDA 的兼容性支持,来让开发者能更快适应自家芯片。
但咱们也不能一向活在别人屋檐下。构建属于自己的软件生态,火烧眉毛。所以最近几年托尼也起头看到像 TileLang 这类由中国主导的生态项目,尝试在分歧的方向构建出属于自己的护城河。
就是这些项目对于 CUDA 生态来说,并没有什么伤筋动骨的攻击性。
直到这次的 DeepSeek V4 更进一步,直接回绝了英伟达和AMD的提前适配,而是选择华为昇腾和国产 CANN 软件生态。
也就是说,这次DeepSeek想要表白的其实是:不用美国的芯片和技术,我们自己也能做出足够先进的大模型。
托尼不得不感伤深度求索的这波操作:一方面是真的争气,另一方面,其实也是在把 DeepSeek 造成一个标杆,向其他国产大模型喊话:全国产链路已经跑通了,你们都能够来试试。
除此之表呢?还有什么理由让国产模型拥抱国产 AI 硬件生态吗?
最近一个月各人应该有感知,大模型的能力越来越强,强到已经不只是能对话的水平了。
前段功夫 Anthropic 颁布的 Mythos 模型,就号称"强到不敢直接颁布",而是首先交给苹果、英伟达、微软等巨头,用来检测安全缝隙,加强网络防御。
也就是说,AI 已经不仅仅是一个对话窗口,一个效能工具,一个智能副手。未来甚至此刻的模型,已经进化到能够在网络安全层面进行攻防了。这意味着 AI 已经从通常人使用的工具,成长为国度之间攻防的矛与盾。
不论若何,从硬件到软件,从模型到生态,全链路国产化,是必必要做的。这样能力真正不被英伟达等国表公司卡脖子。
当英伟达的GPU不再是唯一选择,当CUDA 护城河不再牢固,当咱们的AI人才越来越多,生态越来越繁华,产业界的底气天然也会越来越足。
回头看DeepSeek V4颁布公告的实现语:不诱于誉,不恐于诽,率路而行,端然正己,这不仅是对国内AI公司该当实事求是的宣言,更是对国产AI硬件生态,这么多年一步一步走过来的注定。
老黄的预言,或许已经成为现实。
撰文:洛洛
编纂:米罗 & 面线 & 结界
美编:焕妍
图片、资料起源:
英伟达官网
@徐嘉。簆lay视频海量资源最新版本更新内容介,米切尔43分 骑士再胜活塞总分2-2@梁政峰:伊朗对美国空军基地施前进攻
@何淑萍:马刺双加时攻下俄城 文班41分24板