PokerStars扑克官网

起源:孙俪:我们家的狗装死把邓超吓晕了作

起源:孙俪:我们家的狗装死把邓超吓晕了作者: 李建和:

DeepSeek V4一颁布 ,黄仁勋的预言成真了

"一旦DeepSeek率先在华为平台上颁布 ,对美国而言将是苦难性的了局"。

这里的"我国"指美国

这不是托尼说的 ,而是英伟达黄仁勋在某个播客上的原话。如今DeepSeek V4的出现 ,让老黄的预言成真了?

作为各人苦等了一年多的 DeepSeek 大版本迭代 ,只看机能差友们可能会略有绝望。但 DeepSeek V4 是真便宜 ,价值对比国表模型直接腰斩属因而。

关于模型的具体内容 ,在白日的文章中已经提到 ,就不沉复了。

但托尼感触 ,随着这次颁布 ,意思更沉大的 ,是深度求索选择在华为昇腾平台上进行首发 ,结合下午的直播 ,这意味着 DeepSeek 实现了在国产硬件上的训练适配。

凭据网友爆料 ,这次最先支持国产硬件训练的是 DeepSeek V4 Flash 的后训练过程 ,基于国产硬件的预训练也有望在今年下半年实现。

换句话说 ,从今天起头 ,各人嚷嚷了很久的 AI 全流程使用国产硬件 ,一下子就实现了!

各人能够把华为的昇腾平台理解为连 AI 芯片都是国产的 AI 推算平台。

如果一年以前有人跟我说 ,纯国产的AI平台可能支持一款旗舰模型的全链路研发 ,托尼我也不敢相信。

但此刻它就是成了 ,这对于国产AI的发展影响是很深远的。

之前老黄没少拿这个事儿游说美国当局 让自己卖货  ,依照老黄的意思 ,在 AI 军备较量中 ,从底层的电力 ,冷却 ,消防这些基础设施 ,到芯片、服务器等算力设施 ,再到软件生态和模型的架构演进 ,这些身分都缺一不成 ,样样都赢能力赢麻到最后。

AI 是一块“五层蛋糕” - NVIDIA 博客- 英伟达

而咱们的优势 ,无疑是祖国壮大的基建能力 ,以及充足的人才储蓄。这些能让我们打造出好多高性价比的模型。

但不得不认可 ,PokerStars扑克官网芯片造程离世界顶端 ,的确有些差距。好在 AI 必要的芯片 ,打的是规模战、集群战。所以工程师们想了些法子 ,来解决造程上的不及。

一来 ,固然造程工艺有限度 ,但芯片能够在不计成本的情况下 ,通过暴力堆规模 ,来提升算力。而在配套的内存上 ,国产也有自研 HBM(高带宽内存) ,来保障带宽没有瓶颈。

二来 ,固然单颗芯片机能有限 ,但架不住量大管鼓啊 ,把大量的芯片利用起来 ,组合成一个"推算中心" ,塞进机柜里 ,其实就是这两年火热的超节点。

超节点的概想就是英伟达提出的 ,老黄也做了相应的布局 ,NVL72 系统把 72 个Blackwell GPU 集成到一个液冷机柜中 ,达成了约 180 PFLOPs 的 FP16 算力。

而国产芯片们想要堆出近似算力 ,就必要拿出更多的芯片。所以去年华为昇腾拿出了 384 超节点 ,通过 12 个机柜 ,每个机柜 32 张卡 ,硬是堆出 300 PFLOPs 算力 ,靠近 NVL72 的两倍了。而今年差评更是在 MWC 现场看到了华为最新的 Atlas 950 ,也就是 8192 卡互联的超节点。

可最严沉的一环 ,其实是生态。

托尼不得不认可 ,老黄是真有远见的。20年前 ,英伟达就起头为了 CUDA 生态埋伏笔 ,甚至就义掉了 GeForce 游戏显卡的利润 ,导致有一段功夫差点在和 ATi/AMD 的竞争中死掉。

但英伟达成功熬到了平明。所以差友们能看到 ,此刻险些所有 AI 有关的基础模型和优化都基于 CUDA 来运行、后起的 GPU、TPU 等 AI 推算生态都要向它低头。

甚至蕴含之前 DeepSeek 亲手打造的护城河之一:PTX 底层说话优化 ,也是为了把NVIDIA GPU 的机能榨干 ,让模型效能更高 ,从而让 DeepSeek 模型更有性价比。

也因而 ,对于国内来说 ,在造裁的大布景下 ,不论是华为昇腾的 CANN ,还是摩尔线程的 MUSA ,目前还要做对 CUDA 的兼容性支持 ,来让开发者能更快适应自家芯片。

但咱们也不能一向活在别人屋檐下。构建属于自己的软件生态 ,火烧眉毛。所以最近几年托尼也起头看到像 TileLang 这类由中国主导的生态项目 ,尝试在分歧的方向构建出属于自己的护城河。

就是这些项目对于 CUDA 生态来说 ,并没有什么伤筋动骨的攻击性。

直到这次的 DeepSeek V4 更进一步 ,直接回绝了英伟达和AMD的提前适配 ,而是选择华为昇腾和国产 CANN 软件生态。

也就是说 ,这次DeepSeek想要表白的其实是:不用美国的芯片和技术 ,我们自己也能做出足够先进的大模型。

托尼不得不感伤深度求索的这波操作:一方面是真的争气 ,另一方面 ,其实也是在把 DeepSeek 造成一个标杆 ,向其他国产大模型喊话:全国产链路已经跑通了 ,你们都能够来试试。

除此之表呢?还有什么理由让国产模型拥抱国产 AI 硬件生态吗?

最近一个月各人应该有感知 ,大模型的能力越来越强 ,强到已经不只是能对话的水平了。

前段功夫 Anthropic 颁布的 Mythos 模型 ,就号称"强到不敢直接颁布" ,而是首先交给苹果、英伟达、微软等巨头 ,用来检测安全缝隙 ,加强网络防御。

也就是说 ,AI 已经不仅仅是一个对话窗口 ,一个效能工具 ,一个智能副手。未来甚至此刻的模型 ,已经进化到能够在网络安全层面进行攻防了。这意味着 AI 已经从通常人使用的工具 ,成长为国度之间攻防的矛与盾。

不论若何 ,从硬件到软件 ,从模型到生态 ,全链路国产化 ,是必必要做的。这样能力真正不被英伟达等国表公司卡脖子。

当英伟达的GPU不再是唯一选择 ,当CUDA 护城河不再牢固 ,当咱们的AI人才越来越多 ,生态越来越繁华 ,产业界的底气天然也会越来越足。

回头看DeepSeek V4颁布公告的实现语:不诱于誉 ,不恐于诽 ,率路而行 ,端然正己 ,这不仅是对国内AI公司该当实事求是的宣言 ,更是对国产AI硬件生态 ,这么多年一步一步走过来的注定。

老黄的预言 ,或许已经成为现实。

撰文:洛洛

编纂:米罗 & 面线 & 结界

美编:焕妍

图片、资料起源:

英伟达官网

@徐嘉。簆lay视频海量资源最新版本更新内容介 ,米切尔43分 骑士再胜活塞总分2-2
@梁政峰:伊朗对美国空军基地施前进攻
@何淑萍:马刺双加时攻下俄城 文班41分24板

【网站地图】