发现硅谷101|中国版E179｜DeepSeek技术解析：为何引发英伟达股价下跌？

E179｜DeepSeek技术解析：为何引发英伟达股价下跌？

2025-02-06 64'59''

1373 8

分享到:

介绍:

随着DeepSeek登上苹果App Store榜首，这款低成本、高性能的开源模型引发全球关注的同时，也造成了英伟达股价在1月27日下跌近17%，市值蒸发5890亿美元。按理说，像DeepSeek这样的开源模型会带动AI创业繁荣，进而推高GPU需求。为什么英伟达却不涨反跌？本期节目我们将和模型算法、GPU虚拟化领域的专家一起探讨DeepSeek的核心优势，它对芯片产业和开源生态的影响，还原这场市场震动背后的逻辑。【主播】泓君Jane，硅谷101创始人，播客主理人【嘉宾】陈羽北，加州大学戴维斯分校电子与计算机工程系助理教授，AIzip.ai联合创始人 John Yue，Inference.ai创始人兼CEO 【你将听到】 02:29 DeepSeek的三板斧：低成本、高性能、全开源 03:57 大模型创新瓶颈：技术路线趋同，突破性想法变少 05:09 核心创新：V3基础模型能力强 07:01 拆解DeepSeek核心创新之一：MOE与绕过稀疏奖励 09:04 创新二：通过蒸馏学习传递能力，大模型教小模型 12:46 为何V3出来一个月之后才引爆股市 13:54 对英伟达利好与利空因素分析：冲击溢价但并未冲垮壁垒 16:01 英伟达两大护城河：“绕过”NVLink和CUDA 19:24 溢价降低，但销售量在变大 23:00 类似于Groq的推理芯片能崛起吗？软件依然是难点 29:11 《The Bitter Lesson》的启发：AI的两种基本能力是学习与搜索 30:06 效率困境：AI需要跨越三个数量级才能达到人类智能 35:20 开源的意义：降低AI应用开发准入门槛 38:06 重构API价格体系：DeepSeek R1通过技术优化将成本降至OpenAI O1的1/27 39:47 降级芯片难持续：老款芯片停产限制了成本优化空间 43:08 小模型特定场景突破：某些任务已可媲美大模型表现 45:34 未来AI基建分层化：端、边、云分工协同是趋势 48:32 Anthropic的预测过分乐观：AI学习效率太低不足以追赶人类智能 53:10 大模型本身不足以通向AGI，但基础研究方向正在取得进展 56:00 模型自我能力提升是达到AGI的核心门槛 57:33 通往AGI的多条路径：世界模型等不同技术方向并存 01:03:22 提问DeepSeek ：数据与持续创新能力【其他相关信息】 MOE (Mixture of Experts，专家混合模型)：一种神经网络架构，结合多个专家子模型进行工作，通过负载均衡提高效率，适用于大规模模型。 Bootstrap (自举法)：模型通过生成多个答案并选择最佳结果，来提升自身性能的自我改进方法。蒸馏 (Distillation)：将大模型的知识转移给小模型，通过模仿大模型的输出，提高小模型的能力。 GRPO (Gradient Reward Policy Optimization，梯度奖励策略优化)：一种强化学习算法，通过梯度下降优化模型策略。 PPO (Proximal Policy Optimization，近端策略优化)：一种强化学习算法，通过限制策略更新的幅度来保持优化的稳定性。负载均衡 (Load Balance)：在分布式系统中平衡计算任务，避免过度集中或资源闲置。强化学习 (Reinforcement Learning)：通过奖励机制引导AI模型学习最优策略的机器学习方法。模型预测控制 (Model Predictive Control)：基于对未来状态的预测来优化当前决策的方法，广泛用于自动化控制。 NV Link (NVIDIA Link)：英伟达开发的高速芯片互联技术，支持多GPU协同工作，提升计算效率。 CUDA (Compute Unified Device Architecture，统一计算设备架构)：英伟达推出的并行计算平台和编程模型，用于加速GPU上的计算任务。 PTX (Parallel Thread Execution，并行线程执行)：CUDA平台底层的指令集架构，直接与GPU硬件交互。计算核心/张量核心 (Code Core/Tensor Core)：GPU中的两种计算单元：代码核心负责通用计算，张量核心专门处理AI矩阵计算。 ASIC (Application Specific Integrated Circuit，专用集成电路)：为特定应用定制的集成电路，通常用于高效处理特定任务。 Groq：一家专注于开发AI专用芯片的美国公司，提供高效的AI计算解决方案。《The Bitter Lesson》(痛苦的教训)：Rich Sutton的经典文章，提出在AI发展中，计算能力和规模比算法精巧性更为重要。世界模型 (World Model)：一种能够预测动作后果的AI模型，常用于环境模拟、决策规划和强化学习中。《Genie》：DeepMind的研究论文，展示了AI如何在虚拟环境中进行探索和自我学习。 HPC (High Performance Computing，高性能计算)：使用超级计算机集群处理复杂的计算任务，通常应用于科学计算、气候模拟等高需求场景。【监制】杜秀【后期】 AMEI 【BGM】 Dusk Movers - Alexandra Woodward City Phases STEMS INSTRUMENTS - John Abbot 【在这里找到我们】公众号：硅谷101 收听渠道：苹果｜小宇宙｜喜马拉雅｜蜻蜓FM｜网易云音乐｜QQ音乐｜荔枝播客海外用户：Apple Podcast｜Spotify｜TuneIn｜YouTube｜Amazon Music 联系我们：podcast@sv101.net

上一期： E178｜智能眼镜大战CES：靠AI不如产品硬
下一期： E180｜量子计算的Transformer时刻与科技巨头的路径之争

大家还在听

关注我们

工信部APP备案号:粤ICP备12026999号-31A
粤网文[2022]1888-146号粤ICP备12026999号
增值电信业务经营许可证粤B2-20120522
穗公网安备44010650010105号
网信算备440106359615002220011号网信算备440106359615004220013号
互联网宗教信息服务许可证粤(2023）0000133
荔枝微信客服：关注公众号“荔枝APP服务”直接输入您的问题（工作时间：10:00~12:00、14:00~20:00）
荔枝全国公开举报电话：020—38057619 扰乱网络传播秩序及违法违规信息举报邮箱： jubao@lizhi.fm
荔枝未成年人权益受理邮箱：advise@lizhi.fm
广州荔支网络技术有限公司 2010-至今© All Rights Reserved. 本平台为信息网络存储空间网络服务平台

自审制度精选专题关于我们加入我们联系我们荔枝服务协议隐私政策版权投诉指引