Vol.40:Grok3 是否意味着预训练阶段 Scaling Law 已失效?
本期内容通过论文、工程、产品和市场四个部分,论文部分讨论了大语言模型在问答系统中的多样性增强、基于图的问答框架的改进、以及在潜在空间中进行推理的新范例。工程部分展示了 DeepSeek R1 模型的应用实例、多模态模型的开源发布以及 AI 面试平台 FoloUp 的特性。产品部分介绍了新 Email 的推出、知乎直答的升级以及其他 AI 搜索产品的进展。市场部分分析了 DeepSeek 在中国的应用案例、微信搜索的 AI 搜索功能灰度测试、以及 YC 在孵化 AI 初创企业方面的成功经验。此外,还提到了 Product Hunt 2024 年的金喵奖榜单,以及从 DeepSeek-R1 看 2025 模型未来的趋势和可能性。
阅读更多