发表会员计划41 分钟读完 (大约6142个字) Vol.41:DeepSeek R1爆火之后,到底什么任务适合用 RL 做?
本期内容通过论文、工程、产品和市场四个部分, 论文介绍了一系列论文,包括 RAG 系统中上下文大小和模型选择的影响、如何通过代码输入输出预测(CODE I/O)来增强大型语言模型(LLMs)的推理能力、揭秘 LLMs 中的长链思维推理(CoT)、以及从 RAG 到记忆的进化等研究成果。工程部分详述了 DeepSeek 开源周的工程进展,如 FlashMLA、DeepEP、DeepGEMM 等技术的并探讨了开源 AI 的协作机制和法律意义。此外,介绍了多个 AI 模型的开源,包括 Moonlight-16B-A3B、Microsoft 的 Phi-4-Mini 和 Phi-4-Multimodal、通义万相 Wan2.1 视频模型等。Hugging Face 的 FastRTC 库也被提及,用于简化实时音视频 AI 应用的开发。在产品部分,文章讨论了秘塔 AI 的「先想后搜」Research 模式,腾讯混元的快思考模型 Turbo S,以及阿里云推出的推理大模型 QwQ-Max-Preview 等。OpenAI 发布的 GPT-4.5 和 ChatGPT Deep Research 功能的开放,以及 Anthropic 推出的 Claude 3.7 Sonnet 模型,都表明了 AI 产品在推理和创造性任务上的进步。ElevenLabs 发布的独立语音检测模型 Scribe,以及 Product Hunt 上的最佳产品,如 Tanka、Musa、Webdraw Beta 等,展示了 AI 技术在团队沟通、自我护理、API 开发等多个领域的应用。市场动态方面,LiblibAI 完成了新一轮融资,重点投入创作者生态建设与技术研发,Anthropic 公司即将完成一轮 35 亿美元的融资,估值达到 615 亿美元。百度和字节跳动也在积极跟进 AI 模型的迭代和优化。最后,文章提供了一些观点,包括 AI 技术对企业管理和组织结构的影响,以及如何在 AI 时代中保持竞争力和创造价值。
阅读更多