Tag: LLM

全部标签 "LLM".

DeepSeek-V4 技术解读：1M Context、MoE 稳定性与低精度训练的工程取舍

2026年4月29日 8:00

基于 DeepSeek-V4 技术报告系统梳理 DeepSeek-V4 在 1M Context、MoE 训练稳定性、FP8/FP4 低精度训练、Muon 分布式实现上的关键工程取舍，并说明这些设计与检索质量、训练成本和系统复杂度之间的关系。
Agent 应用：代码执行重构 MCP 工作流，节省 90% 上下文开销

2025年11月12日 6:00

Agent 应用通过代码执行重构 MCP 工作流，告别低效工具调用，大幅节省上下文开销。本文深入分析 LLM 编码优势，提升 AI 应用效率与复杂性。
字节豆包大模型深度评测：API 性能、长上下文与 AI 应用开发

2024年6月13日 5:00

深度评测字节跳动豆包大模型，分析其 API 吞吐、函数调用、长上下文能力，探讨其在 AI 应用开发中的适用性与企业选型价值。
ChatGPT 一周年：程序员如何利用 LLM 实现自我成长与实践

2023年12月2日 8:00

ChatGPT 发布一周年，本文从程序员视角回顾大模型发展，分享利用 LLM 提升工作效率、扩展个人能力边界的实践经验，并展望 AI 未来。

DeepSeek-V4 技术解读：1M Context、MoE 稳定性与低精度训练的工程取舍