Tag: LLM
全部标签 "LLM".
-
DeepSeek-V4 技术解读:1M Context、MoE 稳定性与低精度训练的工程取舍
基于 DeepSeek-V4 技术报告系统梳理 DeepSeek-V4 在 1M Context、MoE 训练稳定性、FP8/FP4 低精度训练、Muon 分布式实现上的关键工程取舍,并说明这些设计与检索质量、训练成本和系统复杂度之间的关系。
-
Agent 应用:代码执行重构 MCP 工作流,节省 90% 上下文开销
Agent 应用通过代码执行重构 MCP 工作流,告别低效工具调用,大幅节省上下文开销。本文深入分析 LLM 编码优势,提升 AI 应用效率与复杂性。
-
字节豆包大模型深度评测:API 性能、长上下文与 AI 应用开发
深度评测字节跳动豆包大模型,分析其 API 吞吐、函数调用、长上下文能力,探讨其在 AI 应用开发中的适用性与企业选型价值。
-
ChatGPT 一周年:程序员如何利用 LLM 实现自我成长与实践
ChatGPT 发布一周年,本文从程序员视角回顾大模型发展,分享利用 LLM 提升工作效率、扩展个人能力边界的实践经验,并展望 AI 未来。