莫尔索随笔

2024-09-30发表会员计划1 小时读完 (大约7421个字)

Vol.22：垂直 SaaS 如何通过 AI 来提高收入？

大家好，预祝大家国庆快乐，玩得开心！Weekly Gradient 第 22 期内容已送达！

2024-09-23发表会员计划34 分钟读完 (大约5087个字)

Vol.21：OpenAI o1合成数据与推理搜索

⼤家好，Weekly Gradient 第 21 期内容已送达！

2024-09-20发表33 分钟读完 (大约4908个字)

OpenAI o1 模型是通往 AGI 之路吗?

大家好久不见，最近太忙，发现已经快断更三个月了，这期间写了一本 RAG 相关的书，估计年底可以和大家见面，可以期待下；同时搞了一个新产品，也快上线了，终于可以有时间继续更新，今天简单分享一些对 OpenAI 的 o1 模型的看法，o1 模型主要是利用强化学习优化大模型的思维链（Chain-of-Thought）推理过程，从而显著提升了模型的推理能力，我认为短期内对应用落地是利好，从长远来看，我认为这可能偏离了实现 AGI（通用人工智能）的正确路径，下面会详细展开。

2024-09-09发表会员计划25 分钟读完 (大约3724个字)

Vol.20：如何评估 Embedding 模型？

⼤家好，Weekly Gradient 第 20 期内容已送达！

2024-09-02发表会员计划1 小时读完 (大约8249个字)

Vol.19：AI应用正在这4个大场景里加速落地

⼤家好，Weekly Gradient 第 19 期内容已送达！

2024-08-26发表会员计划1 小时读完 (大约7267个字)

Vol.18：大模型是泡沫吗？

⼤家好，Weekly Gradient 第 18 期内容已送达！

2024-08-12发表会员计划43 分钟读完 (大约6426个字)

Vol.17：如何构建生成式 AI 应用平台？

⼤家好，Weekly Gradient 第 17 期内容已送达！

2024-08-05发表会员计划29 分钟读完 (大约4414个字)

Vol.16：构建可靠 LLM 应用的三大原则

⼤家好，Weekly Gradient 第 16 期内容已送达！

2024-07-29发表会员计划38 分钟读完 (大约5729个字)

Vol.15：大语言模型应用如何实现端到端优化？

⼤家好，Weekly Gradient 第 15 期内容已送达！
论文部分提到了一种优化查询生成的方法 QOQA，用于提升 RAG（Retrieval-Augmented Generation）中的文档检索准确性。AGENTPOISON 是一种针对 LLMs 代理的红队攻击方法，通过毒化记忆或知识库来实现攻击。另一篇论文探讨了在递归生成的数据上训练 AI 模型时可能出现的问题。微软亚洲研究院提出了 Parrot 系统，以优化 LLMs 应用的端到端性能。
在工程实践方面，文章详细分析了 RAG 技术的应用和挑战，以及 LangChain 博客中提出的增强代理规划的方法。WWDC 24 介绍了使用 Core ML 运行 Mistral 7B 的方法。微软推出了 MInference 工具，用于优化长上下文语言模型的推理过程。
产品发布部分包括了开源模型 Llama-3.1 的发布，Mistral Large 2 的推出，以及 OpenAI 宣布的 AI 搜索引擎产品 SearchGPT 的内测。智谱 AI 推出了新一代视频生成模型 CogVideoX,DeepSeek API 也进行了升级。
市场动态部分梳理了 15 家获得投资的 AI 搜索公司的情况，发布了《生成式 AI 商业落地白皮书》，并统计了六个城市在人工智能赛道的融资情况。还讨论了 Voice Agent 作为 AI 时代的交互界面。

2024-07-22发表会员计划31 分钟读完 (大约4703个字)

Vol.14：如何改进大模型代码生成能力？

⼤家好，Weekly Gradient 第 14 期内容已送达！
论文部分介绍了几项研究成果，包括如何通过证明者 - 验证者游戏提高语言模型输出的可读性，以及如何结合传统关系提取方法和大型语言模型来提升小样本关系抽取的性能。还分析了大型模型生成代码时的常见错误类型，并提出了通过自我批评机制来改进代码生成的方法。此外，还提出了 Speculative RAG 框架，用于增强基于检索的生成模型的性能。
工程部分展示了一些实际应用，例如 Groq 宣布开源了 Llama3 8B/70B 模型的微调版本，阿里巴巴推出了语音模型 Qwen2-Audio，以及介绍了 PDF-Extract-Kit 和 LlamaParse 等工具。同时，还讨论了如何选择适合微调和推理的 GPU，以及如何将大型语言模型的上下文扩展至百万级别。
产品部分介绍了一些基于大型语言模型的产品，如知识管理系统 storm、AI 搜索产品 Exa、以及 Mem0 等，这些产品在不同的领域展示了大型模型的应用潜力。
市场部分分析了生成式 AI 推理企业的市场机遇、竞争与未来趋势，并对 OpenAI 发布的 GPT-4o mini 以及 GPT-3.5 模型的退出进行了说明。同时，还提供了对 2024AI 体验营销行业研究报告的概述，探讨了 AI 体验营销的发展趋势和市场规模。
观点部分提到了百度主任架构师李乐丁对于 AI 的实际认知，强调了大型模型的本质是深度学习驱动的数学公式，旨在打破对 AI 的不切实际幻想，并重建正确的认知。

订阅我的免费通讯

我的作品

最新文章

归档

标签