⼤家好,会员计划第 13 期会员通讯已送达!
论文部分介绍了一种无需访问预训练数据或模型权重即可验证测试集污染的方法,通过对模型的测试问题进行有序和无序的展示,观察似然概率的统计显著差异来检测数据污染。同时,介绍了对话代理框架的提出,该框架能够实现对话控制和规划最优对话行动,以及提高 RAG(Retrieval-Augmented Generation)模型性能的 RankRAG 指令微调框架。最后,介绍了 NL2SQL 的 RB-SQL 框架,用于提高大型数据库和复杂多表查询的处理能力。
工程部分讨论了知识助手的未来发展趋势,包括 Agentic RAG 的流程和 PE-Rank 的开源,以及开源 TTS 项目的整理和评估。同时,提到了 Open AI 研究员 Lilian Weng 的文章,完整探讨了 LLM 产生幻觉的原因、检测方法和防止幻觉的方法。
产品部分展示了 Anthropic Console 的新功能,能以生成、测试和评估 prompt,以及 DeepSeekMath 这款数学推理能力接近 GPT-4 的 7B 模型。还提到了 Nexa AI 提供的 AI Agent 解决方案,以及 LanceDB 这种为 AI 多模态数据设计的数据库。
市场部分分析了 AI 医疗产业的发展现状和趋势,探讨了从云计算到大模型时代的数据库行业竞争,以及 OpenAI 推出的 AGI 五级路线图。