轻装上阵,加速商业化,LangChain 0.1 预发布看点

LangChain 在 0.1 版本发生了重要变更,官方还专门发了一篇博客,总体看下来可以概括为聚焦核心,共建生态,轻装上阵,加速商业化,我也在第一时间向官方申请试用了商业化产品,本篇文章从 LangChain 变更情况解读,商业化产品试用,以及类 LangChain 的 LLM 应用开发框架的发展三部分来谈谈。

阅读更多

大语言模型的安全问题探究

提示攻击是一种利用 LLM 漏洞的攻击方式,通过操纵输入或提示来实现。与传统黑客攻击(通常利用软件漏洞)不同,提示攻击依赖于精心设计的提示,欺骗LLM执行非预期的操作。提示攻击主要分为三种类型:提示注入、提示泄露和越狱。随着大语言模型的广泛应用,安全必定是一个非常值得关注的领域,下面这篇文章对当前已知的攻击方式进行梳理,希望对大家的工程落地有一定帮助!

阅读更多

大语言模型概况

大模型在 NLP 任务中的出色表现确实为人工智能领域带来了新的发展和探索方向。语言作为思想的符号,是人类交流和表达的主要方式,因此理解和生成自然语言是通往通用人工智能(AGI)之路的一个重要方向。大模型的出现和不断优化,使得计算机能够更好地理解自然语言的含义和上下文,进而提供更准确、更自然的语言交互和信息处理。然而,要实现真正的通用人工智能,还需要解决许多挑战和问题,例如:如何将机器学习模型从“短期记忆”转变为“长期记忆”,如何让机器具备更深入的理解和推理能力,以及如何解决数据隐私和安全等问题。

阅读更多

类 ChatGPT 模型调研

ChatGPT虽然强大,但在国内的政策下,真要落地数据安全才是最重要的,Meta AI 发布的 LLaMA 让大家看到在相对较小的模型上使用大规模数据集训练并达到较好性能的曙光,笔者也第一时间使用 Docker 和 Alpaca LoRA 对 LLaMA 7B 大模型进行 Fine-Tune,内部使用达到预期效果。下面将该过程使用到的背景资料进行整理,为想私有化落地的朋友作为参考!

阅读更多

OpenAI 文档解读

OpenAI 文档涉及内容众多,包括微调,Embeddings等众多主题,需要详细了解的可以自行前往阅读,我这里会重点选取高频使用的 API 进行说明以及对 ChatGPT 最佳实践主题进行解读。

阅读更多

ChatGPT 之 Prompt学习

在 LLM 工程中,prompt 指的是生成文本的输入,它通常是一个问题、一个话题或者一个指令。用户可以通过输入 prompt 来告诉 LLM 模型需要生成的文本类型,LLM 模型则会根据 prompt 和已有的训练数据来生成相应的文本响应,实际使用中高质量的 prompt 会达到事半功倍的效果。

阅读更多

ChatGPT发展概览

ChatGPT 是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于 GPT-3.5、GPT-4 架构的大语言模型并以强化学习训练。ChatGPT目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。

阅读更多