大语言模型的安全问题探究

提示攻击是一种利用 LLM 漏洞的攻击方式,通过操纵输入或提示来实现。与传统黑客攻击(通常利用软件漏洞)不同,提示攻击依赖于精心设计的提示,欺骗LLM执行非预期的操作。提示攻击主要分为三种类型:提示注入、提示泄露和越狱。随着大语言模型的广泛应用,安全必定是一个非常值得关注的领域,下面这篇文章对当前已知的攻击方式进行梳理,希望对大家的工程落地有一定帮助!

阅读更多

大语言模型概况

大模型在 NLP 任务中的出色表现确实为人工智能领域带来了新的发展和探索方向。语言作为思想的符号,是人类交流和表达的主要方式,因此理解和生成自然语言是通往通用人工智能(AGI)之路的一个重要方向。大模型的出现和不断优化,使得计算机能够更好地理解自然语言的含义和上下文,进而提供更准确、更自然的语言交互和信息处理。然而,要实现真正的通用人工智能,还需要解决许多挑战和问题,例如:如何将机器学习模型从“短期记忆”转变为“长期记忆”,如何让机器具备更深入的理解和推理能力,以及如何解决数据隐私和安全等问题。

阅读更多

OpenAI 接口实践

OpenAI的接口文档十分详细,包括对话补全,文本补全,代码补全等等信息,也包含了最佳生产实践,最佳安全实践等篇章,通读之后十分受用,推荐大家前往阅读。本文就是在接口文档的基础上,将常见的三种OpenAI 接口套壳应用代码展示出来,以帮助读者实现自己的工具。

阅读更多

ChatGPT发展概览

ChatGPT 是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于 GPT-3.5、GPT-4 架构的大语言模型并以强化学习训练。ChatGPT目前仍以文字方式交互,而除了可以用人类自然对话方式来交互,还可以用于甚为复杂的语言工作,包括自动生成文本、自动问答、自动摘要等多种任务。

阅读更多