类 ChatGPT 模型调研

ChatGPT虽然强大,但在国内的政策下,真要落地数据安全才是最重要的,Meta AI 发布的 LLaMA 让大家看到在相对较小的模型上使用大规模数据集训练并达到较好性能的曙光,笔者也第一时间使用 Docker 和 Alpaca LoRA 对 LLaMA 7B 大模型进行 Fine-Tune,内部使用达到预期效果。下面将该过程使用到的背景资料进行整理,为想私有化落地的朋友作为参考!

我的新书《LangChain编程从入门到实践》 已经开售!推荐正在学习AI应用开发的朋友购买阅读!
LangChain编程从入门到实践

ChatGPT模型

类ChatGPT模型

LLaMA

Alpaca

Bloomz(支持中文)

Belle(支持中文)

哈工大中文LLaMA(支持中文)

ChatGLM

其他

训练方法

学习资料

相关论文

作者

莫尔索

发布于

2023-03-27

更新于

2024-12-18

许可协议

评论