2023-03-27发表LLM 应用开发实践7 分钟读完 (大约1024个字)

类 ChatGPT 模型调研

ChatGPT虽然强大，但在国内的政策下，真要落地数据安全才是最重要的，Meta AI 发布的 LLaMA 让大家看到在相对较小的模型上使用大规模数据集训练并达到较好性能的曙光，笔者也第一时间使用 Docker 和 Alpaca LoRA 对 LLaMA 7B 大模型进行 Fine-Tune，内部使用达到预期效果。下面将该过程使用到的背景资料进行整理，为想私有化落地的朋友作为参考！

✉️ 免费订阅更新

订阅我的免费通讯，第一时间获取生成式 AI 领域优质内容

我承诺保护您的隐私，不会向第三方分享您的信息。
您可以随时取消订阅。

ChatGPT模型

类ChatGPT模型

Belle(支持中文)

Github：Belle
模型文件：
- Belle-7B-2M（基于Alpaca训练）
- Belle-LLAMA-7B-2M（基于LLAMA训练）
论文：无

哈工大中文LLaMA(支持中文)

Github：Chinese-LLaMA-Alpaca
模型文件：
- chinese-llama-lora-7b
- chinese-alpaca-lora-7b
论文：无

ChatGLM

Gtihub：ChatGLM-6B
模型文件：THUDM/chatglm-6b
论文：ChatGLM

类 ChatGPT 模型调研

✉️ 免费订阅更新

ChatGPT模型

类ChatGPT模型

LLaMA

Alpaca

Bloomz(支持中文)

Belle(支持中文)

哈工大中文LLaMA(支持中文)

ChatGLM

其他

训练方法

学习资料

相关论文

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

订阅我的免费通讯

我的作品

目录

最新文章

归档

标签