NLP杂货店
本项目来源:从头预训练一只超迷你 LLa…
大模型的生成策略有常见的以下几种: 贪婪…
本文根据nanoGPT的思路,使用Ope…
1 简介 LMDeploy 由 MMDe…
NLP领域不同于传统的机器学习领域拥有非…
LLaMA架构的设计可以说是引领了整个开…
目前来说主流的RLHF方向分为两大类: …
LoRA是现在大红大紫的微调方法,其原理…
大模型的能力可能超乎我们的想象,我们可以…
我们都知道,大模型非常heavy,如果没…