大模型综述一镜到底(全文八万字) ——《Large Language Models: A Survey》论文链接:https://arxiv.org/abs/2402.06196摘要:自2022年11月ChatGPT发布以来,大语言模型(LLMs)因其在广泛的自然语言任务上的强大性能而备受关注。正如缩放定律所预测的那样,大语言模型通过在大量文本数据上训练数十亿个模型参数来获得通用语言理解和生成能力。大语言模型的研究领域虽然非常新,但在许多不同方面都在迅速发展。在本文中,我们回顾了一些最杰出的大语言模型,包括三个流行的大语言模型家族(GPT、LLaMA、PaLM),讨论了它们的特点、贡献和局限性。我们还概述了