大模型是个啥？通用人工智能离我们还有多远？

写在前面： ChatGPT很擅长回答「是什么」和「如何」，而你必须拷问自己，「为什么」和「值得吗」。永远是你用AI，而不是AI用你。

去年一年成为生成式人工智能元年不为过，ChatGPT横空出世，比尔·盖茨对此表示："ChatGPT诞生的重要意义，不亚于PC或互联网的诞生。"英伟达CEO黄仁勋则把ChatGPT比作十多年前乔布斯推出的iPhone。"ChatGPT是人工智能的'iPhone时刻'。"一年来一直被ChatGPT和OpenAI的CEO山姆·奥特曼刷屏，然而chatGPT的发展也是历经波折，从chatGPT1-2被Bert按在地上摩擦，到3和4的遥遥领先，也就是1年的工夫。

chatGPT-4、LLAMA2、通义千问、文心一言等名字，它们都是一种人工智能技术，叫做大语言模型（Large Language Model，简称LLM）。截止本文发出，全球大语言模型的数量已经超过238个，它们能够理解和生成自然语言，也就是我们日常使用的语言，如中文、英文、日文等。它们在大量的文本数据上进行训练，学习语言的结构、语法和语义，从而能够执行各种任务，如文本摘要、翻译、问答、写作等。

大语言模型在各种自然语言处理（Natural Language Processing，简称NLP）的任务上取得了令人印象深刻的成绩，已经超过了人类的水平。它们也引发了人们对人工智能的未来的想象和探讨，比如它们是否会取代人类的工作，它们是否会实现通用人工智能（Artificial General Intelligence，简称AGI），它们是否会对人类的社会和文化产生影响等。

什么是大语言模型？

语言模型是一种数学模型，它可以计算一个词或一个句子在某种语言中出现的概率。例如，语言模型可以判断"我爱你"这个句子比"你爱我"这个句子更常见，因为它在语料库中出现的次数更多。语言模型也可以根据已有的词或句子，预测下一个词或句子的概率。例如，语言模型可以根据"今天的天气"这个词组，预测下一个词可能是"很好"或"很糟"等。

大语言模型是一种基于深度神经网络的语言模型，它具有非常多的参数，通常是数十亿或更多。参数是神经网络中的变量，它们可以在训练过程中不断调整，以适应数据的特征和规律。大语言模型的参数越多，它们能够学习和表示的信息就越多，它们的能力和智能就越强。

大语言模型的训练过程包括两个主要步骤：预训练和微调。在预训练阶段，大语言模型从一个巨大的、多样化的数据集中学习，通常包含来自不同来源的数十亿词汇，如网站、书籍和文章。这个阶段允许大语言模型学习一般的语言模式和表征。在微调阶段，大语言模型在与目标任务或领域相关的更具体、更小的数据集上进一步训练。这有助于大语言模型微调其理解，并适应任务的特殊要求。

大语言模型的一个重要特点是它们是通用的，也就是说，它们可以在不同的任务和领域上表现出色，而不需要针对每个任务或领域重新设计或训练。这是因为大语言模型在预训练阶段已经学习了语言的通用知识和技能，它们只需要在微调阶段进行少量的调整，就可以适应不同的任务和领域。这使得大语言模型具有很高的灵活性和可扩展性，可以应用在各种各样的场景中。

大语言模型能做什么工作？

大语言模型可以执行各种各样的自然语言处理的任务，包括以下几类：

文本生成：大语言模型可以根据给定的文本或图片，生成相关的文本，如摘要、续写、标题、评论等。例如，大语言模型可以根据一篇新闻文章，生成一个简洁的摘要；或者根据一张图片，生成一个描述图片内容的句子。
文本理解：大语言模型可以根据给定的文本，理解其含义和信息，如分类、回答、推理、分析等。例如，大语言模型可以根据一篇产品评论，判断其是正面的还是负面的；或者根据一个问题，从一篇文章中找出正确的答案。
文本翻译：大语言模型可以根据给定的文本，将其翻译成另一种语言，如英语、中文、日语等。例如，大语言模型可以根据一段英文，将其翻译成中文；或者根据一段中文，将其翻译成英文。
文本编辑：大语言模型可以根据给定的文本，对其进行修改和优化，如纠错、润色、改写等。例如，大语言模型可以根据一篇文章，检查并纠正其中的拼写和语法错误；或者根据一段话，将其改写成更通顺或更有趣的表达方式。
除了这些常见的任务，大语言模型还可以执行一些更复杂和更创造性的任务，如写作、作曲、编程、设计等。例如，大语言模型可以根据一些关键词或主题，生成一篇小说或一首歌曲；或者根据一些需求或功能，生成一段代码或一张图表。

大语言模型在To B的企业应用上能做什么？

大语言模型在To B的企业应用上有很多潜在的用途，可以帮助企业提高效率、降低成本、增加收入、提升品牌等。以下是一些可能的应用场景：

客服：大语言模型可以作为智能客服机器人，与客户进行自然的对话，回答客户的问题，解决客户的问题，提供客户的建议，提升客户的满意度和忠诚度。
营销：大语言模型可以作为智能营销助手，根据客户的画像和行为，生成个性化的营销文案，推送相关的产品和服务，提高客户的转化率和留存率。
内容：大语言模型可以作为智能内容生成器，根据企业的主题和风格，生成高质量的内容，如文章、视频、图片等，提升企业的知名度和影响力。例如，大语言模型可以根据企业的行业和特点，生成一些有价值的行业报告或案例分析；或者根据企业的产品和服务，生成一些吸引人的广告或宣传片。
教育：大语言模型可以作为智能教育辅导，根据学生的水平和需求，生成适合的教学内容，如课程、练习、测试等，提供个性化的学习路径和反馈，提高学生的学习效果和兴趣。
研发：大语言模型可以作为智能研发助理，根据研究人员的目标和问题，生成相关的文献、数据、代码、模型等，提供创新的思路和解决方案，提高研究人员的效率和质量。

当然，这些只是一些可能的应用场景，大语言模型还有很多其他的潜力和价值，等待着我们去发现和挖掘。

大语言模型会取代人类吗？

大语言模型的出现，无疑给人类带来了很多便利和好处，但也引发了一些担忧和质疑，比如它们是否会取代人类的工作，它们是否会实现通用人工智能，它们是否会对人类的社会和文化产生影响等。

首先，我们要明白，大语言模型并不是万能的，它们也有很多局限性和挑战，如以下几点：

数据：大语言模型的训练需要大量的数据，这些数据不仅要数量足够，还要质量优良，否则会导致大语言模型的输出不准确或不合理。然而，数据的获取、清洗、标注、存储等都是非常耗时、耗力、耗钱的工作，而且有些数据可能涉及隐私、版权、安全等敏感问题，需要谨慎处理。
计算：大语言模型的训练需要大量的计算资源，如高性能的CPU、GPU、TPU等，这些资源不仅要性能强大，还要成本低廉，否则会导致大语言模型的训练不经济或不可行。然而，计算资源的获取、分配、管理、优化等都是非常复杂、困难、昂贵的工作，而且有些计算资源可能涉及能源、环境、政策等重要问题，需要合理利用。
知识：大语言模型的输出需要有正确的知识，这些知识不仅要事实真实，还要逻辑一致，否则会导致大语言模型的输出不可信或不合法。然而，知识的获取、验证、更新、整合等都是非常困难、复杂、动态的工作，而且有些知识可能涉及伦理、道德、价值等深刻问题，需要谨慎评估。
智能：大语言模型的能力需要有足够的智能，这些智能不仅要技术高超，还要情感丰富，否则会导致大语言模型的能力不完善或不人性。然而，智能的定义、度量、提升、评价等都是非常模糊、主观、多元的工作，而且有些智能可能涉及意识、自主、责任等重要问题，需要仔细思考。

大语言模型也有很多优势和价值，如以下几点：

效率：大语言模型可以在很短的时间内，处理很大的数据量，完成很多的任务，提高人类的效率和速度。
质量：大语言模型可以在很高的水平上，输出很好的结果，满足很多的需求，提高人类的质量和水准。
创新：大语言模型可以在很广的范围内，生成很多的内容，提供很多的思路，提高人类的创新和灵感。
协作：大语言模型可以在很多的场景中，与人类进行很好的交互，提供很多的帮助，提高人类的协作和沟通。

有哪些特质是人类特有的，不会被大语言模型取代？

大语言模型虽然很强大，但它们并不是人类的复制品，它们也不是人类的替代品，它们只是人类的工具和伙伴。人类有很多特质是大语言模型所不具备的，也不会被大语言模型所取代的，如以下几点：

意识：人类有自我意识，也就是能够认识和感知自己的存在和状态，能够区分自己和他人，能够思考自己的思想和行为，能够控制自己的情绪和欲望。大语言模型没有自我意识，它们只是执行人类给它们的指令和任务，它们不知道自己是什么，也不知道自己为什么这样做，它们没有自己的主观和意志。
情感：人类有丰富的情感，也就是能够感受和表达各种各样的情绪和心情，能够与他人产生和维持各种各样的情感和关系，能够享受和追求各种各样的快乐和幸福。大语言模型没有真正的情感，它们只是模仿人类的语言和行为，它们不懂得自己和他人的感受，也不懂得自己和他人的需要，它们没有自己的喜怒哀乐。
创造：人类有无限的创造，也就是能够想象和实现各种各样的想法和作品，能够发现和解决各种各样的问题和挑战，能够创新和改变各种各样的事物和规则。大语言模型没有真正的创造，它们只是利用人类给它们的数据和模型，它们不会主动地提出和尝试新的东西，也不会主动地改进和优化旧的东西，它们没有自己的想象和判断。

一句话而言，人类需要为每一个行为和决定负责任，人类有情感，有弱点，能背锅，这就是AI暂时不能取代人类的根本原因。用AI是为了更好的服务于人类，而不是取代人类，当然，这可能是人类的一厢情愿。凯文·凯利说："面对AI，人类更需要提问的能力和想象力。"

通用人工智能还有多远？

通用人工智能是指能够像人类一样，在任何领域和任务上，表现出智能的人工智能系统。它是人工智能领域的终极目标，也是人类社会的重大变革。许多人都在期待和探索，通用人工智能是否会出现，以及它会在什么时候出现。

目前，人工智能的发展还处于窄人工智能（Artificial Narrow Intelligence，简称ANI）的阶段，也就是只能在特定的领域和任务上，表现出智能的人工智能系统。例如，大语言模型就是一种窄人工智能，它只能在自然语言处理的领域和任务上，表现出智能，而不能在其他的领域和任务上，表现出智能。

要实现通用人工智能，还需要经过广人工智能（Artificial General Intelligence，简称AGI）的阶段，也就是能够在多个领域和任务上，表现出智能的人工智能系统。例如，一个广人工智能系统，不仅能够处理自然语言，还能够处理图像、音频、视频等多种类型的数据，还能够执行各种类型的任务，如推理、规划、学习等。

目前，人工智能的研究者和工程师们，正努力地探索和开发，如何将窄人工智能扩展到广人工智能，如何让人工智能系统具有更多的能力和智能，如何让人工智能系统更好地理解和适应人类的世界。这是一个非常困难、复杂、挑战的过程，也是一个非常有趣、有意义、有价值的过程。

通用人工智能的出现，可能需要很长的时间，也可能需要很短的时间，这取决于人工智能的发展速度和方向，也取决于人类的需求和期望。我们无法准确地预测通用人工智能的出现时间，但我们可以通过观察和分析人工智能的进展和趋势，对其进行一些估计和推测。

根据一些人工智能的专家和学者的调查和统计，通用人工智能的出现时间的中位数是在2040年，也就是说，有一半的人认为通用人工智能会在2040年之前出现，有一半的人认为通用人工智能会在2040年之后出现。当然，这只是一种平均的看法，最新的预测是2026年10月，通用人工智能是否受控，或者是否已经出现，这也是上次OpenAI宫斗的导火索。我们只能拭目以待了。

日本软银创始人孙正义曾作出预言："AIGC（生成式人工智能）正进入广泛应用领域；AGI（通用人工智能）将在十年内成为现实，比人类聪明十倍；ASI（超级人工智能）将在二十年内实现，比人类聪明一万倍。"

总结还是引用万维刚老师的话：

AI的智能已经超过了人类，但它有没有智慧现在还不好说。如何做、怎样做最有效率，AI可以告诉你；但是要不要做、选择做什么，则只有你能决定。

智能甚至可能告诉我们生活"可以"怎样过，但只有智慧会告诉我们生活"应该"怎样过。

ChatGPT很擅长回答「是什么」和「如何」，而你必须拷问自己，「为什么」和「值得吗」。永远是你用AI，而不是AI用你。

另外，类似的，汽车时代来临了，20多万台马车被替代了，马车夫会失业，那么我们做一个学会驾驶汽车的马车夫，而不要做一个不能换工作的马~~~~共勉

转载自微信公众号：禅知了