LLM 大语言模型学习记录

文章目录

    • [1. 写在最前面](#1. 写在最前面)
    • [2. 让 gpt-4o-mini 解释 LLM 的原理](#2. 让 gpt-4o-mini 解释 LLM 的原理)
    • [3. 让 gpt-4o-mini 解释 LLM 的使用场景](#3. 让 gpt-4o-mini 解释 LLM 的使用场景)
    • [4. 让 gpt-4o-mini 解释 LLM 的局限性](#4. 让 gpt-4o-mini 解释 LLM 的局限性)
    • [5. 碎碎念](#5. 碎碎念)

1. 写在最前面

大语言模型(LLM)似乎已经成为 AI 领域的宠儿,不少公司争相推出自研的大模型。但是笔者似乎理解的还是一知半解,遇到不懂的问题,没时间深入分析很正常,但是刚好今天有时间学习,那就学习一波吧。

注:最近工作心得,只沟通,不期待,只输出,不争辩,只筛选,不教育。

以下是 gpt-4o-min 关于「LLM 介绍」的回答:

以下是 google 检索「LLM 介绍」返回的说明:

有上述两张对比图可以可以分析出来, 大模型在「知识问答」上回答的会更加精准和聚焦,省去了过去 google 过程中逐个阅读分析的过程,直接可以一步就回答到点子上。

注:在问题检索方面,原始的 google 方式和直接基于大模型做问答,笔者以自己实践的经验总结,在使用大模型的时候,问答会更加简介,虽然不能保证 100% 正确,但基本多问答尝试几次后,基本都可以得到正确答案,简而言之,大模型真的香!

2. 让 gpt-4o-mini 解释 LLM 的原理

问:以 gpt-4o-mini 的模型为例,为我详细解释一下底层的原理

问:以 gpt-4o-mini 的模型为例,为我详细解释一下底层的原理,但是请不要使用过多的专业词汇,可以尝试用更通俗易懂的语言

注:这个版本的术语确实会比之前的方式更少,但是还是读完了一头雾水

问:假设我是一个小学生,能为我介绍一下 gpt-4o-mini 的模型的原理吗?要求要使用小学生能够理解的语言

注:这个版本已经没有专业术语,读起来更加简单和易懂

让笔者斗胆的总结一下 LLM ,按照如上 gpt 返回的结果,笔者能够大概对 LLM 的模型产生一个模糊的认知,即 「LLM 是一个已经被训练好的模型,它被训练的可以在多种丰富场景中使用,并且每种场景的知识储备均非人脑可达到的,同时它还具有自学习的能力,在跟它做问答的时候它会不断纠正自己错误的答复,从而回答的更加准确」

所以关于 「LLM 介绍」从提问的角度上看已经不够正确了,应该问「LLM 的某一种模型,是如何训练出来的」

LLM 的不同模型在底层使用的算法可能不尽相同,就不在这里赘述,本文仅对 LLM 产生一个基本的了解。

3. 让 gpt-4o-mini 解释 LLM 的使用场景

问: 请尽可能多的枚举出 LLM 可以在当前时代中使用的场景

大型语言模型(LLM)如 GPT-4o-mini 在当前时代可以应用于多种场景,以下是一些主要的应用领域:

1. **对话系统**:
   - 聊天机器人:提供客户支持、回答常见问题。
   - 虚拟助手:如 Siri、Alexa,帮助用户完成任务。

2. **内容生成**:
   - 自动写作:生成文章、博客、故事或诗歌。
   - 社交媒体内容:撰写推文、帖子和评论。

3. **教育和学习**:
   - 辅导和作业帮助:解答学生的问题,提供学习建议。
   - 生成学习材料:如测验、练习题和复习资料。

4. **翻译和语言学习**:
   - 语言翻译:实时翻译文本或对话。
   - 语言学习辅助:提供语法解释和练习。

5. **文本分析**:
   - 情感分析:分析评论、反馈和社交媒体内容的情感倾向。
   - 主题建模:总结和提取文本中的主要主题。

6. **编程和技术支持**:
   - 代码生成:根据描述生成代码片段或函数。
   - 编程助手:回答技术问题,提供编程建议。

7. **创意应用**:
   - 游戏设计:生成游戏情节、角色对话和任务。
   - 艺术创作:协助创作音乐、剧本或其他艺术作品。

8. **市场营销**:
   - 广告文案生成:撰写吸引人的广告和宣传材料。
   - 客户分析:分析客户数据,提供个性化推荐。

9. **健康和医疗**:
   - 健康咨询:提供健康信息和建议(注意不替代专业医生)。
   - 医疗文档处理:整理和生成病历和报告。

10. **法律和合规**:
    - 合同分析:分析法律文件,提取关键信息。
    - 法律咨询:回答法律问题和提供相关信息。

11. **社交互动**:
    - 虚拟社交:与用户进行自然对话,提供陪伴。
    - 互动故事:根据用户选择生成不同的故事情节。

12. **研究和数据处理**:
    - 文献综述:总结和分析大量研究文献。
    - 数据解释:将复杂数据转化为易于理解的语言。

13. **个性化推荐**:
    - 内容推荐:根据用户的兴趣推荐书籍、电影、音乐等。
    - 产品推荐:为电商平台的用户提供个性化产品建议。

14. **新闻和信息传播**:
    - 新闻摘要:自动生成新闻报道的摘要。
    - 信息验证:检查信息的真实性和可靠性。

15. **人机协作**:
    - 助手角色:帮助人类完成复杂任务,提高工作效率。
    - 头脑风暴:协助团队进行创意讨论和想法生成。

这些场景展示了大型语言模型在不同领域的广泛应用潜力,随着技术的不断发展,未来可能会出现更多创新的使用方式。

注:这里截图会导致内容产生截断,所以就复制了 gpt 的返回

在上面的回答中并不包含「实时转录」,怀着好奇的心态我接着问道:你为什么不能做实时转录? 回答如下图

4. 让 gpt-4o-mini 解释 LLM 的局限性

问:LLM 在使用上有什么局限性

5. 碎碎念

关于 LLM 的好奇点还有很多,但是今日份的学习就先到这里吧!

  • 不是生活有意思,是我明媚又有趣。

  • 你永远也不可能真正了解一个人,除非你穿上她的鞋子走来走去,站在她的角度考虑问题。可真当你走过她的路时,你连路过都觉得难过。

  • 现在,我已经过了 70 岁,可我的好奇心还跟我在 22 岁的时候一样一点都没少。实际上,你得有好奇,才可能有开始。

相关推荐
阿里云大数据AI技术几秒前
阿里云 AI 搜索方案解读:大模型驱动下的智能搜索,助力企业数字化转型
人工智能·阿里云·云计算
Anna_Tong8 分钟前
阿里云Qwen系列大模型:多领域AI应用的创新利器
人工智能·阿里云·语言模型·云计算
深图智能9 分钟前
OpenCV的TIF红外可见光融合算法
图像处理·人工智能·python·opencv·算法·计算机视觉
sleP4o15 分钟前
MySQL的学习
学习·mysql·adb
羑悻的小杀马特34 分钟前
【Artificial Intelligence篇】AI 入侵家庭:解锁智能生活的魔法密码,开启居家梦幻新体验
c++·人工智能·生活
打工人你好1 小时前
iOS 逆向学习 - Inter-Process Communication:进程间通信
学习·ios
羊小猪~~1 小时前
数据结构C语言描述11(图文结合)--二叉搜索树(BST树)的实现(数据采用KV存储形式进行封装)
c语言·开发语言·数据结构·c++·学习·考研·算法
JINGWHALE12 小时前
设计模式 行为型 访问者模式(Visitor Pattern)与 常见技术框架应用 解析
前端·人工智能·后端·设计模式·性能优化·系统架构·访问者模式
羊小猪~~2 小时前
错误修改系列---基于RNN模型的心脏病预测(pytorch实现)
人工智能·pytorch·rnn·深度学习·神经网络·机器学习·tensorflow
金智维科技官方2 小时前
财务自动化管理系统有哪些?
大数据·人工智能·自动化