LLM 大语言模型学习记录

文章目录

    • [1. 写在最前面](#1. 写在最前面)
    • [2. 让 gpt-4o-mini 解释 LLM 的原理](#2. 让 gpt-4o-mini 解释 LLM 的原理)
    • [3. 让 gpt-4o-mini 解释 LLM 的使用场景](#3. 让 gpt-4o-mini 解释 LLM 的使用场景)
    • [4. 让 gpt-4o-mini 解释 LLM 的局限性](#4. 让 gpt-4o-mini 解释 LLM 的局限性)
    • [5. 碎碎念](#5. 碎碎念)

1. 写在最前面

大语言模型(LLM)似乎已经成为 AI 领域的宠儿,不少公司争相推出自研的大模型。但是笔者似乎理解的还是一知半解,遇到不懂的问题,没时间深入分析很正常,但是刚好今天有时间学习,那就学习一波吧。

注:最近工作心得,只沟通,不期待,只输出,不争辩,只筛选,不教育。

以下是 gpt-4o-min 关于「LLM 介绍」的回答:

以下是 google 检索「LLM 介绍」返回的说明:

有上述两张对比图可以可以分析出来, 大模型在「知识问答」上回答的会更加精准和聚焦,省去了过去 google 过程中逐个阅读分析的过程,直接可以一步就回答到点子上。

注:在问题检索方面,原始的 google 方式和直接基于大模型做问答,笔者以自己实践的经验总结,在使用大模型的时候,问答会更加简介,虽然不能保证 100% 正确,但基本多问答尝试几次后,基本都可以得到正确答案,简而言之,大模型真的香!

2. 让 gpt-4o-mini 解释 LLM 的原理

问:以 gpt-4o-mini 的模型为例,为我详细解释一下底层的原理

问:以 gpt-4o-mini 的模型为例,为我详细解释一下底层的原理,但是请不要使用过多的专业词汇,可以尝试用更通俗易懂的语言

注:这个版本的术语确实会比之前的方式更少,但是还是读完了一头雾水

问:假设我是一个小学生,能为我介绍一下 gpt-4o-mini 的模型的原理吗?要求要使用小学生能够理解的语言

注:这个版本已经没有专业术语,读起来更加简单和易懂

让笔者斗胆的总结一下 LLM ,按照如上 gpt 返回的结果,笔者能够大概对 LLM 的模型产生一个模糊的认知,即 「LLM 是一个已经被训练好的模型,它被训练的可以在多种丰富场景中使用,并且每种场景的知识储备均非人脑可达到的,同时它还具有自学习的能力,在跟它做问答的时候它会不断纠正自己错误的答复,从而回答的更加准确」

所以关于 「LLM 介绍」从提问的角度上看已经不够正确了,应该问「LLM 的某一种模型,是如何训练出来的」

LLM 的不同模型在底层使用的算法可能不尽相同,就不在这里赘述,本文仅对 LLM 产生一个基本的了解。

3. 让 gpt-4o-mini 解释 LLM 的使用场景

问: 请尽可能多的枚举出 LLM 可以在当前时代中使用的场景

复制代码
大型语言模型(LLM)如 GPT-4o-mini 在当前时代可以应用于多种场景,以下是一些主要的应用领域:

1. **对话系统**:
   - 聊天机器人:提供客户支持、回答常见问题。
   - 虚拟助手:如 Siri、Alexa,帮助用户完成任务。

2. **内容生成**:
   - 自动写作:生成文章、博客、故事或诗歌。
   - 社交媒体内容:撰写推文、帖子和评论。

3. **教育和学习**:
   - 辅导和作业帮助:解答学生的问题,提供学习建议。
   - 生成学习材料:如测验、练习题和复习资料。

4. **翻译和语言学习**:
   - 语言翻译:实时翻译文本或对话。
   - 语言学习辅助:提供语法解释和练习。

5. **文本分析**:
   - 情感分析:分析评论、反馈和社交媒体内容的情感倾向。
   - 主题建模:总结和提取文本中的主要主题。

6. **编程和技术支持**:
   - 代码生成:根据描述生成代码片段或函数。
   - 编程助手:回答技术问题,提供编程建议。

7. **创意应用**:
   - 游戏设计:生成游戏情节、角色对话和任务。
   - 艺术创作:协助创作音乐、剧本或其他艺术作品。

8. **市场营销**:
   - 广告文案生成:撰写吸引人的广告和宣传材料。
   - 客户分析:分析客户数据,提供个性化推荐。

9. **健康和医疗**:
   - 健康咨询:提供健康信息和建议(注意不替代专业医生)。
   - 医疗文档处理:整理和生成病历和报告。

10. **法律和合规**:
    - 合同分析:分析法律文件,提取关键信息。
    - 法律咨询:回答法律问题和提供相关信息。

11. **社交互动**:
    - 虚拟社交:与用户进行自然对话,提供陪伴。
    - 互动故事:根据用户选择生成不同的故事情节。

12. **研究和数据处理**:
    - 文献综述:总结和分析大量研究文献。
    - 数据解释:将复杂数据转化为易于理解的语言。

13. **个性化推荐**:
    - 内容推荐:根据用户的兴趣推荐书籍、电影、音乐等。
    - 产品推荐:为电商平台的用户提供个性化产品建议。

14. **新闻和信息传播**:
    - 新闻摘要:自动生成新闻报道的摘要。
    - 信息验证:检查信息的真实性和可靠性。

15. **人机协作**:
    - 助手角色:帮助人类完成复杂任务,提高工作效率。
    - 头脑风暴:协助团队进行创意讨论和想法生成。

这些场景展示了大型语言模型在不同领域的广泛应用潜力,随着技术的不断发展,未来可能会出现更多创新的使用方式。

注:这里截图会导致内容产生截断,所以就复制了 gpt 的返回

在上面的回答中并不包含「实时转录」,怀着好奇的心态我接着问道:你为什么不能做实时转录? 回答如下图

4. 让 gpt-4o-mini 解释 LLM 的局限性

问:LLM 在使用上有什么局限性

5. 碎碎念

关于 LLM 的好奇点还有很多,但是今日份的学习就先到这里吧!

  • 不是生活有意思,是我明媚又有趣。

  • 你永远也不可能真正了解一个人,除非你穿上她的鞋子走来走去,站在她的角度考虑问题。可真当你走过她的路时,你连路过都觉得难过。

  • 现在,我已经过了 70 岁,可我的好奇心还跟我在 22 岁的时候一样一点都没少。实际上,你得有好奇,才可能有开始。

相关推荐
m0_751336391 小时前
突破性进展:超短等离子体脉冲实现单电子量子干涉,为飞行量子比特奠定基础
人工智能·深度学习·量子计算·材料科学·光子器件·光子学·无线电电子
美狐美颜sdk4 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
DeepSeek-大模型系统教程4 小时前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
郭庆汝5 小时前
pytorch、torchvision与python版本对应关系
人工智能·pytorch·python
小雷FansUnion7 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周7 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
sealaugh327 小时前
aws(学习笔记第四十八课) appsync-graphql-dynamodb
笔记·学习·aws
水木兰亭8 小时前
数据结构之——树及树的存储
数据结构·c++·学习·算法
叶子爱分享8 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜8 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习