241121学习日志——[CSDIY] [InternStudio] 大模型训练营 [11]

CSDIY:这是一个非科班学生的努力之路,从今天开始这个系列会长期更新,(最好做到日更),我会慢慢把自己目前对CS的努力逐一上传,帮助那些和我一样有着梦想的玩家取得胜利!!!

第一弹:Cpp零基础学习【30 DAYS 从0到1】

第二弹:Cpp刷题文档【LeetCode】

第三弹:Go开发入门【字节后端青训营】

第四弹:Cpp简单项目开发【黑马Rookie】

第五弹:数据结构绪论【数据结构与算法】

第六弹:Go工程实践【字节后端青训营】

第七弹:高质量编程和性能调优【字节后端青训营】

第八弹:Linux 基础知识【书生大模型训练营】

第九弹:Git 基础知识【书生大模型训练营】

第十弹:玩转HF/魔搭/魔乐社区【书生大模型训练营】

第十一弹:书生大模型全链路开源体系【书生大模型训练营】

第1关 L1G1000 书生大模型全链路开源体系

书生 · 浦语大模型开源开放体系

书生 · 浦语 (InterLM) 开源一周年

InterLM2.5 概览

  • 推理能力领先
  • 支持100万字上下文
  • 自主规划和搜索完成复杂任务

核心技术思路

相似度对齐、预训练、...

  • 基于规则的数据构造
  • 基于模型的数据扩充
  • 基于反馈的数据生成

融合多种数据合成方案

100万 Token 上下文

大海捞针实验:在超长文本输入中,能否精准找到任何位置的任何信息。

基于规划和搜索解决复杂任务

解决方式:思维路径拆解,分解子问题

开源谱系

  • 1.8B、7B、20B、102B

  • InterLM - XComposer - 文本多模态

  • InterLM - Math - 数学

  • InterLM - WOX - 高考

全链条开源体系

  • 数据 书生·万卷 语料库

  • 预训练 InternEvo 训练框架

    • 分布式训练系统
  • 微调 XTuner

    • 微调、偏好对齐算法
    • 自动优化加速
  • 评测 OpenCompass

    • 工具、社区...
  • 部署 LMDeploy

    • Weight-only量化、...
  • 应用

    • LLM --->智能体
    • 智能体 Legent
      • 零样本泛化:多模态 AI 工具使用
    • 智能体 MindSearch
      • 模拟人脑思维导图搜索
    • 智能体 HuixiangDou
      • 企业级
      • 开源、安全、...

碎碎念:入门岛通关,进军基础岛。坚持。

与君共勉。

相关推荐
Alidme1 小时前
cs106x-lecture14(Autumn 2017)-SPL实现
c++·学习·算法·codestepbystep·cs106x
小王努力学编程1 小时前
【算法与数据结构】单调队列
数据结构·c++·学习·算法·leetcode
ZxsLoves1 小时前
【【Systemverilog学习参考 简单的加法器验证-含覆盖率】】
学习·fpga开发
明阳mark1 小时前
Ansible 学习笔记
笔记·学习·ansible
~kiss~2 小时前
python的thrift2pyi学习
windows·python·学习
Evaporator Core2 小时前
MATLAB学习之旅:数据建模与仿真应用
开发语言·学习·matlab
大米洗澡2 小时前
数字签名技术基础
python·学习·程序人生·面试·职场和发展
StickToForever3 小时前
第4章 信息系统架构(六)
经验分享·笔记·学习·职场和发展
陈无左耳、13 小时前
HarmonyOS学习第3天: 环境搭建开启鸿蒙开发新世界
学习·华为·harmonyos
柃歌13 小时前
【UCB CS 61B SP24】Lecture 7 - Lists 4: Arrays and Lists学习笔记
java·数据结构·笔记·学习·算法