大模型(二)神经网络

文章目录

什么是模型

模型是一个由输入和输出构成的系统。只要有模型,就一定有输入和输出。

分类:

  • 明确数学公式: 这类公式是明确的,当输入数据时,会进行明确的数据计算
  • 需学习与训练: 这类公式不那么明确,需要通过学习和训练来明确,如神经网络和机器学习

融合两类公式: 真实的模型往往是融合了明确数学公式和需学习的公式。

步骤:

  • 设计一个符合场景的公式
  • 模型的参数

设计模型的主要工作:设计数学公式

模型就是一个数学公式,设计模型就是设计能解决真实问题的数学公式

万金油公式-神经网络

复杂真实问题难以通过人类设计公式解决,神经网络作为万金油公式应运而生:神经网络:模拟人脑,设计一种一劳永逸的公式结构,通过大量参数(如几千亿个)进行复杂计算

这样在模型中只需要做第二个步骤

通过案例理解神经网络-基于MNIST数据库的图像识别

MNIST数据库介绍

此模型接受图片作为输入,输出结果为概率

MNIST数据库中有7万张手写的数字图片,从0-9,其中6万张用于训练,1万张用于测试。

每张图片只包含一个手写数字(0-9),为28×28像素的灰度图片(黑白图片)

实现步骤

  • 将图片的每一个像素转为用0-255展示的数字,输出为一个28*28=784维向量
  • 边缘提取:用前一个数字减去后一个数字,把非0数字转化为1,其中1为边缘,0为中间或者没有
  • 采用中间公式进行计算
  • 输出十个概率,对应这个图片中数字是0-9的概率

神经网络与机器学习

神经网络的作用: 有了神经网络,设计公式结构变得轻松,因为神经网络可以替代人类设计复杂的数学公式,部分公式由人类设计,部分由神经网络完成,两者融合。

模拟机器学习的过程

  • 给出一个公式
  • 确定参数分别是多少
    • 随机初始化一组参数
    • 在训练数据集中,利用公式进行分类
    • 计算分类结果的误差
    • 计算参数的值应该如何计算才能减小误差:假设其他参数都不变 只变化一个参数 得到一个平面上的曲线 神经网络和机器学习
    • 计算出一组新的参数值
    • 回到第二步
相关推荐
百锦再15 小时前
第11章 泛型、trait与生命周期
android·网络·人工智能·python·golang·rust·go
数新网络18 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao18 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)19 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠19 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay19 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
王哈哈^_^19 小时前
【完整源码+数据集】课堂行为数据集,yolo课堂行为检测数据集 2090 张,学生课堂行为识别数据集,目标检测课堂行为识别系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
Elastic 中国社区官方博客20 小时前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php
ytttr87320 小时前
Landweber迭代算法用于一维、二维图像重建
人工智能·算法·机器学习
feifeigo12320 小时前
Matlab编写压缩感知重建算法集
人工智能·算法·matlab