神经网络的数学原理

计算机的神经网络

计算机的神经网络类似于生物的大脑, 生物的大脑是由神经元构成的, 神经元包括细胞体,轴突突触和树突, 信息由轴突的突触传递到下一个神经元的树突。 那么计算机的神经网络如何去仿真这个操作呢?

最简单的神经元

神经网络数学第一课 二分类问题,也就是逻辑回归。最简单的模型公式y = wx + b , weight , bias。神经网络训练就是给确定输入值x,和期望值y,求解参数权重w 和偏置b,如果是两个未知数,那么就需要两组x,y。比如x=1, y=4, x=2,y=7, 求解方程组可得 y = 3x + 1,

所以推理的时候输入任何x就可以得到期望y值了。

预留一个问题,当x和y都是矢量, 如何求解weight和bias, 这就得用数学的方式求解,后续再说。

这个公式在二维的坐标系中画出一条直线, 假设一个场景预测房价Y,X是房子距离市中心的位置。 因为输入的值你是确定的,所以看输出的值是什么就可以确定什么价格。 这就是最基本的神经网络,单个神经元。

神经网络的基础二分类

在现实生活中,房价影响因素众多,地理位置x1,面积大小x2,物业情况x3等等,影响因素,每种因素影响的权重

W=w1, w2, w3...

X=x1, x2, x3 ....

y = Wt * X + b (Wt 表示W的转置T)

根据已有的数据可以在二维坐标系中画出来一条线,具体怎么求解这条线方法很多,例如最小二乘法或是最短距离法这里不细说, 有了这条直线以后,只要我们知道地理位置面积大小和物业情况就可以计算它的房价。 这就是典型的逻辑回归问题。

二分类问题其实就是区分0和1,假如说 贷款问题,银行对贷款问题只有两种可以借贷不可以借贷他是根据借款人的征信w1,个人资产w2,负资产w3和月工资w4来决定他是否可以借贷的。

我们假设y ‎ =  Wt * X + B 的数学模型, 然后根据一堆人的数据情况求解得出

W值和B值, 但是y始终是一个具体的值, 所以得用一个激活函数,把Y总变为零或一的一个二分类。

相关推荐
爱读源码的大都督4 小时前
Claude Code源码分析(三):为什么系统提示词中需要有tools呢?
前端·人工智能·后端
半个落月5 小时前
LLM如何预测下一个Token?一文拆解Transformer核心流程
人工智能
触底反弹5 小时前
🔥 2026 年爆火的 Harness Engineering 到底是什么?从原理到实战一文讲透
javascript·人工智能·程序员
user4465117917915 小时前
源码深读 XAgent:6 个 Agent 怎么分工?工具失败不崩、死循环怎么防?
人工智能
魏祖潇5 小时前
SDD 完整指南——Spec 端打底、Story 端交付、留白区
人工智能·后端
常丛丛5 小时前
5.9 式输出:实时查看 LangGraph Agent 思考过程
人工智能
Token炼金师5 小时前
从节点图到低秩矩阵:ComfyUI 推理引擎与 LoRA 适配机制拆解
人工智能·aigc
武子康5 小时前
调查研究-210 Netflix 用 AI 复刻 Gene Wilder 的声音:语音克隆的下半场,不是模型,而是权利
人工智能·aigc·openai
Quz6 小时前
在 Obsidian 中嵌入 Claude Code 的实践记录
人工智能·claude
雪隐6 小时前
个人电脑玩AI-10让5060 Ti给你打工——部署 Odysseus:终于有个能打的"AI管家"了
人工智能·后端