3-机器学习与大模型开发数学教程-第0章 预备知识-0-3 函数初步(多项式、指数、对数、三角函数、反函数)

在数学和机器学习中,函数是最重要的概念之一。直观上,函数就像是一台"机器",输入一个数,经过一系列规则加工,输出另一个数。比如你把苹果放进榨汁机,出来的是苹果汁------这就是"输入"和"输出"的关系。

在机器学习里,模型本质上就是一个复杂的函数:输入数据(图像、文本、音频),输出预测结果(分类、生成、翻译)。所以打好函数的基础,对理解 AI 模型至关重要。


1. 多项式函数

最常见的函数就是 多项式函数,形式为:

f(x)=anxn+an−1xn−1+⋯+a1x+a0f(x) = a_n x^n + a_{n-1} x^{n-1} + \dots + a_1 x + a_0f(x)=anxn+an−1xn−1+⋯+a1x+a0

比如:

  • 一次函数:f(x)=2x+3f(x)=2x+3f(x)=2x+3(直线)
  • 二次函数:f(x)=x2−4x+3f(x)=x^2-4x+3f(x)=x2−4x+3(抛物线)

直观类比 :多项式函数就像是"配方",把原料 xxx 按照不同的比例(系数)和加工方式(幂次方)混合起来。

在机器学习中:线性回归模型就是最简单的一次多项式;更复杂的模型(比如神经网络)可以看作是多项式函数的组合。


2. 指数函数

指数函数的基本形式是:

f(x)=ax(a>0,a≠1)f(x) = a^x \quad (a>0, a \neq 1)f(x)=ax(a>0,a=1)

  • 当 a>1a > 1a>1 时,函数呈 指数增长(比如病毒传播、互联网用户数增长)。
  • 当 $0 时,函数呈 指数衰减(比如药物浓度随时间下降)。

在机器学习中

  • 学习率衰减常用指数函数。
  • 概率分布(如 softmax 函数)中也有指数运算。

3. 对数函数

对数函数是指数函数的反函数:

f(x)=log⁡a(x)(a>0,a≠1)f(x) = \log_a(x) \quad (a>0, a \neq 1)f(x)=loga(x)(a>0,a=1)

含义:回答"某个数是底数 aaa 的几次幂?"

例如:log⁡2(8)=3\log_2(8)=3log2(8)=3,因为 23=82^3=823=8。

直观类比

指数函数是"复利滚雪球",对数函数是"问雪球有多大时,它是滚了几次"。

在机器学习中

  • 信息论中的 信息熵、交叉熵损失函数用到对数。
  • 对数常用来缩放数据,解决数值过大问题。

4. 三角函数

三角函数与角度和周期现象相关,比如:

sin⁡(x),cos⁡(x),tan⁡(x)\sin(x), \quad \cos(x), \quad \tan(x)sin(x),cos(x),tan(x)

它们的特点是 周期性,经常用来描述波动。

直观类比:海浪的起伏、四季的变化、电台的信号,都是周期性的,可以用三角函数建模。

在机器学习中

  • Transformer 的位置编码(Positional Encoding)就使用了正弦和余弦函数,帮助模型理解序列的顺序。

5. 反函数

一个函数如果可以"逆转过程",就有 反函数

比如:

  • 指数函数 y=2xy=2^xy=2x 的反函数是对数函数 y=log⁡2(x)y=\log_2(x)y=log2(x)。
  • 平方函数 y=x2y=x^2y=x2 的反函数(在非负数范围内)是平方根函数 y=xy=\sqrt{x}y=x 。

我们可以用一个 Mermaid 图来展示函数与反函数的关系:
函数 f 反函数 f_inverse x 输入 y 输出

说明

  • 函数 fff 把输入 xxx 变成输出 yyy。
  • 反函数 f−1f^{-1}f−1 把 yyy 再还原成 xxx。
  • 两者是互逆的,就像"加法"和"减法","加密"和"解密"。

从几何角度来看,函数与反函数的图像是 关于直线 y=xy=xy=x 对称的


总结

  • 多项式:机器学习的基本模型(线性回归就是一次多项式)。
  • 指数与对数:描述增长与衰减,在概率和损失函数中常见。
  • 三角函数:处理周期性问题,比如 Transformer 的位置编码。
  • 反函数:理解"可逆映射",帮助我们把"结果"还原成"输入"。

函数世界是整个数学和机器学习的基础。后续的微积分、线性代数、概率论,几乎都离不开函数的概念。

相关推荐
CareyWYR2 小时前
每周AI论文速递(250908-250912)
人工智能
张晓~183399481212 小时前
短视频矩阵源码-视频剪辑+AI智能体开发接入技术分享
c语言·c++·人工智能·矩阵·c#·php·音视频
deephub3 小时前
量子机器学习入门:三种数据编码方法对比与应用
人工智能·机器学习·量子计算·数据编码·量子机器学习
AI 嗯啦3 小时前
计算机视觉----opencv实战----指纹识别的案例
人工智能·opencv·计算机视觉
max5006003 小时前
基于多元线性回归、随机森林与神经网络的农作物元素含量预测及SHAP贡献量分析
人工智能·python·深度学习·神经网络·随机森林·线性回归·transformer
trsoliu3 小时前
前端基于 TypeScript 使用 Mastra 来开发一个 AI 应用 / AI 代理(Agent)
前端·人工智能
白掰虾3 小时前
STM32N6&AI资料汇总
人工智能·stm32·嵌入式硬件·stm32n6·stm32ai
爱思德学术4 小时前
中国计算机学会(CCF)推荐学术会议-C(软件工程/系统软件/程序设计语言):MSR 2026
人工智能·机器学习·软件工程·数据科学
小李独爱秋4 小时前
特征值优化:机器学习中的数学基石
人工智能·python·线性代数·机器学习·数学建模