我的机器学习起步如何Getting Started

学习技巧和原则

  • 先通过经典书籍进行科普
  • 知名机器学习网站
  • 根据书籍或网站的目录,先泛读、再选择有兴趣的部分重点精读、后至于反复读
  • 知行合一

起步Getting Started

  • 周志华版《机器学习》,又名西瓜书

可以作为科普书籍,需要主动略过对于理论推导过程,和数学公式的求真
介绍的非常全面,可作为参考书籍
书籍的前几章基本上概括了机器学习现在的框架,有助于对具体的机器学习算法或工具进行把握

  • 吴军博士《数学之美》

更侧重对于自然语言处理、语音识别、搜索等方面的人工智能上层应用,做了专向的科普和技术原理概要介绍。
文风轻松、叙事流畅,读起来相当轻松

区别于常见回归分类的基础应用,对于更上层的人工智能技术应用进行了介绍,并阐述了背后的数学原理并不复杂
更侧重于基于大数据的概率统计、马尔可夫过程、条件概率等技术手段进行人工智能应用

介绍了粗略结构

仅关注目录结构,把握机器学习的大脉络
每个章节仅读取头部几个章节的简单的内容
数据清洗,对于这一部分目录的了解,让你几乎可以作为一名初级的数据工程师

英文比较好的同学,可以深入研究其它官网例子

  • 信息论主要观点
    • 信息消除不确定性
    • 信息量、信息熵

代码例子学习网站

  • scikit-learn

相当全面的机器学习工具库,着力解决中小数据规模的机器学习问题,但大部分也够用了
基于深度学习的神经网络,确实在既适应线性问题、又适应非线性问题方面比较突出
可视化例子

  • OpenCV

对于图片或视频进行处理,可以进行一些SVMKNN的机器学习,甚至包括一些预处理。例如,常用的图片灰度化手段,其实从机器学习来看,就是专家赋能后进行降维处理,但是,对于学习任务信息量又没有丢失太多,以致于学习不到什么东西。

彩蛋

  • 回归问题和分类问题的桥梁

对数几率回归;两者的差别没有想想的那么大

  • CNN卷积神经网络

在图片特征抽取上面找到了工程上可接受的调参技术手段,关键在于最终步骤采样特征向量形成
相比较于常见较为容易处理特征向量,深度学习对于容易获取的图片数据、但难以描述其典型特征的的粗材料数据,提供了形成特征向量的方法

  • 对于关系数据库中的表记录作为特征向量的思考

关系数据库中的唯一索引对于机器学习并不友好,可以考虑提前去除
非唯一索引等非独立属性可以作为聚类分析的关注对象

其它列数据基本上可以做到相互独立,或依赖比较弱

  • 算力的忧虑

一般人很难拥有强大算力,需要注意如何自举

结束语

机器学习对于其成熟的应用领域,确实达到了工具化的程度,如果了解了,就会能够使用,并成为倍增器!

相关推荐
NAGNIP8 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab9 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab9 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP13 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年13 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼13 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS13 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区14 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈14 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang15 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx