【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点

今天考试通过腾讯云人工智能从业者TCA级别的认证了!

还是很开心的,也看不到什么更好的方向,把一切能利用的时间用来学习,总是对的。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

这个号码真好,88868909,我喜欢。

今天来总结计算机视觉实际应用的特点。

机器学习和深度学习,总算是搞明白了。今天考试,有好几个考点,都和这个有关系。

我理解的机器学习和深度学习的区别和联系

  • 机器学习包含了深度学习;
  • 深度学习主要是神经网络技术,这是Hinton这个大神,也就是人工智能之父,40年坚持的结果;
  • 机器学习主要是特征工程的存在,有标注,也有标签,深度学习也需要数据标注,但是基本不需要做特征工程,也就是人工进行数据预处理、特征抽取、特征选择、特征这些工作;
  • 深度学习只关注端到端,就是输入到输出的过程。其中也有多隐层神经网络等,在例子中的前馈神经网络,是最简单的神经网络模型;
  • 机器学习由于有人的参与,所以可解释性很强,很多时候其实是为了特定任务而去做的,普适性不是很强,而深度学习,自己就能学习;
  • 比如在图片分类中,机器学习要对图片进行特征工程,就是打标签,找出汽车车身的特征,而深度学习,直接用卷积算法就可以,滑动窗口,整个图片使用同一个权重,得到特征值,通过多层神经网络,学习哪个是汽车;
  • 所以说机器学习是人工来提取特征,深度学习是从数据中创建新的特征;
  • 机器学习要把复杂的工作,拆分为小的任务,逐个攻克;深度学习只关注端到端;
  • 机器学习可以使用少量的数据,就能预测,而深度学习不行;
  • 机器学习用低性能的计算机就能计算,而深度学习不行;

大概就是这样。

这是整个人工智能课程的核心。

当然,现在大家都普遍关心的,是sora,大模型LLM等,这肯定更有魅力的应用方向。大模型的出现,让人工智能真的是走向了新的高峰。

有人说,之前的人工智能,都是针对特定任务的,没有普适性。从大模型的出现来看,AGI也许已经在某个实验室里面实现了。

AGI是Artificial General Intelligence的首字母缩写,意为人工通用智能,也称为强人工智能。它指的是一种具有类似于人类全面智能的人工智能系统,可以处理不同领域的任务和问题,包括学习、推理、理解语言、感知环境、创造性思考等多种能力。与只能处理特定任务的狭窄人工智能(Narrow AI)不同,AGI旨在实现人类智能的全面模拟,并可以在不同场景和任务中表现出与人类相似的智能水平。

AGI的实现需要融合多个领域的知识和技术,包括机器学习、自然语言处理、计算机视觉、机器人技术等,同时也需要解决许多挑战和难题,如理解自然语言、掌握常识知识、具备有效的推理能力、能够感知和适应不同的环境等。

虽然AGI的实现仍面临着许多挑战和风险,如数据隐私、伦理道德等问题,但其对人类社会的影响和意义是巨大的。AGI可以帮助我们解决许多重大问题,如环境保护、医疗保健、安全保障等,同时也可以在各个领域中充当人类的助手、合作伙伴甚至是导师的角色,推动人类社会的进步和发展。

因此,AGI是当前人工智能领域的一个重要研究方向,也是未来人工智能发展的一个重要趋势。

言归正传,我们今天该学习机器视觉的一些普通特性了。

看,就是这些核心的内容。

很多朋友又要感觉没意思了,觉得没有关键技术名词,没有英文对照,没有示例代码等等。

其实,这些理念,是更重要的东西。

当前我们的任务,是要给玩具小车,加上自动识别标识牌的能力,我们暂且不管,边缘端的情况,我们来看这些要注意的事项。

  • 样本具象化。图像是具体表现形式,除了主体外,还有大量的信息,如背景,光照等。
  • 算法光线敏感性。侧光,面向光,背光,强光,暗光,都有影响,如果样本没有这些光线的图片,效果会欠佳。
  • 理解硬件条件可能造成的图片效果偏差。带来色差、模糊、角度变化,样本如果没有这些资料,效果会欠佳。
  • 客户理解的偏差。不理解光线影响,不能清晰的表达述求,都在需求梳理时摸清,否则影响交付。

前面都好说,有经验的项目人员,就能知道怎么来理解了。

最后的客户理解偏差,反而是我在实践中,感觉最头疼的。

客户认为,这不是很简单的事吗!

这要很久吗?!

这那个什么什么公司,不是早就做出来了吗?我们只是要做个一样的,甚至还更简答的而已!

好吧,客户不知道,除了识别这些标志,我们还要看,你这个场地,有什么特点,光线,硬件条件等等,包括这些小车搭载的摄像机,是多少分辨率!

延伸学习:


在计算机视觉的实际应用中,有许多关键的注意事项和经验,这些可以影响算法的准确性和效率。以下是一些主要的考虑因素:

  1. 图像质量:高质量的图像对于计算机视觉算法至关重要。图像的清晰度、分辨率和噪声水平都会影响算法的性能。因此,在实际应用中,需要确保使用的图像采集设备能够提供高质量的图像,或者采用图像增强技术来改善图像质量。
  2. 光照条件:光照条件是影响计算机视觉算法性能的另一个重要因素。不同的光照条件(如亮度、颜色温度、方向等)会对图像的外观产生显著影响,从而影响算法的准确性。为了解决这个问题,可以采用背景光照补偿技术、阴影去除技术等,以提升计算机视觉系统的鲁棒性。同时,在实际应用中,应尽量选择光线充足、均匀的环境,避免强光和暗光交替的情况出现。
  3. 数据集偏差:训练数据集的选择和准备对于计算机视觉算法的性能至关重要。如果训练数据集中存在偏差,比如样本不平衡、类别不均衡等,可能导致算法的泛化能力下降。为了解决这个问题,可以采用数据集采样均衡化、数据增强等技术,以改善模型的性能。同时,应注意数据的质量和多样性,确保数据集具有足够的标签和多样的样本。
  4. 镜头选择:在计算机视觉应用中,镜头的选择也会影响图像的质量和算法的准确性。不同的镜头有不同的焦距、光圈和景深等特性,这些特性会影响图像的清晰度和细节表现。因此,在实际应用中,应根据具体的需求选择合适的镜头。
  5. 避免畸变:在定位及高精度测量的系统中,畸变是一个需要特别注意的问题。畸变会导致图像中的物体形状发生扭曲,从而影响算法的准确性。为了解决这个问题,可以采用畸变校正技术,或者在系统标定时使用远心镜头等特殊镜头来减小畸变的影响。
  6. 恰当的照明与曝光:照明和曝光是影响图像质量的关键因素之一。如果照明不足或曝光过度,图像将不能提供足够的反差和细节信息,这将严重影响算法的准确性。因此,在实际应用中,需要选择适合的灯源和曝光设置,以确保图像具有足够的反差和细节信息。同时,还应注意系统周围环境的影响,避免其他光源对图像产生干扰。
  7. 算法选择与调优:对于不同的视觉任务,可能有多种不同的算法可供选择。在实际应用中,应根据任务的要求和数据集的特点选择合适的算法,并进行必要的调优。这包括选择合适的网络结构、调整超参数、使用正则化技术等手段来提高算法的准确性和效率。
  8. 实时性与性能平衡:在计算机视觉应用中,实时性和性能之间往往存在一定的权衡关系。为了提高算法的实时性,可能需要牺牲一部分性能;反之,为了提高性能,可能需要增加计算复杂度和时间成本。因此,在实际应用中,需要根据具体的需求和场景来平衡实时性和性能之间的关系。

总之,在计算机视觉的实际应用中,需要考虑多个方面的因素来确保算法的准确性和效率。通过注意以上提到的注意事项和经验,可以更好地应用计算机视觉技术来解决实际问题。

相关推荐
strongwyy3 小时前
9、nRF52xx蓝牙学习(pca10056.h学习)
单片机·嵌入式硬件·学习
每天题库3 小时前
2025 年江苏保安员职业资格考试经验分享
学习·安全·考试·题库·考证
Starry_hello world7 小时前
Linux 的准备工作
linux·笔记·有问必答
viperrrrrrrrrr79 小时前
大数据学习(105)-Hbase
大数据·学习·hbase
IT _oA9 小时前
Active Directory 域服务
运维·服务器·网络·windows·笔记
袖清暮雨9 小时前
Python刷题笔记
笔记·python·算法
六bring个六10 小时前
QT上位机笔记
开发语言·笔记·qt
熬夜造bug10 小时前
LeetCode Hot100 刷题笔记(1)—— 哈希、双指针、滑动窗口
笔记·leetcode·hot100
行思理11 小时前
go语言应该如何学习
开发语言·学习·golang
oceanweave12 小时前
【k8s学习之CSI】理解 LVM 存储概念和相关操作
学习·容器·kubernetes