【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例（4）计算机视觉实际应用的特点

今天考试通过腾讯云人工智能从业者TCA级别的认证了！

还是很开心的，也看不到什么更好的方向，把一切能利用的时间用来学习，总是对的。

我把自己考试通过的学习笔记，都分享到这里了，另外还有一个比较全的思维脑图，我导出为JPG文件了。下载地址在这里：https://download.csdn.net/download/giszz/88868909

这个号码真好，88868909，我喜欢。

今天来总结计算机视觉实际应用的特点。

机器学习和深度学习，总算是搞明白了。今天考试，有好几个考点，都和这个有关系。

我理解的机器学习和深度学习的区别和联系

机器学习包含了深度学习；
深度学习主要是神经网络技术，这是Hinton这个大神，也就是人工智能之父，40年坚持的结果；
机器学习主要是特征工程的存在，有标注，也有标签，深度学习也需要数据标注，但是基本不需要做特征工程，也就是人工进行数据预处理、特征抽取、特征选择、特征这些工作；
深度学习只关注端到端，就是输入到输出的过程。其中也有多隐层神经网络等，在例子中的前馈神经网络，是最简单的神经网络模型；
机器学习由于有人的参与，所以可解释性很强，很多时候其实是为了特定任务而去做的，普适性不是很强，而深度学习，自己就能学习；
比如在图片分类中，机器学习要对图片进行特征工程，就是打标签，找出汽车车身的特征，而深度学习，直接用卷积算法就可以，滑动窗口，整个图片使用同一个权重，得到特征值，通过多层神经网络，学习哪个是汽车；
所以说机器学习是人工来提取特征，深度学习是从数据中创建新的特征；
机器学习要把复杂的工作，拆分为小的任务，逐个攻克；深度学习只关注端到端；
机器学习可以使用少量的数据，就能预测，而深度学习不行；
机器学习用低性能的计算机就能计算，而深度学习不行；

大概就是这样。

这是整个人工智能课程的核心。

当然，现在大家都普遍关心的，是sora，大模型LLM等，这肯定更有魅力的应用方向。大模型的出现，让人工智能真的是走向了新的高峰。

有人说，之前的人工智能，都是针对特定任务的，没有普适性。从大模型的出现来看，AGI也许已经在某个实验室里面实现了。

AGI是Artificial General Intelligence的首字母缩写，意为人工通用智能，也称为强人工智能。它指的是一种具有类似于人类全面智能的人工智能系统，可以处理不同领域的任务和问题，包括学习、推理、理解语言、感知环境、创造性思考等多种能力。与只能处理特定任务的狭窄人工智能（Narrow AI）不同，AGI旨在实现人类智能的全面模拟，并可以在不同场景和任务中表现出与人类相似的智能水平。

AGI的实现需要融合多个领域的知识和技术，包括机器学习、自然语言处理、计算机视觉、机器人技术等，同时也需要解决许多挑战和难题，如理解自然语言、掌握常识知识、具备有效的推理能力、能够感知和适应不同的环境等。

虽然AGI的实现仍面临着许多挑战和风险，如数据隐私、伦理道德等问题，但其对人类社会的影响和意义是巨大的。AGI可以帮助我们解决许多重大问题，如环境保护、医疗保健、安全保障等，同时也可以在各个领域中充当人类的助手、合作伙伴甚至是导师的角色，推动人类社会的进步和发展。

因此，AGI是当前人工智能领域的一个重要研究方向，也是未来人工智能发展的一个重要趋势。

言归正传，我们今天该学习机器视觉的一些普通特性了。

看，就是这些核心的内容。

很多朋友又要感觉没意思了，觉得没有关键技术名词，没有英文对照，没有示例代码等等。

其实，这些理念，是更重要的东西。

当前我们的任务，是要给玩具小车，加上自动识别标识牌的能力，我们暂且不管，边缘端的情况，我们来看这些要注意的事项。

样本具象化。图像是具体表现形式，除了主体外，还有大量的信息，如背景，光照等。
算法光线敏感性。侧光，面向光，背光，强光，暗光，都有影响，如果样本没有这些光线的图片，效果会欠佳。
理解硬件条件可能造成的图片效果偏差。带来色差、模糊、角度变化，样本如果没有这些资料，效果会欠佳。
客户理解的偏差。不理解光线影响，不能清晰的表达述求，都在需求梳理时摸清，否则影响交付。

前面都好说，有经验的项目人员，就能知道怎么来理解了。

最后的客户理解偏差，反而是我在实践中，感觉最头疼的。

客户认为，这不是很简单的事吗！

这要很久吗？！

这那个什么什么公司，不是早就做出来了吗？我们只是要做个一样的，甚至还更简答的而已！

好吧，客户不知道，除了识别这些标志，我们还要看，你这个场地，有什么特点，光线，硬件条件等等，包括这些小车搭载的摄像机，是多少分辨率！

延伸学习：

在计算机视觉的实际应用中，有许多关键的注意事项和经验，这些可以影响算法的准确性和效率。以下是一些主要的考虑因素：

图像质量：高质量的图像对于计算机视觉算法至关重要。图像的清晰度、分辨率和噪声水平都会影响算法的性能。因此，在实际应用中，需要确保使用的图像采集设备能够提供高质量的图像，或者采用图像增强技术来改善图像质量。
光照条件：光照条件是影响计算机视觉算法性能的另一个重要因素。不同的光照条件（如亮度、颜色温度、方向等）会对图像的外观产生显著影响，从而影响算法的准确性。为了解决这个问题，可以采用背景光照补偿技术、阴影去除技术等，以提升计算机视觉系统的鲁棒性。同时，在实际应用中，应尽量选择光线充足、均匀的环境，避免强光和暗光交替的情况出现。
数据集偏差：训练数据集的选择和准备对于计算机视觉算法的性能至关重要。如果训练数据集中存在偏差，比如样本不平衡、类别不均衡等，可能导致算法的泛化能力下降。为了解决这个问题，可以采用数据集采样均衡化、数据增强等技术，以改善模型的性能。同时，应注意数据的质量和多样性，确保数据集具有足够的标签和多样的样本。
镜头选择：在计算机视觉应用中，镜头的选择也会影响图像的质量和算法的准确性。不同的镜头有不同的焦距、光圈和景深等特性，这些特性会影响图像的清晰度和细节表现。因此，在实际应用中，应根据具体的需求选择合适的镜头。
避免畸变：在定位及高精度测量的系统中，畸变是一个需要特别注意的问题。畸变会导致图像中的物体形状发生扭曲，从而影响算法的准确性。为了解决这个问题，可以采用畸变校正技术，或者在系统标定时使用远心镜头等特殊镜头来减小畸变的影响。
恰当的照明与曝光：照明和曝光是影响图像质量的关键因素之一。如果照明不足或曝光过度，图像将不能提供足够的反差和细节信息，这将严重影响算法的准确性。因此，在实际应用中，需要选择适合的灯源和曝光设置，以确保图像具有足够的反差和细节信息。同时，还应注意系统周围环境的影响，避免其他光源对图像产生干扰。
算法选择与调优：对于不同的视觉任务，可能有多种不同的算法可供选择。在实际应用中，应根据任务的要求和数据集的特点选择合适的算法，并进行必要的调优。这包括选择合适的网络结构、调整超参数、使用正则化技术等手段来提高算法的准确性和效率。
实时性与性能平衡：在计算机视觉应用中，实时性和性能之间往往存在一定的权衡关系。为了提高算法的实时性，可能需要牺牲一部分性能；反之，为了提高性能，可能需要增加计算复杂度和时间成本。因此，在实际应用中，需要根据具体的需求和场景来平衡实时性和性能之间的关系。

总之，在计算机视觉的实际应用中，需要考虑多个方面的因素来确保算法的准确性和效率。通过注意以上提到的注意事项和经验，可以更好地应用计算机视觉技术来解决实际问题。