SLAM从入门到精通(被忽视的基础图像处理)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

工业上用激光slam的多,用视觉slam的少,这是大家都知道的常识。毕竟对于工业来说,健壮和稳定是我们必须要考虑的事情。但是图像slam在这过程当中其实也可以扮演十分重要的角色,比如说地面如果非常有特征的话,黄色路面或者绿色路面。这个时候,即使全局的slam完成不了,那么也可以实现局部道路的slam导航。

ros里面其实也谈到了opencv,它是一个用的比较多的开发库。但是很多时候,上面的demo都是比较割裂的,很难说这是用于实际场景的代码。比如说,平时比较常用的二维码导航,上面就谈的不是很多。所以,对于这些知识点,我们都可以自己编写opencv程序来解决。

目前在ubuntu20.04上面,ros noetic版本自带的是opencv 4版本了,这个需要注意下了。另外,实际图像开发的时候,光源很重要。如果光源不满足条件,可以自己编写代码,比如利用最大灰度值做pwm的pid反馈参考量,这都是有实际意义的。

1、编写测试代码

这段代码来自于网上。主要还是为了说明opencv如何编写代码,有兴趣的同学可以去买一本opencv的书来进行学习和研究。

#include <opencv4/opencv2/highgui/highgui.hpp>
#include <opencv4/opencv2/imgcodecs/legacy/constants_c.h>
#include <iostream>
using namespace std;

int main( int argc, char** argv ) {
    cv::Mat image;
    image = cv::imread("test.jpg" , CV_LOAD_IMAGE_COLOR);	      
    if(! image.data ) {
        std::cout <<  "Could not open or find the image" << std::endl ;
	    return -1;
    }

    std::cout << "image wide: "<< image.cols << ",image high: " << image.rows << ",image channels: "<< image.channels() << std::endl;
    
    /* display image
    cv::namedWindow( "Display window", cv::WINDOW_AUTOSIZE );
    cv::imshow( "Display window", image );		    
    cv::waitKey(0);
    */
    
    size_t y,x;// y is row, x is col
    int c;     // c is channel
    y = x = 250;
    c = 2;
    
    // row_ptr is the head point of y row
    unsigned char *row_ptr = image.ptr<unsigned char>(y);
    
    // data_ptr points to pixel data
    unsigned char *data_ptr = &row_ptr[x * image.channels()]; 
    unsigned char data =  data_ptr[c];

    // use cv::Mat::at() to get the pixel value
    // unsigned char is not printable
    // std::cout << std::isprint(data)<<std::isprint(image.at<cv::Vec3b>(y,x)[c]) << std::endl;
    std::cout << "pixel value at y, x ,c"<<static_cast<unsigned>(image.at<cv::Vec3b>(y,x)[c]) << std::endl;
    return 0;
}

2、代码说明

代码的内容不复杂,主要就是打开一幅图片,然后获取指定点的像素信息。当然,这份代码只是起到抛砖引玉的作用,真正用起来,还需要和具体的场景关联起来。

3、编译方法

前面我们说过,ros noetic里面支持的是opencv 4,所以这里代码也是用opencv4的库进行编译的,输入如下所示,

g++ test.cpp -o test `pkg-config --cflags --libs opencv4`

4、测试和调试

代码测试的过程中,还需要一张图片,我们不妨去网上搜索一下lena的图片。她也是数字图像处理中用的最多的一张图片,

这样程序和图片都准备好了,执行后不出意外的话,就可以看到这样的打印,

shell$ ./test
image wide: 500,image high: 500,image channels: 3
pixel value at y, x ,c177

5、python3实现图像处理

实际生产中,一般是用python编写好算法之后,再转换成c/c++代码,这样效率要高很多。另外,不管是windows平台,还是linux平台,使用python都是很方便的。

import cv2
 
def main():
    picture = cv2.imread('./test.jpg')
    cv2.imshow('lena', picture)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
 
if __name__ == '__main__':
    main()

运行的方法,也比较简单,直接输入python3 ./test.py即可。

相关推荐
phoenix@Capricornus几秒前
矩阵的对角化&特征值分解
图像处理·线性代数·机器学习·矩阵
矢量赛奇19 分钟前
比ChatGPT更酷的AI工具
人工智能·ai·ai写作·视频
KuaFuAI27 分钟前
微软推出的AI无代码编程微应用平台GitHub Spark和国产AI原生无代码工具CodeFlying比到底咋样?
人工智能·github·aigc·ai编程·codeflying·github spark·自然语言开发软件
Make_magic37 分钟前
Git学习教程(更新中)
大数据·人工智能·git·elasticsearch·计算机视觉
shelly聊AI41 分钟前
语音识别原理:AI 是如何听懂人类声音的
人工智能·语音识别
源于花海44 分钟前
论文学习(四) | 基于数据驱动的锂离子电池健康状态估计和剩余使用寿命预测
论文阅读·人工智能·学习·论文笔记
雷龙发展:Leah1 小时前
离线语音识别自定义功能怎么用?
人工智能·音频·语音识别·信号处理·模块测试
4v1d1 小时前
边缘计算的学习
人工智能·学习·边缘计算
风之馨技术录1 小时前
智谱AI清影升级:引领AI视频进入音效新时代
人工智能·音视频
sniper_fandc1 小时前
深度学习基础—Seq2Seq模型
人工智能·深度学习