SLAM从入门到精通(被忽视的基础图像处理)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

工业上用激光slam的多,用视觉slam的少,这是大家都知道的常识。毕竟对于工业来说,健壮和稳定是我们必须要考虑的事情。但是图像slam在这过程当中其实也可以扮演十分重要的角色,比如说地面如果非常有特征的话,黄色路面或者绿色路面。这个时候,即使全局的slam完成不了,那么也可以实现局部道路的slam导航。

ros里面其实也谈到了opencv,它是一个用的比较多的开发库。但是很多时候,上面的demo都是比较割裂的,很难说这是用于实际场景的代码。比如说,平时比较常用的二维码导航,上面就谈的不是很多。所以,对于这些知识点,我们都可以自己编写opencv程序来解决。

目前在ubuntu20.04上面,ros noetic版本自带的是opencv 4版本了,这个需要注意下了。另外,实际图像开发的时候,光源很重要。如果光源不满足条件,可以自己编写代码,比如利用最大灰度值做pwm的pid反馈参考量,这都是有实际意义的。

1、编写测试代码

这段代码来自于网上。主要还是为了说明opencv如何编写代码,有兴趣的同学可以去买一本opencv的书来进行学习和研究。

复制代码
#include <opencv4/opencv2/highgui/highgui.hpp>
#include <opencv4/opencv2/imgcodecs/legacy/constants_c.h>
#include <iostream>
using namespace std;

int main( int argc, char** argv ) {
    cv::Mat image;
    image = cv::imread("test.jpg" , CV_LOAD_IMAGE_COLOR);	      
    if(! image.data ) {
        std::cout <<  "Could not open or find the image" << std::endl ;
	    return -1;
    }

    std::cout << "image wide: "<< image.cols << ",image high: " << image.rows << ",image channels: "<< image.channels() << std::endl;
    
    /* display image
    cv::namedWindow( "Display window", cv::WINDOW_AUTOSIZE );
    cv::imshow( "Display window", image );		    
    cv::waitKey(0);
    */
    
    size_t y,x;// y is row, x is col
    int c;     // c is channel
    y = x = 250;
    c = 2;
    
    // row_ptr is the head point of y row
    unsigned char *row_ptr = image.ptr<unsigned char>(y);
    
    // data_ptr points to pixel data
    unsigned char *data_ptr = &row_ptr[x * image.channels()]; 
    unsigned char data =  data_ptr[c];

    // use cv::Mat::at() to get the pixel value
    // unsigned char is not printable
    // std::cout << std::isprint(data)<<std::isprint(image.at<cv::Vec3b>(y,x)[c]) << std::endl;
    std::cout << "pixel value at y, x ,c"<<static_cast<unsigned>(image.at<cv::Vec3b>(y,x)[c]) << std::endl;
    return 0;
}

2、代码说明

代码的内容不复杂,主要就是打开一幅图片,然后获取指定点的像素信息。当然,这份代码只是起到抛砖引玉的作用,真正用起来,还需要和具体的场景关联起来。

3、编译方法

前面我们说过,ros noetic里面支持的是opencv 4,所以这里代码也是用opencv4的库进行编译的,输入如下所示,

复制代码
g++ test.cpp -o test `pkg-config --cflags --libs opencv4`

4、测试和调试

代码测试的过程中,还需要一张图片,我们不妨去网上搜索一下lena的图片。她也是数字图像处理中用的最多的一张图片,

这样程序和图片都准备好了,执行后不出意外的话,就可以看到这样的打印,

复制代码
shell$ ./test
image wide: 500,image high: 500,image channels: 3
pixel value at y, x ,c177

5、python3实现图像处理

实际生产中,一般是用python编写好算法之后,再转换成c/c++代码,这样效率要高很多。另外,不管是windows平台,还是linux平台,使用python都是很方便的。

复制代码
import cv2
 
def main():
    picture = cv2.imread('./test.jpg')
    cv2.imshow('lena', picture)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
 
if __name__ == '__main__':
    main()

运行的方法,也比较简单,直接输入python3 ./test.py即可。

相关推荐
茉莉玫瑰花茶11 小时前
LangGraph 入门教程:构建 AI 工作流 [ 案例三 ]
前端·人工智能·python
我有医保我先冲11 小时前
【无标题】
java·大数据·人工智能
染指111011 小时前
2.AI大模型-链式思考TOC让AI实现思考-优秀提示词设计技巧
大数据·数据库·人工智能
Daydream.V11 小时前
从零搭建 AI Agent:LLM Agent+Function Calling+Dify 本地部署 + Coze 实战全攻略
人工智能·langchain·ollama·functioncalling·大模型部署
数据智研11 小时前
【数据分享】中国第三产业统计年鉴(1991-2025)(1993-1994、2001-2005末出版)
大数据·人工智能·信息可视化·数据分析
HyperAI超神经11 小时前
在线教程丨单卡即可爆改,面壁智能等开源MiniCPM-V-4.6,1.3B端侧模型支持图像理解/视频理解/OCR/多轮多模态对话
人工智能·ai·ocr
科技测评-阿博11 小时前
律师案源开发指南:精准获客方法,附实操模板
大数据·人工智能
Wanderer X11 小时前
【入门】搜索
人工智能
TG_yunshuguoji11 小时前
云代理商:Hermes Agent如何通过技能沉淀降低长期算力消耗
人工智能·云计算·ai 智能体·hermes agent
WangN211 小时前
【SONIC】Isaac Lab 系统入门指南
人工智能·python·机器人·自动驾驶·仿真