STL之Vector&Map&List针对erase方法踩坑笔记

前沿

如下总结的三种容器,开头都会涉及当前容器的特点,再者就本次针对erase方法的使用避坑总结。

一.Vector

vector关联关联容器,存储内存是连续,且特点支持快速访问,但是插入和删除效率比较地(需要找查找和移动)。另外在删除元素是,需注意迭代器的失效情况。

erase避坑,示例代码:

cpp 复制代码
int main(){

    //vector
    std::vector<std::string> v;
    v.push_back("one");
    v.push_back("two");
    v.push_back("three");
    v.push_back("three");
    v.push_back("three");
    v.push_back("three");
    v.push_back("four");
    v.push_back("five");

    std::cout<< "del before size - " << v.size() << std::endl;

    for(std::vector<std::string>::iterator it = v.begin(); it != v.end(); ++it)
    {
        std::cout << *it << std::endl;
    }
    std::cout << "------------------" << std::endl;
    for(std::vector<std::string>::iterator it = v.begin(); it != v.end(); ++it)
    {
        if(*it == "three")
        {
            v.erase(it);
        }
    }
    std::cout<< "del after size - " << v.size() << std::endl;
    for(std::vector<std::string>::iterator it = v.begin(); it != v.end(); ++it)
    {
        std::cout << *it << std::endl;
    }
    return 0;
}

输出结果:

cpp 复制代码
[root@bogon fuxi_csdn]# ./a.out 
del before size - 8
one
two
three
three
three
three
four
five
------------------
del after size - 6
one
two
three
three
four
five
[root@bogon fuxi_csdn]#

上述删除前&删除后结果发现未能实现删除全部的three元素,这是何原因呢?请看下文,经查询发现vecotr容器的erase方法实现有关。当vector容器适用erase方法删除元素时,上述代码中通过v.erase(it),传入的是一个迭代器元素,通过查阅官方网站查看erase的定义,详情如下:

c++98:

上述这段话含义是,从容器中移除单个元素或者从迭代范围内移除元素,并且通过移除元素的操作,有效的减少了容器的大小。因为vector容器底层适用数组作为底层存储结构,所以在移除末尾以外的其他元素,容器内的元素位置会进行元素移动且重新分配位置,这是一个很低效的操作方法。

通过上述文档我们可以知道,vector容器在删除某个元素时(末尾除外),剩余的元素会进行移动,后面的元素会将前面剔除的元素的位置覆盖。如此以来上述输出代码的问题就得意显现出来。那么到底是怎么移动导致的上述问题的呢?看如下图解:

通过上图所示,当找到一个three之后,erase函数内部将当前位置元素剔除掉,在将剩余的元素向前移动。此时it的位置没有发生改变仍旧在原来的位置上,网上说返回了删除元素下一个元素迭代器,概念等价如此,但是实际上原因是因为后面的元素移动了,所以先前删除元素的it此时就指向了移动后的元素,也算是下一个元素的迭代器。在erase的源码:

cpp 复制代码
#define _GLIBCXX_MOVE3(_Tp, _Up, _Vp) std::move(_Tp, _Up, _Vp)
template<typename _Tp, typename _Alloc>
    typename vector<_Tp, _Alloc>::iterator
    vector<_Tp, _Alloc>::
    erase(iterator __position)
    {
      if (__position + 1 != end())
	_GLIBCXX_MOVE3(__position + 1, end(), __position);
      --this->_M_impl._M_finish;
      _Alloc_traits::destroy(this->_M_impl, this->_M_impl._M_finish);
      return __position;
    }

上述代码,将__position+ 1之后到结尾元素进行移动,在进行处理,最后return位置,仍旧是原来的it位置,指向的就是删除后下一个元素。通过以上图解+代码中的循环(tmp = it ++ => it++),就能解释输出内容为什么会如此了!不仅如此,如上代码,元素为偶数,进行删除操作,不会报错,但是无法达成删除所有元素的处理。巧合迭代器不会越界。当为奇数个数,程序就会崩溃,出现段错误,当迭代去指向最后一个元素时,被删除时,在进行++操作,越界,导致程序崩溃,可以将上述代码删除three修改成删除five即可验证。

例如修改上述代码如下&输出结果:

cpp 复制代码
  for(std::vector<std::string>::iterator it = v.begin(); it != v.end(); ++it)
    {
        if(*it == "five")
        {
            v.erase(it);
        }
    }

输出:
[root@bogon fuxi_csdn]# ./a.out 
del before size - 8
one
two
three
three
three
three
four
five
------------------
Segmentation fault (core dumped)

删除最有一个元素,因删除后当前的it失效,在进行++it就会越界,从而导致程序崩溃。

知晓了上述代码产生的原因,所以针对上述代码优化修改:

cpp 复制代码
 for(std::vector<std::string>::iterator it = v.begin(); it != v.end(); )
 {
        if(*it == "three")
        {
            it = v.erase(it);
        }else{
            ++it;
        }
 }

另外也可以通过std::remove配合批量删除重复的元素:

cpp 复制代码
 v.erase(std::remove(v.begin(), v.end(), "three"), v.end());// 剔除范围内所有three

上述方式中remove方法先将需要非目标元素全部移动到前面,剩余的局势要删除的元素,最后返回一个迭代器,再通过erase范围性质删除目标元素。源代码如下:std::remove:

cpp 复制代码
 template<typename _ForwardIterator, typename _Tp>
    _ForwardIterator
    remove(_ForwardIterator __first, _ForwardIterator __last,
	   const _Tp& __value)
    {
      // concept requirements
      __glibcxx_function_requires(_Mutable_ForwardIteratorConcept<
				  _ForwardIterator>)
      __glibcxx_function_requires(_EqualOpConcept<
	    typename iterator_traits<_ForwardIterator>::value_type, _Tp>)
      __glibcxx_requires_valid_range(__first, __last);

    // 找到目标元素的第一个位置
      __first = _GLIBCXX_STD_A::find(__first, __last, __value); 
      if(__first == __last)
        return __first;
      _ForwardIterator __result = __first;
      ++__first;
      for(; __first != __last; ++__first)
        if(!(*__first == __value))
          {
            *__result = _GLIBCXX_MOVE(*__first); // 将非目标元素前移动
            ++__result;
          }
      return __result;
    }

代码中先找找到范围内的目标元素的第一个位置,然后利用__result位置为非目标元素的移动存储位置,当元素查找完之后,返回最终的__result位置,那么erase(__result,v.end()),就清理的是所有要删除的目标元素。

二.Map

Map是一种哈希表结构形式的容器,其底层采用红黑树作为存储结构具有高效的增删查,另外还具备自动排序(属于自定义类型可以指定排序方法,可查看本博的C++之map踩坑记录博文)。实际使用中非常便利,为应用层开发提供高效的开发便利。本次主要讨论的是map容器适用erase时所避的坑,避免实际使用时出过错导致一些列问题。

erase避坑,示例代码:

cpp 复制代码
#include <iostream>
#include <map>
#include <vector>
 
 
int main()
{
    std::map<int, std::string> m;
    m.insert(std::make_pair(1, "one"));
    m.insert(std::make_pair(2, "two"));
    m.insert(std::make_pair(3, "three"));
    m.insert(std::make_pair(4, "four"));
    m.insert(std::make_pair(5, "five"));
 
    std::cout<< "before erase" << std::endl;
    for (std::map<int, std::string>::iterator it = m.begin(); it != m.end(); ++it)
    {
        std::cout << it->first << " " << it->second << std::endl;
    }
 
    for(std::map<int, std::string>::iterator it = m.begin(); it != m.end();)
    {
        if(it->first == 3)
        {
            //m.erase(it); //该处会崩溃
            m.erase(it++); // 正确用法
        }else
        {
            ++it;
        }
    }
 
    std::cout << "After erase" << std::endl;
    for (std::map<int, std::string>::iterator it = m.begin(); it != m.end(); ++it)
    {
        std::cout << it->first << " " << it->second << std::endl;
    }
    return 0;
}

崩溃输出:

cpp 复制代码
before erase
1 one
2 two
3 three
4 four
5 five
ret it = 3
Segmentation fault (core dumped)

正常输出:

cpp 复制代码
root@ubu-virtual-machine:~# ./a.out 
before erase
1 one
2 two
3 three
4 four
5 five
ret it = 4
After erase
1 one
2 two
4 four
5 five

上述代码在c++98跟c++11对应的删除有偏差:

98版本的erase都是返回的整形,如果按照上代码实现,出现崩溃问题,后经过查询发现stl内部erase的实现,当调用时,会拷贝一份当前迭代器,之后如果没将it移动,那么当前的it就会失效,从而导致程序崩溃异常。正确的用法通过v.erase(it++)联合++it。在erase(it++)调用内部实现流程时,erase临时拷贝一份当前迭代器,因it++作为参数,其优先级比函数调用优先级高,所以erase流程为先拷贝,在走it++,此时迭代器已经就走到删除元素的下一个位置,如此一来,即可正常遍历运行。

上述途中c++11中优化了erase方法,剔除元素后返回删除元素的下一个元素的迭代器。使用时需要注意方式:

cpp 复制代码
for(std::map<int, std::string>::iterator it = m.begin(); it != m.end();)
    {
        if(it->second == "three")
        {
            it = m.erase(it);// or m.erase(it++);
            std::cout<<"ret it = "<<it->first<<std::endl;
        }else{
            ++it;
        }
    }

针对上述c++11看下优化后的erase源码:

cpp 复制代码
  _GLIBCXX_ABI_TAG_CXX11
      iterator
      erase(iterator __position)
      { return _M_t.erase(__position); }

    _GLIBCXX_ABI_TAG_CXX11
      iterator
      erase(const_iterator __position)
      {
	const_iterator __result = __position; // 拷贝
	++__result;// 指向下个元素
	_M_erase_aux(__position); // 销毁要删除的元素
	return __result._M_const_cast();// 返回下个元素
      }

上述的erase方法实现,先拷贝,定义下个元素迭代器,销毁目标元素,返回删除的下个元素。

三.List

List是一个双向链表容器,它有一些特定的优点和缺点,适用于不同的场景。其优点高效的插入和删除操作,双向链表,支持双向遍历,内存碎片化较小,不需要频繁的内存重新分配。但是也存在一些缺点,较高的内存开销,如额外的指针内存。不支持随机访问,关联容器,因其链结构,迭代器每次都要指针跳转,性能不如直接访问快。

erase避坑,示例代码:

cpp 复制代码
int main()
{
    std::list<int> l;
    l.push_back(1);
    l.push_back(2);
    l.push_back(3);
    std::cout<< "before erase" << std::endl;
    for(std::list<int>::iterator it = l.begin(); it != l.end(); ++it)
    {
        std::cout << *it << std::endl;
    }

    for(std::list<int>::iterator it = l.begin(); it != l.end();++it)
    {
        if(*it == 2)
        {
            l.erase(it); // 会崩溃
        }
    }

    std::cout<< "after erase" << std::endl;
    for(std::list<int>::iterator it = l.begin(); it != l.end(); ++it)
    {
        std::cout << *it << std::endl;
    }
    return 0;
}

输出:

cpp 复制代码
[root@bogon fuxi_csdn]# ./a.out 
before erase
1
2
3
Segmentation fault (core dumped)

如上出现段错误。何故? 查看list内部实现的erase,跟前面vector跟map的erase相似,都是剔除当前元素后返回下一个元素的迭代器,源码如下:

cpp 复制代码
 template<typename _Tp, typename _Alloc>
    typename list<_Tp, _Alloc>::iterator
    list<_Tp, _Alloc>::
    erase(iterator __position)
    {
      iterator __ret = iterator(__position._M_node->_M_next);
      _M_erase(__position);
      return __ret;
    }

代码中先进行next操作,然后销毁当前要删除元素,return返回__ret表示下个元素位置。所以循环中使用erase需要注意方式同map方式一样即可,跟改为:

cpp 复制代码
 for(std::list<int>::iterator it = l.begin(); it != l.end();)
 {
    if(*it == 2)
    {
        l.erase(it++);
    }else   {
        ++it;
    }
 }

总结,stl库提拱了方便的存储结构供给我们日常使用,在使用时需要注意潜在的风险问题,避免实际应用时出现不可预期的问题,以上就是vector & map & list 容器的erase方法在循环中使用需要注意的坑点,当然还有其他容器适用删除方法结合实际情况注意!!!

相关推荐
zhxueverme18 分钟前
操作系统八股文学习笔记
笔记·学习
广东数字化转型41 分钟前
FFmpeg开发笔记(七)欧拉系统编译安装FFmpeg
笔记·ffmpeg
垂杨有暮鸦⊙_⊙1 小时前
有限元分析学习——Anasys Workbanch第一阶段笔记(9)带孔矩形板与L型支架案例的对称平面处理方案
笔记·学习·有限元分析
梳子烟YAN2 小时前
UML系列之Rational Rose笔记八:类图
笔记·uml
siy23333 小时前
[c语言日寄]c语言也有“回”字的多种写法——整数交换的三种方式
c语言·开发语言·笔记·学习·算法
敲敲敲-敲代码6 小时前
【机器学习】神经网络(BP算法)含具体计算过程
人工智能·笔记·神经网络·机器学习
sealaugh328 小时前
aws(学习笔记第二十四课) 使用sam开发step functions
笔记·学习·aws
明天好,会的10 小时前
代码的形状:重构的方向
笔记·其他
惟长堤一痕10 小时前
黑马linux入门笔记(01)初始Linux Linux基础命令 用户和权限 实用操作
linux·运维·笔记