DataWhale夏令营:Task2:建模方案解读与进阶

glob库的要点

glob库主要是方便查找搜索文件而生的,os库主要用来实现文件的基础操作,shutil主要用来实现文件的复制移动操作。

1. 3个通配符

* : 匹配0个或多个字符
**: 匹配所有文件,目录,子目录和子目录里的文件,常搭配recursive=True使用如glob.glob("**/*.txt",recursive=True)返回的就是递归搜索当前目录下的所有的txt文件
?: 匹配一个字符;
[]:匹配指定范围内的字符,如[0-9]匹配数字,[a-z]匹配小写字母

2. 3个函数

  • glob.glob():返回符合匹配条件的所有文件的路径list
  • glob.iglob(): i指的是iterator,返回一个迭代器对象,对于大型目录,一次性获取所有匹配的文件列表可能会占用大量内存。在这种情况下,可以使用iglob()函数来进行迭代获取
  • glob.escape():escape可以忽略所有特殊字符-----星号,问号,中括号,用处不大

应用: 在上节YOLO制作数据集时,使用glob进行搜索所有的.mp4文件和.json文件,然后通过sort进行升序排序,通过排序然后结合zip()方法可以轻松将mp4和anno对应起来。

python 复制代码
train_annos = glob.glob('训练集(有标注第一批)/标注/*.json') #返回所的标注文件路径的list
train_videos = glob.glob('训练集(有标注第一批)/视频/*.mp4') #返回所有的视频路径的list
train_annos.sort(); train_videos.sort()

category_labels = ["非机动车违停", "机动车违停", "垃圾桶满溢", "违法经营"]

for anno_path, video_path in zip(train_annos[:5], train_videos[:5]):
    #TODO:保存帧以及对应的标注

Warning库学习

忽略所欲ignore类型的警告信息。

python 复制代码
import warnings 
warnings.filterwarnings('ignore')

数据类型转换

1. json转pandas的DataFrame

如下,json->dataFrame

python 复制代码
anno_df = pd.read_json(anno_path)

2. torch的tensor转为numpy的Ndarray类型

通过.cpu.numpy()将tensor转为Ndarray类型

python 复制代码
       xyxy = boxes.xyxy.data.cpu().numpy().round()
        cls = boxes.cls.data.cpu().numpy().round()
        conf = boxes.conf.data.cpu().numpy()
python 复制代码
        xyxy = boxes.xyxy.data.cpu().numpy().round()
        cls = boxes.cls.data.cpu().numpy().round()
        conf = boxes.conf.data.cpu().numpy()
相关推荐
hef28838 分钟前
如何生成特定SQL的AWR报告_@awrsqrpt.sql深度剖析单条语句性能
jvm·数据库·python
小程故事多_8039 分钟前
Agent+Milvus,告别静态知识库,打造具备动态记忆的智能AI助手
人工智能·深度学习·ai编程·milvus
code_pgf1 小时前
Llama 3详解
人工智能·llama
ComputerInBook1 小时前
数字图像处理(4版)——第 3 章——(图像的)强度变换和空间滤波(Rafael C.Gonzalez&Richard E. Woods)
图像处理·人工智能·计算机视觉·强度变换和空间滤波
爱写代码的小朋友1 小时前
生成式人工智能(AIGC)在开放式教育问答系统中的知识表征与推理机制研究
人工智能·aigc
Jinkxs1 小时前
从语法纠错到项目重构:Python+Copilot 的全流程开发效率提升指南
python·重构·copilot
技术专家1 小时前
Stable Diffusion系列的详细讨论 / Detailed Discussion of the Stable Diffusion Series
人工智能·python·算法·推荐算法·1024程序员节
m0_488913011 小时前
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!
人工智能·学习·机器学习·大模型·产品经理·llama·uml
helpme流水1 小时前
LLaMA Factory 从入门到精通,一篇讲完
人工智能·ai·语言模型·llama
段一凡-华北理工大学1 小时前
【大模型+知识图谱+工业智能体技术架构】~系列文章01:快速了解与初学入门!!!
人工智能·python·架构·知识图谱·工业智能体