【深度学习】修改源码以实现预测整个文件夹和保存txt文件(自用笔记

此笔记是为记录一下,为解决某模型只能预测一张图,并且不能生成相应的txt文件的问题


python 复制代码
def main():
    if os.path.isdir(directory_path):
        files = os.listdir(directory_path)
        for file in files:
            file_path = os.path.join(directory_path, file)
            if os.path.isfile(file_path):
                try:
                    origin_img = np.asarray(Image.open(file_path).convert('RGB'))
                    bboxes = [[1, 2, 3, 4], [5, 6, 7, 8]]
                    scores = [100, 99]
                    cls_inds = [0, 1]
                    vis_res = visualize(origin_img, bboxes, scores, cls_inds, conf=0.6, save_name=os.path.basename(file_path), save_result=True)
                    print(os.path.basename(file_path))
                except Exception as e:
                    print(f"读取文件 {file} 时发生错误:{e}")
    else:
        print(f"{directory_path} 不是一个目录。")
python 复制代码
def visualize(image, bboxes, scores, cls_inds, conf, save_name='vis.jpg', save_result=True):
    # 写入txt文件 一行一行的写入
    vis_img, labels = vis(image, bboxes, scores, cls_inds, conf, class_names)
    img_name = save_name.split('.')[0]
    txt_name = img_name + '.txt'
    if save_result:  # 把已经框好的照片写进去
        save_path = os.path.join(output_dir, save_name)
        print(f"save visualization results at {save_path}")
        save_txt_path = os.path.join(output_dir, txt_name)
        for i in range(len(labels)):
            label = labels[i]
            with open(save_txt_path, 'a') as fp:
                fp.write(label)

        # cv2.imwrite(save_path, vis_img[:, :, ::-1])
    return vis_img
python 复制代码
def vis(img, boxes, scores, cls_ids, conf=0.5, class_names=None):
    # 返回labels数组
    labels = []
    for i in range(len(boxes)):
        box = boxes[i]
        cls_id = int(cls_ids[i])
        score = scores[i]
        if score < conf:
            continue
        x0 = int(box[0])
        y0 = int(box[1])
        x1 = int(box[2])
        y1 = int(box[3])
        x2 = float(box[0])
        y2 = float(box[1])
        x3 = float(box[2])
        y3 = float(box[3])
        score_txt = float(score)

        label = str(x2)+' '+str(y2)+' '+str(x3)+' '+str(y3)+' '+str(score)+' '+str(cls_id)+'\n'
        labels.append(label)
    return img, labels
相关推荐
阿里云大数据AI技术几秒前
【AAAI2026】阿里云人工智能平台PAI视频编辑算法论文入选
人工智能
玄同7652 分钟前
我的 Trae Skill 实践|使用 UV 工具一键搭建 Python 项目开发环境
开发语言·人工智能·python·langchain·uv·trae·vibe coding
苍何24 分钟前
腾讯重磅开源!混元图像 3.0 图生图真香!
人工智能
千里马也想飞27 分钟前
人工智能在医疗领域的应用与研究论文写作实操:AI辅助快速完成框架+正文创作
人工智能
Rorsion32 分钟前
PyTorch实现二分类(单特征输出+单层神经网络)
人工智能·pytorch·分类
勾股导航39 分钟前
K-means
人工智能·机器学习·kmeans
liliangcsdn40 分钟前
Diff2Flow中扩散和流匹配的对齐探索
人工智能
SmartBrain1 小时前
战略洞察:以AI为代表的第四次工业革命
人工智能·语言模型·aigc
一个处女座的程序猿1 小时前
AI之Agent之VibeCoding:《Vibe Coding Kills Open Source》翻译与解读
人工智能·开源·vibecoding·氛围编程
Jay Kay1 小时前
GVPO:Group Variance Policy Optimization
人工智能·算法·机器学习