【深度学习】修改源码以实现预测整个文件夹和保存txt文件(自用笔记

此笔记是为记录一下,为解决某模型只能预测一张图,并且不能生成相应的txt文件的问题


python 复制代码
def main():
    if os.path.isdir(directory_path):
        files = os.listdir(directory_path)
        for file in files:
            file_path = os.path.join(directory_path, file)
            if os.path.isfile(file_path):
                try:
                    origin_img = np.asarray(Image.open(file_path).convert('RGB'))
                    bboxes = [[1, 2, 3, 4], [5, 6, 7, 8]]
                    scores = [100, 99]
                    cls_inds = [0, 1]
                    vis_res = visualize(origin_img, bboxes, scores, cls_inds, conf=0.6, save_name=os.path.basename(file_path), save_result=True)
                    print(os.path.basename(file_path))
                except Exception as e:
                    print(f"读取文件 {file} 时发生错误:{e}")
    else:
        print(f"{directory_path} 不是一个目录。")
python 复制代码
def visualize(image, bboxes, scores, cls_inds, conf, save_name='vis.jpg', save_result=True):
    # 写入txt文件 一行一行的写入
    vis_img, labels = vis(image, bboxes, scores, cls_inds, conf, class_names)
    img_name = save_name.split('.')[0]
    txt_name = img_name + '.txt'
    if save_result:  # 把已经框好的照片写进去
        save_path = os.path.join(output_dir, save_name)
        print(f"save visualization results at {save_path}")
        save_txt_path = os.path.join(output_dir, txt_name)
        for i in range(len(labels)):
            label = labels[i]
            with open(save_txt_path, 'a') as fp:
                fp.write(label)

        # cv2.imwrite(save_path, vis_img[:, :, ::-1])
    return vis_img
python 复制代码
def vis(img, boxes, scores, cls_ids, conf=0.5, class_names=None):
    # 返回labels数组
    labels = []
    for i in range(len(boxes)):
        box = boxes[i]
        cls_id = int(cls_ids[i])
        score = scores[i]
        if score < conf:
            continue
        x0 = int(box[0])
        y0 = int(box[1])
        x1 = int(box[2])
        y1 = int(box[3])
        x2 = float(box[0])
        y2 = float(box[1])
        x3 = float(box[2])
        y3 = float(box[3])
        score_txt = float(score)

        label = str(x2)+' '+str(y2)+' '+str(x3)+' '+str(y3)+' '+str(score)+' '+str(cls_id)+'\n'
        labels.append(label)
    return img, labels
相关推荐
Fansv5874 分钟前
深度学习-7.超参数优化
人工智能·深度学习
松果财经38 分钟前
蓝思科技赋能灵伴科技:AI眼镜产能与供应链双升级
人工智能·科技
东方芷兰1 小时前
算法笔记 04 —— 算法初步(下)
c++·笔记·算法
青松@FasterAI1 小时前
【NLP算法面经】本科双非,头条+腾讯 NLP 详细面经(★附面题整理★)
人工智能·算法·自然语言处理
萧鼎2 小时前
智能自动化新纪元:AI与UiPath RPA的协同应用场景与技术实践
人工智能·ui·rpa
果冻人工智能2 小时前
去中心化 AI:赋权还是混乱?
人工智能·深度学习·机器学习·架构·去中心化·区块链·ai员工
伊犁纯流莱2 小时前
Normalizing flow 流模型 | CS236深度生成模型Lec8学习笔记
深度学习
Landy_Jay3 小时前
深度学习:基于Qwen复现DeepSeek R1的推理能力
人工智能·深度学习
EterNity_TiMe_3 小时前
【人工智能】蓝耘智算平台盛大发布DeepSeek满血版:开创AI推理体验新纪元
人工智能·python·机器学习·deepseek
RFID舜识物联网3 小时前
RFID测温技术:电力设备安全监测的新利器
网络·人工智能·嵌入式硬件·物联网·安全