【目标检测】旋转目标检测COCO格式标注转DOTAv1格式

news/2024/7/10 0:38:58 标签: 目标检测, 人工智能

DOTAv1数据集格式:

'imagesource':imagesource
'gsd':gsd
x1, y1, x2, y2, x3, y3, x4, y4, category, difficult
x1, y1, x2, y2, x3, y3, x4, y4, category, difficult
...

imagesource: 图片来源  
gsd: 分辨率
x1, y1, x2, y2, x3, y3, x4, y4:四边形的四个顶点的坐标 顶点按顺时针顺序排列,第一个起点为左上第一个点
category:实例类别
difficult:表示该实例是否难以检测(1表示困难,0表示不困难)

COCO转DOTA:

import json
import cv2
import numpy as np
import os

def calculate_rotated_bbox(poly):
    """将多边形坐标转换为旋转边界框"""
    contour = np.array(poly).reshape((-1, 1, 2)).astype(np.float32)
    rect = cv2.minAreaRect(contour)
    box = cv2.boxPoints(rect)
    return np.int0(box)

def coco_to_dota(coco_annotation_path, dota_annotation_folder, imagesource="Unknown", gsd="Unknown"):
    """将COCO格式的标注转换为DOTA格式,包括imagesource和gsd信息"""
    # 类别ID到名称的映射
    category_map = {
        1: 'Class1',
        2: 'Class2',
    }

    # 确保输出目录存在
    if not os.path.exists(dota_annotation_folder):
        os.makedirs(dota_annotation_folder)

    # 读取COCO格式的JSON文件
    with open(coco_annotation_path, 'r') as f:
        coco_data = json.load(f)

    # 遍历每个图像的标注
    for image in coco_data['images']:
        image_id = image['id']
        image_filename = image['file_name']
        dota_filename = os.path.splitext(image_filename)[0] + '.txt'  # 去掉原始扩展名,添加.txt
        dota_filepath = os.path.join(dota_annotation_folder, dota_filename)

        with open(dota_filepath, 'w') as dota_file:
            # 写入imagesource和gsd信息
            # dota_file.write(f"'imagesource':{imagesource}\n'gsd':{gsd}\n")

            # 找到当前图像的所有标注
            for annotation in filter(lambda x: x['image_id'] == image_id, coco_data['annotations']):
                if 'segmentation' in annotation:
                    for seg in annotation['segmentation']:
                        if type(seg[0]) is list:  # 检查是否是多边形格式
                            seg = seg[0]
                        box = calculate_rotated_bbox(seg)
                        # 从映射中获取类别名称
                        category_name = category_map.get(annotation['category_id'], 'Unknown')
                        # 格式化DOTA标注
                        box_str = ' '.join(map(str, box.flatten().tolist()))
                        dota_annotation = f"{box_str} {category_name} 0\n"
                        dota_file.write(dota_annotation)


# 调用函数,转换COCO到DOTA
coco_annotation_path = 'instances.json'
dota_annotation_folder = 'dota'
coco_to_dota(coco_annotation_path, dota_annotation_folder)

标注可视化:

import cv2
import numpy as np
import os


def draw_rotated_box(img, box, label):
    """在图像上绘制旋转的边界框和标签。"""
    points = np.int0(box)
    cv2.drawContours(img, [points], 0, (0, 255, 0), 2)  # 绘制旋转框
    cv2.putText(img, label, tuple(points[0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 1)  # 添加文本标签


def visualize_dota_annotations(image_folder, annotation_folder, output_folder):
    """批量处理图像和DOTA标注文件,绘制旋转边界框和标签"""
    # 确保输出文件夹存在
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 遍历图像文件
    for img_filename in os.listdir(image_folder):
        img_path = os.path.join(image_folder, img_filename)
        if os.path.isfile(img_path) and img_filename.endswith(('.jpg', '.png')):
            annot_filename = os.path.splitext(img_filename)[0] + '.txt'
            annot_path = os.path.join(annotation_folder, annot_filename)
            output_img_path = os.path.join(output_folder, img_filename)

            # 读取图像
            img = cv2.imread(img_path)
            if img is None:
                continue  # 如果图像文件无法读取,则跳过

            # 处理对应的标注文件
            if os.path.isfile(annot_path):
                with open(annot_path, 'r') as f:
                    lines = f.readlines()
                    # 跳过文件开头的imagesource和gsd信息
                    for line in lines[2:]:  # 开始处理从第三行起的标注信息
                        parts = line.strip().split(' ')
                        if len(parts) < 9:  # 跳过非标准行
                            continue
                        box = np.array([float(part) for part in parts[:8]]).reshape(4, 2)
                        label = parts[8]  # 标签
                        draw_rotated_box(img, box, label)

            # 保存绘制了旋转边界框的图像
            cv2.imwrite(output_img_path, img)

# 路径配置
image_folder = 'images'
annotation_folder = 'dota'
output_folder = 'visual'

visualize_dota_annotations(image_folder, annotation_folder, output_folder)


http://www.niftyadmin.cn/n/5411405.html

相关文章

Rust有没有信号量机制,在缓存有数据的时候才允许等待的进程取数据?

Rust提供了信号量&#xff08;Semaphore&#xff09;机制&#xff0c;尽管它并没有直接提供类似于某些其他编程语言中的Semaphore类。然而&#xff0c;你可以使用std::sync::Mutex和std::sync::Condvar&#xff08;条件变量&#xff09;组合来实现信号量的功能。 信号量通常用…

geoserver+mapbox-gl 加载图层组矢量切片地图服务

添加新的图层组 在图层组中选择添加图层&#xff0c;将上篇文章中的矢量切片图层添加进来 同样切换到tile caching&#xff0c;选择切片格式为mapbox矢量切片 点击保存&#xff0c;回到首页&#xff0c;通过tms进入到tms地图服务地址 加载通过图层组发布的矢量切片服务 涉及到…

Java开发工程师面试题(业务功能)

一、订单超时未支付自动关闭的几种实现方式。 定时任务扫描&#xff1a;在订单创建时&#xff0c;为订单创建一个定时任务&#xff0c;并设置一个超时时间。后端服务器会定期检查任务的创建时间是否超过了超时时间。如果是&#xff0c;则将订单设置为关闭状态。这种方案需要后…

【国产MCU】-CH32V307-SysTick中断与延时功能实现

SysTick中断与延时功能实现 文章目录 SysTick中断与延时功能实现1、SysTick介绍2、SysTick中断使用3、SysTick实现微秒和毫秒延时功能CH32V307的RISC-V内核控制器自带的一个64位可选递增或递减的计数器,用于产生SYSTICK异常(异常号:15),可专用于实时操作系统,为系统提供“…

如何通过隐藏服务器真实IP来防御DDOS攻击

我们知道&#xff0c;服务器对外提供服务&#xff0c;基本上都是放置在公网上的。所以说服务器放置在公网上会面临很多攻击&#xff0c;如果不做好必要的防护措施&#xff0c;服务器被人攻击只是时间上的问题。 而我们面临的众多攻击中&#xff0c;DDoS攻击是最常见同时也是影响…

Unity3d C#实现文件(json、txt、xml等)加密、解密和加载(信息脱敏)功能实现(含源码工程)

前言 在Unity3d工程中经常有需要将一些文件放到本地项目中&#xff0c;诸如json、txt、csv和xml等文件需要放到StreamingAssets和Resources文件夹目录下&#xff0c;在程序发布后这些文件基本是对用户可见的状态&#xff0c;造成信息泄露&#xff0c;甚至有不法分子会利用这些…

03-grafana的下拉列表选项制作-grafana的变量

一、准备环境 为了实现下拉列表筛选的样例&#xff0c;我们监控两个linux节点&#xff1b; 目前&#xff0c;我们已经有了一个节点了&#xff0c;再添加一个&#xff1b; 二、grafana的仪表盘变量 如果想给仪表盘自定义下拉列表&#xff0c;那么&#xff0c;需要设置变量&#…

基于树莓派4B的智能家居系统设计

目录 一、项目介绍 二、前期准备 1.硬件准备 2.开发环境 三、C语言的简单工厂模式 1.工厂模式介绍 2.类和对象 3.工厂模式的优缺点 四、树莓派的基本使用 1.树莓派刷机和登入 2.树莓派WiringPi库介绍 3.树莓派 CSI 摄像头配置 4.树莓派与其他模块接线 五、智能家居…