使用环境 |
无人机拍摄场景,图像具有尺度变化大、背景复杂且充满干扰物、视角灵活等特点 |
使用对象 |
无人机拍摄图像中行人、车辆的各类目标 |
使用目的 |
提高无人机拍摄图像的目标检测性能,准确预测目标的边界框和类别标签,以应对无人机图像的复杂特性 |
输入数据 |
4096×3072像素的RGB图像帧 |
输出数据 |
无人机拍摄图像中的行人、车辆目标的边界框和类别标签 |
硬件配置 |
- CPU:Intel Core i7-9700K,8核心,主频3.6GHz
- GPU:NVIDIA GeForce RTX 2080 Ti,具有较高的计算能力和显存容量,适合深度学习算法的加速运行
- 内存:16GB DDR4,频率3200MHz,为算法运行提供足够的内存空间
- 摄像头:工业级高分辨率相机,分辨率不低于2048×2048像素
- 硬盘:1TB SSD,用于存储大量的图像数据和模型文件,读写速度快
- 网卡:千兆以太网卡,用于数据传输和远程监控 |
样本获取 |
在实际交通环境中,从不同角度和光照条件下拍摄实时图像,共获取10000帧样本图像,其中2000帧用于训练集,8000帧用于测试集。 |
测试结果 |
在VisDrone2019测试集上,mAP达到39.41%,在VisDrone2021目标检测挑战赛中取得了优异的成绩 |
执行速度 |
检测速度约为30ms/次 |
资源消耗 |
CPU:平均占用率约70% GPU:平均占用率约80% 内存:平均占用率约60% |
源码类型 |
提供Python版本源码 |
文件大小 |
算法程序文件约30K,权重文件约220M。 |
相关备注 |
|