使用环境 |
在室内或室外环境中,对带有地理标签的图像数据库进行查询图像的检索,以估计查询图像的地理位置。适用于机器人导航、自动驾驶、增强现实等场景,如在城市街道、校园、工业园区等场景中,通过摄像头拍摄的图像进行位置识别。 |
使用对象 |
城市街道场景中的建筑物、地标、道路等;校园内的教学楼、图书馆等建筑;工业园区内的厂房、设备等。 |
使用目的 |
通过检索与查询图像最相似位置的图像,快速准确地确定查询图像的地理位置,为机器人导航、自动驾驶车辆的定位、增强现实应用中的场景识别等提供支持。 |
输入数据 |
可见光波段图像帧,图像分辨率512×512像素,RGB三通道。 |
输出数据 |
查询图像的地理位置坐标(经度和纬度)、与查询图像最相似的数据库图像的索引。 |
硬件配置 |
CPU:Intel Core i7-12700K,12核心24线程,主频3.6GHz。
GPU:NVIDIA GeForce RTX 3090,24GB GDDR6X显存。
内存:64GB DDR4 3200MHz。
摄像头:索尼Alpha 7 III,2420万像素全画幅传感器,支持4K视频拍摄。
传感器:无特定传感器。
接口:USB 3.2 Gen 2接口连接摄像头。
硬盘:1TB NVMe PCIe 4.0固态硬盘。
显卡:NVIDIA GeForce RTX 3090。
网卡:Intel Wi-Fi 6 AX201无线网卡。 |
样本获取 |
在多个城市街道、校园、工业园区等场景中,以不同角度拍摄图像,获取10000帧样本图像,其中2000帧用于训练集,8000帧用于测试集。 |
测试结果 |
对测试集8000个样本进行测试,失败10次,成功7990次,错误率0.125%,对应成功率99.875%。 |
执行速度 |
图像检索速度100ms/次,重排序速度50ms/次。 |
资源消耗 |
CPU:4核,计算占比平均约70%。 GPU:显存占用约18GB,计算占比平均约80%。 内存:使用占比约60%。 |
源码类型 |
本算法有Python版本源码,使用售卖方式三进行授权。 |
文件大小 |
算法程序文件65K,权重文件312M。 |
相关备注 |
|