使用环境 |
在自动驾驶和机器人领域,通过摄像头采集的RGB图像进行视觉位置识别。使用环境包括城市街道、郊区道路、自然景观等场景,这些场景存在光照变化、季节更替、视角变化 |
使用对象 |
自动驾驶车辆、机器人等需要进行视觉位置识别的设备,目标是识别车辆或机器人当前所处位置与数据库中已知位置的匹配情况。 |
使用目的 |
通过视觉位置识别技术,帮助自动驾驶车辆和机器人准确判断自身位置,实现精准导航和定位,提高自动驾驶和机器人的安全性和可靠性。 |
输入数据 |
RGB图像帧,分辨率640×480。 |
输出数据 |
位置匹配结果,包括与数据库中参考图像的匹配得分、匹配图像的索引 |
硬件配置 |
CPU:Intel Xeon Gold 6226R,具备强大的多线程处理能力。
GPU:NVIDIA GeForce RTX 3090,CUDA 11.0,显存容量24GB,用于加速深度学习模型的训练和推理。
内存:32GB DDR4,满足深度学习模型对内存的需求。
硬盘:1TB NVMe SSD,用于存储大量的RGB图像数据和模型文件。
摄像头:高清摄像头,分辨率640×480,用于采集RGB图像。 |
样本获取 |
在实际使用场景中,从不同角度采集RGB图像,获取8000帧样本图像,其中2000帧用于训练集,6000帧用于测试集。 |
测试结果 |
在MSLS验证集上,召回率@1为84.3%,召回率@5为91.5%,召回率@10为93.1%;在MSLS挑战集上,召回率@1为65.7%,召回率@5为81.4%,召回率@10为85.3%。 |
执行速度 |
单张图像识别速度约为3.5ms/次。 |
资源消耗 |
单独运行算法时,CPU平均计算占比约70%,GPU平均计算占比约90%,内存使用占比约70%。 |
源码类型 |
提供Python版本源码,采用售卖方式三进行授权。 |
文件大小 |
算法程序文件约为100KB,权重文件约为300MB。 |
相关备注 |
|