RoboMaster视觉教程(3)视觉识别程序框架
概览
RoboMaster 视觉识别是一个比较大的项目了,综合性太强。这里从程序框架的角度来粗略讲一下需要怎么做。
比较好的框架有官方开源的视觉程序、东南大学开源的视觉程序,其中东南大学开源的程序可以认为是官方开源程序的加强版。
他们的程序层次分明清晰易读非常具有扩展性,在其基础上可以很好地修改和扩展功能。
RoboMaster 视觉识别是一个比较大的项目了,综合性太强。这里从程序框架的角度来粗略讲一下需要怎么做。
比较好的框架有官方开源的视觉程序、东南大学开源的视觉程序,其中东南大学开源的程序可以认为是官方开源程序的加强版。
他们的程序层次分明清晰易读非常具有扩展性,在其基础上可以很好地修改和扩展功能。
这里所说的妙算是大疆的第一代妙算,核心处理器为 Tegra K1 ,很轻颜值很高,现在已经停产了。在实际应用中可以明显的感觉到妙算的性能不够。妙算主要是给 M100 设计的,对 M100 的 X3 摄像头做了优化,即可以通过 GPU 读取 X3 摄像头的数据。但对于比赛来说基本没用,而且我也从来没有成功用它读取过 X3 摄像头数据 (T_T) 。妙算的 GPU 只有在进行深度学习类的任务时才有用武之地,而在识别装甲板之类的任务时基本上是摆设,尽管有 zero copy 的特性,但是很不好用。
在这里吐槽了半天妙算,可能你会说:既然妙算这么垃圾,为啥还要用它?因为穷啊,当初买妙算的时候也是割了肉买的,还买了5个……
https://www.dji.com/cn/manifold/info#downloads
妙算官方镜像以及说明书下载
https://elinux.org/Jetson_TK1
这里应该是 TK1 的百科全书,基本上碰到的问题都可以在这里找到答案,同时这个网站也有 TX1、TX2 的资料
https://github.com/groundmelon/m100_x3
X3 摄像头相关资料
https://developer.nvidia.com/embedded/downloads/archive
这里可以下载 JetPack 也就是 Nvidia 官方的一些工具
摄像头应该是机器视觉中最重要的部分了,选择一款成像质量好稳定可靠的摄像头可以极大地减少识别算法设计的难度。
主流的摄像头分为CMOS摄像头和CCD摄像头。一般而言CCD摄像头体积大造价高精度高,而CMOS摄像头由于集成度高造价远低于CCD摄像头,同时CMOS摄像头的体积功耗等参数也相应地优于CCD摄像头。
本文主要总结CMOS摄像头的选型(因为没玩过CCD摄像头)。
通常我们在网上买到的摄像头都是卷帘曝光的摄像头,在日常使用时很难看出这两种摄像头的区别,但是在对速度要求高的领域这两种曝光方式的优劣就很明显了,尤其是对于廉价的摄像头卷帘曝光的果冻效应更加明显。