转一篇机器人学习历程建议,从大学到研究生,避免走弯路
(转自网络,源头是哪位大牛已经不知道了,感觉很好,分享在此,以免像我走弯路)
前言
很多朋友私信问我对机器人和人工智能感兴趣,该怎么展开学习。最近稍微有点空,我写写我的看法。
机器人学的核心问题是做好和物理世界的交互。现在主流的机器人学分支里,处理与物理世界的交互的学科分为三类:传感器和处理算法(激光雷达,多目视觉,融合算法);多刚体系统动力学控制(工业机器人动力学控制和接触力控制);机器人自主移动(locomotion不知道该怎么翻译,轮式、足式、飞行等移动机器人的研究)。我建议对机器人学有兴趣的同学着重在这几个问题上面。
另外,根据世界第一的机器人教育机构卡耐基梅隆大学的机器人学博士的课程分类方式(http://www.ri.cmu.edu/education/COSAug2016.pdf),机器人学有四个核心领域:
- 感知。视觉传感器、图像传感器、触觉和力传感器、惯导等。
- 认知。人工智能、知识表达、规划、任务调度、机器学习等。
- 行为。运动学、动力学、控制、manipulation和locomotion等。
- 数学基础。最优估计、微分几何、计算几何、运筹学等。
本文后面谈到的机器人项目都是以上述观点和课程要求为基础。
这篇文章里我计划介绍从大学一年级到研究生二年级的机器人学习计划,基本是我对自己过去学习方式的一个总结。按照这个方法来学习,能够成为一个能力全面,但是稍微偏软件一点的机器人工程师。这个六年的学习计划,估算下来,全年中每天在上课和完成课程要求之外要投入学习时间6-8个小时,这些时间一方面用于阅读课程知识的英文教材,一方面用于阅读其他学科的教材,一方面用于实践项目。
大一
刚上大一,你的机器人生涯开始了。先看看学校的校园网能不能翻墙,不能的话自己去买个一年一百多块钱的VPN,先确保自己能上Google,不要心疼VPN的钱,这能让你在之后的职业生涯里节省上万块钱。然后去注册一个gmail账号,再注册stackoverflow账号,再注册github的账号,再注册CSDN账号,注册完登录上去逛逛,暂时先不要问为什么。
英语水平一定程度上会是机器人工程师水平的限制因素,英语是同学们在大学最该努力学的一门课,而且不止要把它当成课,要当成一种技能,当成生活的一部分。当你开始努力学习一些高级的机器人知识以后,有可能会非常难以找到中文的参考资料,这个时候如果啃不下英文的资料,进步速度和眼界就会受到很大影响。因此大一的时候要多看看红宝书,看看美剧。
不管是什么专业背景的同学,大学一年级一定要上好的课是微积分和线性代数。线性代数的重要性需要特别强调。一般来说,优秀的工程师和科学家在职业生涯中要学至少五次线性代数,大一学一遍、学凸优化的时候学一遍、学线性系统的时候学一遍、学机器学习的时候学一遍……如果在第一遍学的时候就看到对的书,刷到对的题,那么以后的学习会轻松很多。
网上有很多对于如何学好线性代数的讨论,比如知乎问题如何理解线性代数? - 数学学习。Matrix67大神的文章随记:我们需要怎样的数学教育?也很有启发。我个人对学习线性代数的建议是两本书,一本叫做《Linear Algebra Done Right》,另一本叫做《Linear Algebra Done Wrong》(https://www.math.brown.edu/~treil/papers/LADW/book.pdf),我比较喜欢的是Done Wrong这本书,第一它是免费的,第二只需要读前6章两百页就够了,第三它页边距很大,打印出来有很多空白做练习题。另外一个较好的教材是麻省理工公开课:线性代数。不论如何,学线性代数一定要用国外的教材,千万不要用国内的教材。啃英文书很累,但是考虑到之后还要啃更多的英文书,线性代数已经算是很入门的了,一定要啃下来,同时还要刷足够多的课后题。
学完线性代数以后,一个自然而然的问题就是怎么能用计算机自己去计算矩阵的乘法、向量的乘法、向量的内积。因此引入了编程的学习。
对任何人来说,Python是一把瑞士军刀,你可以用他干很多东西,比如自动回复邮件、自动收集信息。但是真要去造机器人,合适的工具并不是瑞士军刀,而是C/C++这样简单粗暴的锤子和螺丝刀般的工具。在学习Python学到一定程度的时候(比如你听说有一种叫做cython的东西),最好开始学习C,而且要强迫自己练习用C的一维数组和指针来实现矩阵的加法、乘法、求逆等操作。之所以有高级的Python或者Java(不要问我Java哪里高级了)这些语言以后我们还需要去学C,是因为机器人上常用的不是完整的电脑,而是计算量有局限的嵌入式系统,嵌入式系统开发基本只能用C或者更低级的语言。
当你把C学得差不多,开始要学写包含多个头文件的程序时,一定要同时学习makefile的知识。这时候要上网去搜“Makefile详解”(Makefile详解(超级好)_mingw吧)这篇文章看。
以上介绍的这些知识点、书和资料应该在大一期间就全部看完,然后利用大一的暑假好好巩固这些知识。另外还可以抽时间学学数学知识,比如开始看看代数和离散数学。我大一的时候看到了两篇文章,认识到了数学的重要性,一个是MIT的CV大牛林达华写的[转]MIT牛人解说数学体系,另一个是前Goolge研究员吴军博士写的《数学之美》(数学之美 (豆瓣))。当时林达华还在MIT读博士,而《数学之美》还没有成书。两篇文章看完以后我感觉自己整个人对数学的认识上了一个新的层次,此后一直在注意提高自己的数学水平,几年下来觉得收益很大。在之后的介绍里我还会多次强调需要学的数学知识和对应的教材。
大二
上大二的时候,你已经会了基本的编程知识和基本的数学知识。大二这一年应该投入在嵌入式系统的学习中,同时继续拓展自己多方面的能力。基本的数字电路知识、数模转换,51单片机、AVR单片机、STM32单片机原理,UART、SPI、I2C、CAN等协议的原理和数据收发,STM32开发板的使用,电机转动和驱动的原理,PID的原理,调试四轮机器人底盘的移动,基本的传感器如陀螺仪、码盘、红外线、超声波的原理和读取方式,网络知识如配置IP配置路由器等,微电子焊接,金工技术。保证自己每天只睡6-7个小时(但还是要多去跑步、游泳保持身体健康),勤于向学长学姐请教,那么一定会提高得很快。
另外你其他方面的能力也不能落下。大二结束的时候,你的Linux应该用的很熟练了,除了makefile,你也用起了cmake。你也应该开始理解Github存在的意义,因为你已经上去读了很多别人的代码,你也把自己的一些课程设计和小项目放在了Github上面。另外大二基本上了本专业一些比较难的基础课程,比如自动控制原理、机器学习、概率统计、材料和力学等课程,同学们会看到这些课程里又用到了线性代数和微积分的知识,以及建模的知识。这时候可以把大一的物理、线性代数和微积分再翻出来看看。
面向对象程序设计的练习通常是写游戏,比如俄罗斯方块,吃豆人等等,一定要自己能够做到完全手写一个完整的项目出来。
另外你可以开始学习Matlab当中的神器Simulink了。Matlab最强大的工具是Simulink,通过它你几乎可以仿真一切的物理系统和控制系统。我建议同学可以通过Simulink实现一个倒立摆,然后理解Matlab的强大之处。对此我强烈推荐一个很好的教材(http://ctms.engin.umich.edu/CTMS/index.php?example=Introduction§ion=SimulinkControl),它详细介绍了一些经典的控制系统如何分析以及用Simulink实现。然后我再强烈推荐一个讲Simulink里面一个更加和物理仿真贴近的工具Simscape(Control of an Inverted Pendulum on a Cart)的文章。阅读并实现了这两篇文章里的内容,同学应该会对倒立摆有了比较深刻的认识。倒立摆是机器人学中一个非常重要的模型,因为火箭、导弹、双足机器人、四足机器人,基本都是倒立摆的变形。你自己实现出来的simulink模型一定要存好,以后可能还会再拿出来仔细看。
大三
大三开始的时候,可能有的人叫你大神,有的人觉得你技术还不错。但是一定要记得你现在的水平放到别的地方应该不算什么。每年我都往大疆的RoboMasters夏令营招进100个和你现在的水平相当的同学。
大三一定要培养出自己一个人独立造出一个完整机器人的能力,比如一个Robocon水平的机器人,或者一个RoboMasters的战车,或者一个四旋翼飞行器。Robocon水平的机器人,涉及大量的机械设计,单片机开发,电机驱动的开发,码盘和超声波等传感器的读取,底盘运动学的计算,PID调试,任务调度逻辑的调试,舵机控制。RoboMasters的战车的机械部分简单一些,但是还需要进行云台的控制、发弹系统的控制、功率控制等方面的知识,另外你也可以不搞这些部分,学习学习视觉识别和自动打击,那么就要开始研究OpenCV(OpenCV | OpenCV)了。
四旋翼飞行器的机械部分最简单,但是算法比较复杂。对于大三学生来说,从零开始一步到位写一个稳定的飞控比较困难,因为飞控里面有很多细小的知识点要注意。学习四旋翼飞行器有下面几个步骤:
第一步:自己调一个小四轴飞起来
现在开源社区的人言必pixhawk,其实我觉得从学习的角度来说,pixhawk太贵,而且不适合学习,我比较推荐的是 首页-第七实验室 这家淘宝店卖的STM32F405飞控,买回来以后自己再随便买个机架(比如大疆F450)、接收机和遥控,就能按照飞控板附带的学习资料、调试软件飞起来。
第二步:看硬件图、读代码
chiplab7的飞控板附带一大堆学习资料,对加速度计、陀螺和磁感计都有很仔细的解释,硬件链路图也很详细。chiplab7淘宝掌柜的又很认真负责,我学用的时候,发现代码有bug和看不懂的地方,都可以直接找掌柜问。
看完代码以后,对一个飞控系统的基本模块:姿态解算、控制解算、混控输出、遥控器处理、嵌入式处理就很明白了。然而这里面有很多技术是需要另外学习的。除了基本的嵌入式编程以外,还有要把大二大三学的信号处理方面的知识再捡起来看看。因为飞行器在空中有振动,会让加速度计产生噪声,为了把这些噪声去除掉,需要对加速度计给出的信号做低通滤波处理,如何选择滤波器的参数呢?如果滤波滤得太狠,延迟就会比较大,对控制的表现会有影响;如果滤波滤得不够,可能会有一些低频的噪声偶尔会出现,导致加速度计的观测不能用。另外最重要的是要理解姿态解算和控制解算这两块知识。chiplab7的飞控板的代码采用的是最简单的互补滤波算法做为姿态解算模块,然后控制解算是对欧拉角的三个角度做闭环PID控制,基本都是基础的基础了。
第三步:小修小改加深理解
chiplab7的飞控是靠气压计定高的,飞行效果非常奔放。这时候可以淘宝买个20块钱的超声波模块,然后自己写个高度环去稳定飞控的定高表现。
我觉得这个过程至关重要,因为高度控制相对来说是个比较直观理解PID控制的方式,而且chiplab7的飞控加高度控制非常好加。工作量不大,因为改善效果很显著,所以可以让人很有成就感,加深继续学习的乐趣。
第四步:理解核心的数学和控制知识
这一部分大三是肯定来不及学的,但是我还是在这里列出来,因为这些知识你之后都需要慢慢学,我也会在之后不断重复提到这些知识点。
姿态解算和控制解算涉及的知识有:
- 刚体姿态的表示、运动学方程和动力学方程。主要是对牛顿-欧拉方程的认识和理解、刚体姿态的欧拉角表示法、姿态与角速度的关系等等。
这部分说复杂不复杂,说简单也不简单,我同样是没有找到一本完整的书全都介绍过的,是学了好几个不同的书和论文以后搞明白的。现在看起来是从维基百科入手比较靠谱。 - 自动控制原理。讲PID的书和文章就多了去了,没有太多复杂的书。
- 线性估计基本原理。其实就是互补滤波:Reading a IMU Without Kalman: The Complementary Filter 。拿这个关键词百度各种搜就会了。
第五步:重头开始造轮子
知乎著名网友vczh曾经说过,学习要抱着勇于造轮子的心态才能进步。所以在熟悉了别人飞控基础上,可以自己重头造一个飞控的轮子。可以自己从芯片开始重新画一个飞控板,读读STM32的芯片手册、读读各种传感器的芯片手册,自己手画一个飞控的原理图、做PCB layout、制板自己焊元件,全套花不了1000块钱,能够加深很多对硬件的理解。这一部分如果大三没空,也可以不搞了。
大三的时候学校应该会开设软件工程的课程。不管你是不是这个专业,上不上这门课,都应该主动去听一听,甚至跟着课程的设计作业一起做一做。软件工程我觉得是机器人工程师必须具备的意识,因为一个机器人系统里涉及大量的硬件系统和软件功能,软件的部分往往还会涉及不同的语言、不同的编译环境、不同的开发工具链。几个人合作的话,大家的专业背景、编程习惯都不相同,这就导致不同的代码和模块之间的协议沟通非常复杂,必须尽早用UML和其他软件工程的工具帮助团队理解和互相沟通。
大三的时候学校应该还会开设操作系统原理和嵌入式系统原理的课程,而大二的时候讲过计算机组成原理(所谓的微机原理)。从大三开始同学需要开始体会实时操作系统和非实时操作系统的区别、原理以及使用时需要注意的地方。这是一个比较杂的知识点,我目前没有找到很好的教材去介绍。在STM32上,有freeRTOS,uCOS,Vxworks这么几种实时操作系统;Linux是一种非实时操作系统,但是可以通过打补丁变成实时操作系统。这些操作系统的细节在机器人开发中都会多多少少被涉及到,同学们可以随时上Google和CSDN去查大神们的介绍。
另外你还需要在大三的尾巴上选定自己将来的细分研究方向,也就是我在文章开始提到的感知、认知、行为几个方向。当然同时你也不能放松其他方面的知识,尤其是数学基础。我在大三的暑假专门找数学系的同学给我开了个数学小讲座,学习了一点抽象代数的知识,对我后来学习密码学帮助很大。同时我也读了一些拓扑方面的教材(有一本很神奇的书叫做Topopogy Without Tears http://www.topologywithouttears.net/),这样才理解了为什么数学分析要用奇怪的符号去解释一些看起来很浅显的道理。
大三阶段的机器人工程师该学什么基础数学是众说纷纭的,在我看来,你要基本掌握“群是什么”,能够用代数的眼光去证明"det(AB) = det(A)det(B)",还要能理解“用一张纸就可以变出克莱因瓶”(当然是在四维空间里)。另外,你这个时候也要能够意识到自己需要再学一遍线性代数。
大四
大四开始了,你可以开始深挖自己的研究方向,同时也要开始学一些高级一点的通用技术和理论,这时候你和一般的机械、电子、计算机学生就不太一样了,你虽然也在狂编程,但也在狂学习物理和数学。通用技术包括ROS,simulink,gazebo和Vrep等工具。通用理论包括,再学一遍线性代数,学学凸优化、数值计算、旋转表示法等方面的知识。这些知识你在大四仅仅只能开一个头,因为你的大四要实习、毕业、考研、毕设,你会非常地忙。有些人会在大四进实验室和老师发论文,我个人觉得发论文这件事没必要操之过急。你的整个大学期间应该用在广泛涉猎各种各样的知识上面,而不是深入某一个细小的研究问题。
大四可以开始读一些著名入门书籍,我把这些书不分先后地列出来,你没有必要全部去读,而且每本书先读前几章就够了,能读多少尽量读多少。
- 概率机器人学,https://www.amazon.com/Probabilistic-Robotics-Intelligent-Autonomous-Agents/dp/0262201623
- 凸优化,https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf
- 线性系统理论,https://www.amazon.com/Linear-System-Electrical-Computer-Engineering/dp/0199959579
- Multiple View Geometry in Computer Vision,Multiple View Geometry in Computer Vision
- 线性估计,https://www.amazon.com/Linear-Estimation-Thomas-Kailath/dp/0130224642
- 《机器学习》,周志华老师的书。
- An Invitation to 3-D Vision,https://www.eecis.udel.edu/~cer/arv/readings/old_mkss.pdf
- Modern Control Systems,https://www.amazon.com/Modern-Control-Systems-12th-Richard/dp/0136024580
- Rigid Body Dynamics,http://authors.library.caltech.edu/25023/1/Housner-HudsonDyn80.pdf。说实话刚体动力学理论我没有找到特别好的书。但是刚体动力学理论很重要。
- Feedback Systems: An Introduction for Scientists and Engineers,FBSwiki
就像我开始说的那样,这些书,大部分特别贵,还好有一些业界良心的作者放出了他们书的电子版。当然你也可以去一些名字都不能说的网站去找影印版。
在读上面这些书的时候,matlab,python都要放在手边,然后把书里面的知识尽量实践出来。很多教科书里都会在章节后面的习题里放一些写明是用matlab做的习题,要尽量多做一些这样的题。
你可能早就听说了ROS的大名,但是最好不要在大四之前去碰它。因为ROS用了很多操作系统和网络的底层技术。我在知乎回答高手可以谈谈ROS机器人操作平台开发的一些经验吗? - YY硕的回答里有简单的介绍。ROS的设计目标是把机器人的控制和传感器处理的软件和它的硬件隔离开,用上ROS以后,你可以方便地用到很多能直接跑的软件代码。但是ROS从入门到精通需要至少一年以上的时间,你必须不断地用,不断地尝试新的代码和硬件,才能对它熟悉起来。
ROS的可视化工具Rviz里面对于机器人旋转的表示用的是四元数,而在你之前研究四旋翼飞行器时,里面的代码表示旋转用的是欧拉角,做姿态解算用的可能是四元数。这个时候要开始有意识地去学习旋转表示法之间的区别和联系。
要重视大四期间的实习和毕业设计。很多大四的学生毕业设计都会非常颓地做一下,我觉得是不好的。要把做毕业设计的过程看做一个正式的项目。这个项目除了做好技术方面的工作,也要做好展示方面的工作。中国工程师的一大特点是,不会表达自己,可能做的东西水平很高,但是做出PPT就会犯字体花哨不正式、一页上面字太多,图文没有联系等表达上的问题。通过PPT介绍、展示自己的成果在工程师的职业生涯的任何一个阶段都非常重要,它甚至也一定程度上限制了机器人工程师能够达到的高度。只有能够把自己的成果清晰地表达给自己的团队,才能获得其他人的反馈、通过沟通提高团队的整体凝聚力和知识水平,这样自己在团队能够获得更多的认可,有助于团队整体工作效率的提高。我每年去参加几次学术会议,都在会议上感觉到一些中国的科研人员走到国际上以后,演讲能力很差就会导致他们的科研成果不受重视。当然其他国家的科研人员也是这样。
对于那些想申请出国留学的同学,你要做一个自己个人的成果展示,用网页的形式呈现比较好。把自己Github链接(如果你按我说的,大学第一天就申请Github账号,现在已经是一个三年的老油条了)、做过的机器人视频、写过的技术报告和文章(最好是英文的)放在上面。
关于毕业设计的选题,我推荐这么几个:
- 手写双目视觉里程计。涉及到图像处理、特征匹配、位置解算、空间变换等等。
- 手写四旋翼飞行器基于GPS的轨迹规划。涉及到深挖四旋翼飞行器的运动原理、IMU原理、轨迹生成和优化等。
- 造一个被推了也不会倒的双足舵机机器人。涉及到舵机控制、倒立摆建模、动力学分析、PID控制、IMU原理等。
- 深度学习训练一个小车追人跑。涉及到深度学习工具包使用、数据集采集、数据集分析、小车控制等。
- 机械臂给人端茶倒水。这个相对来说土豪一点,因为能直接拿来用的机械臂都很贵,这个要看实验室有没有条件了。涉及到多自由度机械臂原理的学习、工具包的使用、轨迹规划等等。
这几个项目要做好,都要持续投入三个月以上的时间以及一定的资金,每一个都是理论多于实践。当然同学们自己也可以自己选择自己的毕业设计题目,但是最好还是选做出来能跑能飞的东西,同时避免选择需要花大量时间去拧螺丝、焊板子的题目,尽量买现成的电机、开发板、3D打印结构,大四要多给自己留时间去看书和写代码。
大四到研究生之前的暑假,最好去一些比较不错的机器人公司实习一下,比如说大疆。当然你也可以继续做机器人比赛,比如RoboMasters和大疆的飞行器比赛。
研究生一年级
研究生的时候,你的目标比较清晰了,就是做一种机器人至少两年时间,并从中发掘出可以发表论文的知识点。上面我给出的书单里面,你要开始精读里面的几本。
如果做机器人视觉定位、传感器融合方面的研究,1、4、5、7四本书一定要精读。
如果做控制系统的研究,3、8、9、10一定要精读。
如果做规划算法的研究,那么还要读其他偏CS一些的书,比如讲A* search,random forest,图论方面知识的教材。由于我在这方面造诣不深,就不托大了。
如果学习随机系统的控制和最优控制,除了1、2、3,还要读一本神书Stochastic models estimation and control(https://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)。
如果研究机器人视觉定位,几种常用的定位算法:PTAM(Parallel Tracking and Mapping for Small AR Workspaces (PTAM)),ROS的标配VO(viso2_ros - ROS Wiki),SVO(GitHub - uzh-rpg/rpg_svo: Semi-direct Visual Odometry),LSD-SLAM(http://vision.in.tum.de/research/vslam/lsdslam)ORB-SLAM(GitHub - raulmur/ORB_SLAM2: Real-Time SLAM for Monocular, Stereo and RGB-D Cameras, with Loop Detection and Relocalization Capabilities),都必须自己学习之后全部跑一遍。只会用OpenCV的函数和这些工具包并不能说明你会视觉定位,必须要能自己手写出一个能用的才算。
我现在非常不建议同学们选择从四旋翼飞行器的动力学控制里找问题作为研究课题。因为四旋翼飞行器的特点已经被研究透了。目前国际上对多旋翼飞行器的研究主要集中在造一些奇葩形状的飞行器,以及给多旋翼飞行器上安装一个机械臂去做力控制,这样做就对多旋翼飞行器控制的动力学造成了一些影响。因此需要同学对动力学和多自由度机械臂控制有比较深的认识。
自动导航和驾驶是这两年的热点,一方面汽车的自动化是大势所趋,另一方面多旋翼飞行器异军突起,产生了很多对自动飞行的需求。除了机器人视觉定位算法以外,同学还需要学习其他的传感器,以及这些传感器与视觉定位算法怎么融合。这里面有很多坑,比如计算量的问题,怎么保证融合算法不崩,怎么处理传感器的延时等等,都需要同学结合自己的项目去踩,坑踩得多了才能成长。
一些大学里学过的知识点,是必须结合研究生期间的项目的需求弄得很清楚的,比如三大变换(傅里叶变换,拉普拉斯变换,Z变换),旋转表示法(欧拉角、四元数、旋转矩阵),数值计算怎么防止矩阵出现数值问题等等。除了自己的项目,还需要把凸优化、卡尔曼滤波还有多自由度机械臂的控制学习一下。这三个领域的知识,是任何一种机器人都会用的到比较难的知识。
凸优化和凸优化的各种变形是非常重要的知识,因为各行各业里的研究问题,多半是会建立一个优化问题去解决的。上面提到的《Convex Optimization》https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf,也是一本神书,同学们一定要认真读一读。Matlab、Python、C++都有一些现成的工具包可以帮助你解优化问题,不过最好同学们能自己手写一些基本的优化算法,比如gradient descend,barrier method等等。另外现在主流的SLAM算法,后端都是通过一种叫做g2o的优化算法来出效果的。而且g2o能够整合bundle adjustment 和structure-from-motion这两大计算机视觉里的关键问题,可以说是一种很好的计算思想了,非常有必要学习一下g2o。
卡尔曼滤波在上面书单里的1和3都有提到,同时在神书Stochastic models estimation and control(https://www.cs.unc.edu/~welch/kalman/media/pdf/maybeck_ch1.pdf)也有相当多的篇幅。卡尔曼滤波有好几种证明的方法,同学最好能自己学会1-2种。
多自由度的机械臂的难点在于机械臂的运动学正反解、运动学控制和动力学控制,基本是一个建模分析和数值算法实现的问题。如果你所在的学校没有一个财力雄厚的机器人实验室的话,你基本上没有机会接触到多自由度的机械臂。这时候之前学到的Simulink和就要学的Gazebo就派上用场了,你可以用Simscape里面的刚体搭一个多自由度机械臂,然后通过Simulink仿真去学习机械臂的控制;也可以用Gazebo的URDF语言写一个机械臂,然后通过Gazebo和ROS的接口去控制机械臂;也可以用ROS里面的著名工具包MoveIt! Motion Planning Framework,不过MoveIt的问题是,他只能仿真运动学,而不能仿真动力学。工业领域对多自由度的机械臂控制通常用一个叫做D-H表示法的建模工具(Denavit),这个东西我并不太会。我只会向同学们推荐我导师的著作《A mathematical introduction to robotic manipulation》(http://www.cds.caltech.edu/~murray/books/MLS/pdf/mls94-complete.pdf)。
有一个非常神奇的事实:《A mathematical introduction to robotic manipulation》这本机械臂控制领域的著名教材的第二章和计算机视觉领域的著名教材《An Invitation to 3-D Vision》的第二章基本是一样的,都在讲旋转表示法。这是因为所有的旋转表示法都可以归纳为一种优雅的李群结构:SO(3)群。而计算机视觉和机械臂控制都涉及到理解刚体的旋转,事实上用计算系统去观测和控制所有的刚体构成的系统,理解旋转都是很关键的问题。旋转表示法应该作为研究生阶段的一个重要学习的知识点。
李群和李代数是刚体旋转表示背后的数学理论,如果想要深挖一些,可以看这篇文章An elementary introduction to groups and representations的前50页(http://www.cmls.polytechnique.fr/perso/renard/Hall_Group.pdf)。这是我自己读着觉得最好的文章,当然网上也有很多其他的介绍。
研究生阶段还要培养的一个能力是借助各种工具仿真机器人系统的能力。显然地,很多机器人系统真的造出来的话造价昂贵,需要在实际制造之前写一个比较真实的仿真系统出来测试算法。我觉得做仿真系统的能力直接衡量了机器人工程师的技术水平。当你开始要搭一个仿真系统的时候,第一步是通过欧拉方程和牛顿方程确定刚体的运动特点,甚至要自己写刚体二阶微分方程;第二步是确定刚体之间的互联关系,设计不同类型的关节,如果有软性连接需要加入弹簧阻尼模型;第三步是确定被仿真的刚体系统会不会和外界产生碰撞或者其他形式的力,如果有的话,需要设计合适的接触力和摩擦力仿真的模型。多旋翼飞行器的仿真是很简单的,不需要考虑什么接触力。但是多自由度机械臂基本都需要仿真接触力,不和物理世界去交互的机械臂只有很小的实用意义。而能够自行运动locomotion系统,比如双足、多足机器人,则涉及到更多的接触力,多到接触力都会影响仿真系统的数值稳定性。搭建一个仿真系统需要很强的系统建模能力和数值分析的能力,虽然Simulink、Gazebo、Vrep提供了不同程度的工具简化你的工作,但是要让仿真系统能够稳定运行,必须要能深入其中的细节。有些看起来很高大上的仿真工具,比如Nvida的PhysX,在仿真的时候是忽略掉科里奥利力的,如果不理解仿真的本质,可能就会忽略这一个重要的缺陷。
研究生二年级
你的学习计划接近尾声。现在你已经进入了一个很好的状态:看到一个机器人,能够很果断地分析出它用了什么传感器、执行器、计算平台大概是什么量级,他的执行机构能够承受多少力量。看到一个新的算法,能够大约判断清楚它的执行流程,在什么环节做了优化。看到一个新的没学过的知识,能够分析出它和你以前学过的什么知识有联系,你还需要再学什么才能弄明白这个知识点。
研究生二年级要深化第一年学到的那些技术和知识,要做到完整地读过四五本书,五十篇以上的论文。你已经积累了几万行代码的经验,也能熟练地谈论谁家的电机回差小,谁家的电机线性程度好。
你这个时候可以去写作一些论文,也可以开始学习一些更高级的技术和工具,比如用FPGA和GPU优化算法、魔改Linux内核、玩玩液压系统、了解更多机器学习的知识比如强化学习等等。你也可以从计算机图形学或者计算力学里面找到一些帮助你更好进行机器人仿真和系统分析的工具。由于你懂很多机器人方面的知识,你可以给学校的机器人队做指导,或者带队参加一些比较有挑战性的机器人比赛。
写到这里,我就不可能给出很多不同领域的指导了,因为随着学习的进一步深化,我自己熟悉的领域也在收缩。我只能对几个领域给出我的意见。
对视觉定位和传感器融合来说,SLAM急需新的突破,目前通过几何约束去实现loop closure看起来已经走入了死路,没法有更多的发展了,下一步可行的方向是与深度学习进行结合。具体的一些介绍可以阅读行业中大牛的一篇文章http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html,记述了几个业界大牛们最新的观点。传感器融合技术,目前还有很多问题可以探索,因为传感器的延时、不均匀的信号,会给定位系统造成困扰,如何去除这些干扰,需要建立比较复杂的非线性优化问题,具体可以关注香港科技大学Shaojie Shen的工作。
对于多自由度机械手和机器人的locomotion来说,这里面还有非常多可以探索的研究问题。我前面提过接触力和摩擦力很难仿真,大神告诉我现在没有任何一种工具和理论能把接触力和摩擦力正确仿真出来,因此如何在机器人系统里妥善处理对这些力的控制,就是很难的问题了。现在业界的一个前沿发展方向,也是利用机器学习技术来帮助机器人学会处理这些外力,不过人类目前最优秀的多自由度机器人系统,Berkeley的Brett机器人,叠几块积木就要用十分钟(New ‘deep learning’ technique enables robot mastery of skills via trial and error),显然还有很多提升的空间。这方面的问题同学可以关注知乎大神@戴泓楷@周佳骥。
最后我想再强调一遍表达能力的重要性。你可以从自己带的课程和机器人队入手,把自己这几年来学过的知识做成PPT讲给学生们听,然后让他们给你反馈。多做这样的练习,提升自己做演讲的能力,这将来会让你受益匪浅。
- 分享
- 举报
-
浏览量:1387次2023-03-08 11:55:26
-
浏览量:6101次2021-03-01 10:14:26
-
浏览量:832次2023-03-02 14:50:04
-
浏览量:41308次2019-07-12 15:51:05
-
浏览量:1450次2019-06-28 10:54:42
-
浏览量:2119次2020-08-13 14:03:20
-
浏览量:2891次2020-11-23 10:05:05
-
浏览量:2946次2019-06-27 16:09:18
-
浏览量:3270次2017-12-15 10:30:56
-
浏览量:1510次2023-04-14 14:37:29
-
浏览量:3052次2017-12-08 22:05:36
-
浏览量:1844次2019-12-12 15:32:04
-
浏览量:1160次2022-12-07 15:28:26
-
浏览量:601次2023-07-19 15:33:34
-
浏览量:1103次2023-04-14 11:33:22
-
浏览量:2337次2020-03-04 09:17:27
-
浏览量:2104次2019-11-06 17:56:26
-
浏览量:922次2023-01-05 09:34:02
-
浏览量:2699次2020-10-21 10:11:47
-
广告/SPAM
-
恶意灌水
-
违规内容
-
文不对题
-
重复发帖
正年华🍀
感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~
举报类型
- 内容涉黄/赌/毒
- 内容侵权/抄袭
- 政治相关
- 涉嫌广告
- 侮辱谩骂
- 其他
详细说明