做了两年多的SLAM,最近迷惑了……
SLAM只能获取环境中的地图;就算加上DL,target recognition,segmentation等手段,也只能获取环境信息,顶多就是能够对环境信息进行一定程度上的感知(当然,很多甚至算不上感知),还是无法进行导航与控制啊?难道最终靠写死循环进行路径规划?(见过某智能比赛绝大部分队伍就这么玩的)
其实这个问题@周志华老师谈过http://www.ccf.org.cn/ccf/readPDF/readOnline?SiteID=122&ContentID=622414,当前大部分所谓的"人工智能",只能叫"智能",离真正的人工智能还相差甚远(大佬轻喷)……或者暂时叫"弱人工智能"而强化学习可能刚好是通向人工智能间的桥梁之一—中级人工智能……
回到问题上,其实做这部分工作的人也不少。本处以几个典型案例进行简要说明,不足之处欢迎指出……
我们知道,无论对于无人机还是无人车,通过传感器(视觉、激光、IMU、GNSS等)之后,都需要进行规划路径,否则还是无法达到最终的目的……
强化学习通过agent与environment进行交互,通过获取reward,并且通过调整其策略,通过平衡exploration与exploitation(探索与利用),最大化奖励函数,最终获取最大的累积reward。。强化学习很早之前就已经发展成熟,只是这几年变得更加火热……
此类工作其实很早之前就已经有人尝试……
1、Learning Monocular Reactive UAV Control in Cluttered Natural Environments(http://arxiv.org/abs/1211.1690)
12年左右的,应该是较早的一篇文章,主要思想是通过使用模仿学习(imitation learning)对无人机进行自主控制、导航及避障。作者通过imitation learning训练无人机,在一个室内和室外分别进行实验,最终取得的效果可以观看论文视频……本文是DRL火之前的工作,个人觉得借鉴意义较大……
2、CAD2RL: Real Single-Image Flight Without a Single Real Image(https://arxiv.org/abs/1611.04201)
16年左右的工作,在本地进行模仿其进行训练,并且迁移到未知环境中(这是必然步骤)。输入为单RGB图像,不需要进行3D重建或者别的工作,本地训练好之后,能够迁移到未知环境(很遗憾,只在室内)
3、Toward Low-Flying Autonomous MAV Trail Navigation using Deep Neural Networks for Environmental Awareness(https://arxiv.org/abs/1705.02550v3)
16年的,这篇文章其实并没有用强化学习,但是个人觉得它对无人机、无人车提供了一个初入的方向。文章在TX2上进行,通过他们提出的Trail DNN进行方向确定(左、中、右及三者偏转的角度六个参量),使用改进版本的YOLO与DSO SLAM进行目标识别避障,利用光流和激光雷达定高,在野外3Km场地上成功实验……
本文是DL与SLAM的较好的尝试吧,使用的技术都比较简单,容易实现……主要是,代码开源,可以自己去尝试……不知道后续工作会不会加入DRL……
4、Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation(https://arxiv.org/abs/1811.10092?context=cs.CL)
CVPR2019的文章,王威廉老师组的工作……知乎上不少人在炒……https://baijiahao.baidu.com/s?id=1627129716741814797&wfr=spider&for=pc
噱头大于实质内容吧,本处不赘述……
5、Google brain的三篇文章,前两篇来自ICRA,第三篇是最近的工作:
Learning Navigation Behaviors End-to-End with AutoRL;
PRM-RL: Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and
Sampling-based Planning;
Long-Range Indoor Navigation with PRM-RL。
三篇文章是一个组里人做的,论文有放实测视频……
个人觉得,这几篇文章其实是很好的工作,利用较少的传感器(1D激光)就能获得较好的效果……而且在未知环境中取得不错的实测结果,是未来不错的方向……因为文章没有啃透,不敢妄评……
17年之前,很多人还怀疑DL和SLAM结合有没有用,结果ICRA18语义SLAM满天飞,会不会19或者20变成结合DRL的SLAM满天飞,拭目以待……
不足之处是,都没有开源代码……
只是最近读的一点文章,当然还有很多工作,没有读到,一点愚见,大佬们轻拍;也欢迎大佬们多多交流指教,在人工智障的路上一去不复返23333333
来源:知乎 www.zhihu.com
作者:袁大头
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。 点击下载
此问题还有 7 个回答,查看全部。
延伸阅读:
自动驾驶的决策系统如果使用深度学习方式实现,当实际使用中出现错误决策时,如何判断错误原因并修改系统?
如何看待《我为什么逃离无人车公司》?
没有评论:
发表评论