快速自主空中探索新框架:FALCON

作者: 周指导Boyu_Zhou分类: 计算机技术 发布时间: 2024-05-10 20:00:05 浏览:3283 次

快速自主空中探索新框架:FALCON

萧植:
看起来是首先选择当前空白区域周围相邻的未知区域形心,然后tsp求解一个路径。和之前不同的是,对已知区域也进行了一种划分,并且每个区域取了对应的形心。一个潜在的好处是,避免了之前每次规划完都要去下一个未知位置形心造成的路径延长,比如第一个实验中,几秒后,racer 明明可以继续向着边界探索,但是却有一个很明显的折返。 我用多智能体强化学习也实现了类似的效果[doge]

【回复】回复 @卖霉桑 :在我的理解中不仅仅是因为感知距离运动较大,更可能是考虑到了以下一些因素的影响,是一种trade-off。影响因素包括无人机的飞行速度,算法的决策频率,运动的距离,以及任务本身带来的环境未知这个属性。 Racer论文中,每次根据当前未知区域形心们的位置分布进行一个事先的规划,强调每次对N_cp个viewpoint们规划完之后,要移动到规划前就决定好的N_cp+1某个未知区的形心,然而,这种情况下完全可能出现第N_cp+1形心与前面的形心们位置偏移比较大的情况。 放到视频中,可以仔细观看第11秒到第13秒时racer的反应。放到我们强化学习或者多智能体强化学习的逻辑中,智能体几乎不可能出现前面就是边界点,但是自己偏偏要返回的情况的。所以对于这种情况一个比较合理的解释就是,在racer中,已经预先把第N_cp+1个位置的形心放到一个比较遥远的位置了,导致智能体走了回头路。 当然racer其实还平衡了一些其他的问题,在我的视角看来做个地方吧,这种更像是很传统的机器视觉,手动提取特征,比如viewpoint的选取其实就很handcraft,我现在做的类型基于深度学习的机器视觉。 值得强调的一点是,上面的说法并不就意味着某个方法就一定高某个方法一等,两者各有自己的所长所短。使用强化学习的方法自然有强化学习的技巧和核心思想,其中一个技巧可以看我投稿的视频及论文(不过重要的是思想,比如前面提到的这个技巧,它的思路其实是让训练环境申数据分布的差异性从小到大) 因为这是小号,不大常上,所以微信号公开在这里,期待和您以及名位同道的交流:qazsdgeje。虓之
【回复】回复 @萧植 :感谢回复! 另外关于您最早的回复中提到“每个区域取了对应的形心。一个潜在的好处是,避免了之前每次规划完都要去下一个未知位置形心造成的路径延长”,可以理解为由于感知的更新(感知距离相较运动距离较大),导致根据tsp进行规划会返回之前的区域进行观测,经过已知区域导致路径的延长吗? 那形心的作用是否可理解为对空间进行一个压缩,判断这个区域是否已经探索(经过),在规划时进行避免重复经过已知区域。 期待您的回复!
【回复】回复 @卖霉桑 :不是区域划分,在我的理解里,这种过于宏观的planning,效果往往不太好,毕竟他们的基本动作空间相比于一步一步走那种,有点过大了。当然也是有好处的,好处在于这种区域划分性质的planning很少出现端到端RL的那种来回往复移动的现象
没事飞飞机:
迫不及待想看论文了[打call][打call]线下开会就听说了周导的这个工作很棒

番茄烤蛋:
Eason好强[星星眼][星星眼][星星眼] 优秀优秀

萧植:
以及相比于原来一层一层往外的探索,这个明显更加具有侵略性的一些,更愿意“深入”,如果我的理解不错的话。

LiNY2_:
这效果太震撼啦![星星眼][星星眼][星星眼]

科技 无人机 人工智能 未知环境自主探索 计算机科学

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读