快速自主空中探索新框架：FALCON

作者: 周指导Boyu_Zhou分类: 计算机技术发布时间: 2024-05-10 20:00:05 浏览:3283 次

快速自主空中探索新框架：FALCON

萧植:
看起来是首先选择当前空白区域周围相邻的未知区域形心，然后tsp求解一个路径。和之前不同的是，对已知区域也进行了一种划分，并且每个区域取了对应的形心。一个潜在的好处是，避免了之前每次规划完都要去下一个未知位置形心造成的路径延长，比如第一个实验中，几秒后，racer 明明可以继续向着边界探索，但是却有一个很明显的折返。我用多智能体强化学习也实现了类似的效果[doge]

【回复】回复 @卖霉桑 :在我的理解中不仅仅是因为感知距离运动较大，更可能是考虑到了以下一些因素的影响，是一种trade-off。影响因素包括无人机的飞行速度，算法的决策频率，运动的距离，以及任务本身带来的环境未知这个属性。 Racer论文中，每次根据当前未知区域形心们的位置分布进行一个事先的规划，强调每次对N_cp个viewpoint们规划完之后，要移动到规划前就决定好的N_cp+1某个未知区的形心，然而，这种情况下完全可能出现第N_cp+1形心与前面的形心们位置偏移比较大的情况。放到视频中，可以仔细观看第11秒到第13秒时racer的反应。放到我们强化学习或者多智能体强化学习的逻辑中，智能体几乎不可能出现前面就是边界点，但是自己偏偏要返回的情况的。所以对于这种情况一个比较合理的解释就是，在racer中，已经预先把第N_cp+1个位置的形心放到一个比较遥远的位置了，导致智能体走了回头路。当然racer其实还平衡了一些其他的问题，在我的视角看来做个地方吧，这种更像是很传统的机器视觉，手动提取特征，比如viewpoint的选取其实就很handcraft，我现在做的类型基于深度学习的机器视觉。值得强调的一点是，上面的说法并不就意味着某个方法就一定高某个方法一等，两者各有自己的所长所短。使用强化学习的方法自然有强化学习的技巧和核心思想，其中一个技巧可以看我投稿的视频及论文（不过重要的是思想，比如前面提到的这个技巧，它的思路其实是让训练环境申数据分布的差异性从小到大）因为这是小号，不大常上，所以微信号公开在这里，期待和您以及名位同道的交流：qazsdgeje。虓之
【回复】回复 @萧植 :感谢回复！另外关于您最早的回复中提到“每个区域取了对应的形心。一个潜在的好处是，避免了之前每次规划完都要去下一个未知位置形心造成的路径延长”，可以理解为由于感知的更新(感知距离相较运动距离较大)，导致根据tsp进行规划会返回之前的区域进行观测，经过已知区域导致路径的延长吗？那形心的作用是否可理解为对空间进行一个压缩，判断这个区域是否已经探索(经过)，在规划时进行避免重复经过已知区域。期待您的回复！
【回复】回复 @卖霉桑 :不是区域划分，在我的理解里，这种过于宏观的planning，效果往往不太好，毕竟他们的基本动作空间相比于一步一步走那种，有点过大了。当然也是有好处的，好处在于这种区域划分性质的planning很少出现端到端RL的那种来回往复移动的现象
没事飞飞机:
迫不及待想看论文了[打call][打call]线下开会就听说了周导的这个工作很棒

番茄烤蛋:
Eason好强[星星眼][星星眼][星星眼] 优秀优秀

萧植:
以及相比于原来一层一层往外的探索，这个明显更加具有侵略性的一些，更愿意“深入”，如果我的理解不错的话。

LiNY2_:
这效果太震撼啦！[星星眼][星星眼][星星眼]

科技无人机人工智能未知环境自主探索计算机科学

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！