![]() |
复旦大学数字信号处理与传输实验室专利“开放环境中行为演化的时空融合推理与终身认知学习方法”、“高效构造超视距全局感知的自主学习方法”获得授权ABSTRACT 1:本发明提供一种开放环境中动作演化的时空融合推理与终身认知学习方法,根据历史认知经验与实时动作观测相结合来构造时空融合视角,判定是否发生环境状态转移;在响应周期内,微调推理出抽象的自由度与任务级策略,然后根据环境奖励回报校准响应的置信度,快速修正当前策略并适应环境。本发明构建了“多目标全局感知、多维度决策部署”的可演绎终身学习架构,提高了智能机器人对未知场景的风险探索与认知的效率。本方案提供了一个新的范式,利用跨层级的最佳响应动作与条件随机场置信区间来促进自主学习的有效性,证明了在开放环境的随机稀疏奖励反馈下,构造不同任务间的快速迁移学习与自适应演化的动作机制。 ABSTRACT 2:本发明提供了一种高效构造超视距全局感知的自主学习方法。构建一个虚拟平台并在虚拟平台中基于现实小车构建相应的虚拟小车模型,步骤S1实时获取小车的第一视角观测数据,获取车道的各视角观测数据,获取虚拟小车的第一视角观测数据;步骤S2,对多组观测数据进行合并更新获得模拟训练数据;步骤S3,通过模拟训练数据获得不同变化事件中的优选策略序列;步骤S4,在路面环境下,将第一观测数据中的变化事件与策略数据集进行特征匹配,得到最接近的变化事件;以及步骤S5,结合观测数据基于置信水平获得现实小车的最优策略并执行。本方法能够很好的解决灾难性遗忘和陷入局部最优策略的问题,具有极大的应用前景。 专利1 作者:洪智铭; 杨涛; 吴晓峰; 胡波 授权公告号:CN115526270B 专利2 作者:洪智铭; 刘璟; 杨晨浩; 王子乐; 韩宇轩; 胡波 授权公告号:CN115496974B |