中文核心期刊

中国科学引文数据库(CSCD)来源期刊

中国高校优秀科技期刊

中国宇航学会深空探测技术专业委员会会刊

高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于知识图谱的深空探测器任务规划建模

王鑫 赵清杰 徐瑞

王鑫, 赵清杰, 徐瑞. 基于知识图谱的深空探测器任务规划建模[J]. 深空探测学报(中英文), 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
引用本文: 王鑫, 赵清杰, 徐瑞. 基于知识图谱的深空探测器任务规划建模[J]. 深空探测学报(中英文), 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
WANG Xin, ZHAO Qingjie, XU Rui. Modeling of Mission Planning for Deep Space Probe Based on Knowledge Graph[J]. Journal of Deep Space Exploration, 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
Citation: WANG Xin, ZHAO Qingjie, XU Rui. Modeling of Mission Planning for Deep Space Probe Based on Knowledge Graph[J]. Journal of Deep Space Exploration, 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030

基于知识图谱的深空探测器任务规划建模

doi: 10.15982/j.issn.2096-9287.2021.20210030
基金项目: 国家重点研发计划资助项目(2019YFA0706500)
详细信息
    作者简介:

    王鑫(1992– ),女,博士生,主要研究方向:深度学习、强化学习、知识图谱等。通讯地址:北京市海淀区中关村南大街5号北京理工大学(100081) E-mail:xinwtt@163.com

    徐瑞(1975– ),男,教授,主要研究方向:航天器自主任务规划、自主导航、智能控制。通讯地址:北京理工大学宇航学院(100081)E-mail:xurui@bit.edu.cn

    通讯作者:

    赵清杰(1966– ),女,教授,主要研究方向:图像与视频智能分析、机器学习与人工智能、数据处理与可视化等。本文通讯作者。通讯地址:北京市海淀区中关村南大街5号北京理工大学(100081) E-mail:zhaoqj@bit.edu.cn

  • ● Traditional deep probe is rigidly connected. It is prone to overtuning,flipping and losing connection during landing. However,this paper considers the flexible connected multi-agent deep probe. ● Traditional deep space exploration is based on PDDL. This method is not only complicated,but also incomplete at present. It has many shortcomings when solving multi-agent deep space probe,such as dividing the actions of different agents into disjoint subsets to complete the description of multi-agent planning. However,there are both cooperative and mutually exclusive relationships between different agents. The knowledge graph can solve the relationship between agents well. ● PDDL is an integrated software,which is not convenient to apply to deep learning and other cutting-edge technology methods. However,the knowledge map method saves the results in json format,which can be easily integrated with these methods.
  • 中图分类号: TP3

Modeling of Mission Planning for Deep Space Probe Based on Knowledge Graph

  • 摘要: 设计具有任务自主规划能力的深空柔性多智能体探测器是未来深空探测技术研究和发展的重要方向。针对多智能体深空探测器在任务规划时涉及的对象多、约束复杂、深空环境不确定,以及传统的任务规划语言无法对其进行准确、直观、简洁描述的问题,提出基于知识图谱的多智能体深空探测器的知识表示方法。该方法首先对探测器系统进行知识抽取,然后通过知识融合将系统设备及其状态和动作进行关联,最后采用知识加工挖掘多智能体之间潜在的关系。通过与MA-PDDL方法进行对比,验证所提出的方法简单、直观,更有利于探测器实现自主、灵活、准确的任务规划。
    Highlights
    ● Traditional deep probe is rigidly connected. It is prone to overtuning,flipping and losing connection during landing. However,this paper considers the flexible connected multi-agent deep probe. ● Traditional deep space exploration is based on PDDL. This method is not only complicated,but also incomplete at present. It has many shortcomings when solving multi-agent deep space probe,such as dividing the actions of different agents into disjoint subsets to complete the description of multi-agent planning. However,there are both cooperative and mutually exclusive relationships between different agents. The knowledge graph can solve the relationship between agents well. ● PDDL is an integrated software,which is not convenient to apply to deep learning and other cutting-edge technology methods. However,the knowledge map method saves the results in json format,which can be easily integrated with these methods.
  • 图  1  多智能体深空探测器知识图谱构建流程图

    Fig.  1  Flow chart of constructing knowledge graph of multi-agent deep space detector

    图  2  深空探测器实体抽取流程图

    Fig.  2  Entity extraction flow chart of deep space detector

    图  3  Att-BiLSTM网络结构图

    Fig.  3  Network structure of Att-BiLSTM

    图  4  属性抽取流程图

    Fig.  4  Attribute extraction flow chart

    图  5  NTN神经张量模型结构图

    Fig.  5  Network structure of NTN

    图  6  知识提取结果图

    Fig.  6  The result of knowledge extraction

    图  7  多智能体深空探测器任务规划知识图谱示意图

    Fig.  7  Schematic diagram of the knowledge graph of multi-agent deep space detector mission planning

    图  8  姿态转动时间约束示意图

    Fig.  8  Schematic diagram of attitude rotation time constraint

    图  9  领域描述的BNF定义

    Fig.  9  BNF definition of domain description

    图  10  问题描述的BNF定义

    Fig.  10  BNF definition of problem description

    表  1  多智能体深空探测器系统及动作

    Table  1  Multi-agent deep space probe systems and actions

    系统动作
    柔性系统加电/加热、展开
    推进系统开机、准备、点火、关机
    导航系统开机、模式切换、待命、关机
    相机系统开机、拍照、待命、关机
    制导系统开机、模式切换、工作、关机
    姿态系统开机、姿态机动、姿态保持、关机
    热控系统开机、准备、加热、冷却、关机
    通信系统开机、准备、对轨通信、对地通信、关机
    数字存储系统开机、写数据、读数据、空闲、关机
    下载: 导出CSV

    表  2  多智能体深空探测器的状态及其描述

    Table  2  States and descriptions of multi-agent space probe

    状态含义
    camera_on_agent相机在智能体上
    camera_off_agent相机不在智能体上
    camer_available相机是否可用
    data_memory_capacity数据存储设备剩余内存
    fuel_quantity燃料数量
    battery_quantity电池电能数量
    time_posture姿态保持时间
    下载: 导出CSV

    表  3  多智能体深空探测器系统基本动作及其描述

    Table  3  Basic actions and descriptions of multi-agent space probe

    动作含义
    power_up_flexible_system柔性系统加电
    power_heat_flexible_system柔性系统加热
    switch_on相机打开
    switch_off相机关闭
    take_pic相机拍照
    align_camera相机对齐
    priority_new_than_pret_task任务new比任务pret优先级高
    light_fire推进系统点火
    agent_has_camera智能体有相机
    下载: 导出CSV

    表  4  GRU序列模型超参数

    Table  4  GRU sequence model hyperparameters

    超参数大小
    num_seqs100
    hidden_size3
    lr0.01
    batch_size16
    num_epoch100
    下载: 导出CSV

    表  5  Att-BiLSTM模型超参数

    Table  5  Att-BiLSTM hyperparameters

    超参数大小
    dropout0.2
    hidden_size30
    lr0.1
    batch_size16
    num_epoch100
    lstm_out_dropout0.2
    att_out_dropout0.2
    下载: 导出CSV

    表  6  NTN模型超参数

    Table  6  NTN model hyperparameters

    超参数大小
    Tensor_dim64
    hidden_size30
    Atten_size32
    lr0.001
    batch_size16
    num_epoch100
    dropout_p0.05
    下载: 导出CSV

    表  7  多智能体探测器知识融合

    Table  7  Multi-agent detector knowledge fusion

    实体属性关系
    detectorposition1 km
    detectorvelocity13.5 m/s
    detectoragent1has
    agent1camera1has
    camera1align1is
    camera1target1no
    下载: 导出CSV
  • [1] 吴伟仁,于登云. 深空探测发展与未来关键技术[J]. 深空探测学报(中英文),2014,1(1):5-17.

    WU W R,YU D Y. The development of deep space exploration and key technologies in the future[J]. Journal of Deep Space Exploration,2014,1(1):5-17.
    [2] STRAUB J. A review of spacecraft AI control systems[C]//The 15th World Multi-Conference on Systemics, Cybernetics and Informatics. Orlando, United States: [s. n.], 2011.
    [3] GILLEY G. Fault tolerant design and autonomous spacecraft[C]//The 3rd Computers in Aerospace Conference. San Diego, CA, USA: [s. n.], 2013: 342-348.
    [4] 王晓晖,李爽. 深空探测器约束简化与任务规划方法研究[J]. 宇航学报,2016,37(7):768-774. doi:  10.3873/j.issn.1000-1328.2016.07.002

    WANG X H,LI S. Research on deep space probe constraint simplification and mission planning method[J]. Acta Aeronautica ETAs-tronautica Sinica,2016,37(7):768-774. doi:  10.3873/j.issn.1000-1328.2016.07.002
    [5] 朱立颖,叶志玲,李玉庆,等. 小天体探测自主绕飞智能规划建模[J]. 深空探测学报,2019,6(5):463-469.

    ZHU L Y,YE Z L,LI Y Q,et al. Intelligent planning modeling for autonomous orbiting small celestial body detection[J]. Journal of Deep Space Exploration,2019,6(5):463-469.
    [6] 吴坤,刘玮,李爽,等. 一种动态环境下多Agent的协作方法[J]. 武汉工程大学学报,2017,39(2):186-192. doi:  10.3969/j.issn.1674-2869.2017.02.015

    WU K,LIU W,LI S,et al. A method of multi-agent cooperation in dynamic environment[J]. Journal of Wuhan Institute of Technology,2017,39(2):186-192. doi:  10.3969/j.issn.1674-2869.2017.02.015
    [7] FIER D, KOMENDA A. Concise finite-domain representations for factored MA-PDDL planning tasks[C]//10th International Conference on Agents and Artificial Intelligence. Sanibel Island, USA: [s. n.], 2018.
    [8] 李涓子,侯磊. 知识图谱研究综述[J]. 山西大学学报(自然科学版),2017,40(3):454-459.

    LI J Z,HOU L. Summary of knowledge graph research[J]. Journal of Shanxi University(Natural Science Edition),2017,40(3):454-459.
    [9] HELING L, BENSMANN F, ZAPILKO B, et al. Building knowledge graphs from survey data: a use case in the social sciences(extended version)[C]//Extended semantic web conference. [S. l.]: ESWC, 2019.
    [10] 林一松,秦祎,秦浩炜. 知识图谱在金融行业的应用研究[J]. 经济管理文摘,2020,754(16):25-26.

    LIN Y S,QIN W,QIN H W. Research on the application of knowledge graph in the financial industry[J]. Economic Management Digest,2020,754(16):25-26.
    [11] 夏宇航,高大启,阮彤,等. 基于知识图谱的医疗病历数据存储研究[J]. 计算机工程,2019,45(1):9-16,22.

    XIA Y H,GAO D Q,RUAN T,et al. Research on medical record data storage based on knowledge graph[J]. Computer Engineering,2019,45(1):9-16,22.
    [12] 张玥,赵辰光. 基于科学知识图谱的我国政府执行力研究热点透析[J]. 中国管理信息化,2018,21(23):192-194. doi:  10.3969/j.issn.1673-0194.2018.23.080

    ZHANG Y,XHAO C G. An analysis of the research hotspots of chinese government executive power based on the atlas of scientific knowledge[J]. China Management Information,2018,21(23):192-194. doi:  10.3969/j.issn.1673-0194.2018.23.080
    [13] 赫中翮. 面向中文知识图谱构建的知识抽取方法研究与实现[D]. 合肥: 国防科学技术大学, 2019.

    HE Z H. Research and implementation of knowledge extraction method for chinese knowledge graph construction[D]. Hefei: National Defense Science and Technology Conference, 2019.
    [14] SMIRNOVA A,CUDREMAUROUX P. Relation extraction using distant supervision:a survey[J]. ACM Computing Surveys,2019,51(5):106.1-106.35.
    [15] WU G,TANG G,WANG Z,et al. An attention-based BiLSTM-CRF model for Chinese clinic named entity recognition[J]. IEEE Access,2019,7:113942-113949. doi:  10.1109/ACCESS.2019.2935223
    [16] WHANG S E, GUPTA R, HALEVY A. ReNoun: fact extraction for nominal attributes[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Doha, Qatar: [s. n.], 2014.
    [17] NGUYEN H L,DANG T V,JUNG J J. Knowledge graph fusion for smart systems:a survey[J]. Information Fusion,2020,61(4):56-70.
    [18] 官赛萍,靳小龙,贾岩涛,等. 面向知识图谱的知识推理研究进展[J]. 软件学报,2018,29(10):2966-2994.

    GUAN S P,JIN X L,JIA Y T,et al. Research progress of knowledge reasoning oriented to knowledge graph[J]. Journal of Software,2018,29(10):2966-2994.
    [19] HONG W,XU W,QI J W,et al. Neural tensor network for multi-label classification[J]. IEEE Access,2019,99:1-1.
    [20] BABYCH T,GOROKHOVSKYI S. Building and storing in graph database neo4j abstract symantic graph of php applications source code[J]. NaUKMA Research Papers Computer Science,2020,3:27-30.
  • [1] 于国斌.  深空探测任务协同的系统工程方法应用及趋势 . 深空探测学报(中英文), 2021, 8(4): 407-415. doi: 10.15982/j.issn.2096-9287.2021.20210036
    [2] 王卓, 徐瑞.  基于多目标优化的深空探测器姿态组合规划方法 . 深空探测学报(中英文), 2021, 8(2): 147-153. doi: 10.15982/j.issn.2096-9287.2021.20200069
    [3] 陈春亮, 张正峰, 盛瑞卿, 杨孟飞.  深空探测跳跃式再入返回任务设计 . 深空探测学报(中英文), 2021, 8(3): 269-275. doi: 10.15982/j.issn.2096-9287.2021.20210016
    [4] 高宇辉, 师明, 蔡敦波, 张弓.  一种通用型遥操作任务智能规划方法研究 . 深空探测学报(中英文), 2021, 8(2): 140-146. doi: 10.15982/j.issn.2096-9287.2021.20200071
    [5] 徐瑞, 李朝玉, 朱圣英, 王棒, 梁子璇, 尚海滨.  深空探测器自主规划技术研究进展 . 深空探测学报(中英文), 2021, 8(2): 111-123. doi: 10.15982/j.issn.2096-9287.2021.20210039
    [6] 牛厂磊, 罗志福, 雷英俊, 王文强, 郑见杰, 乔学荣, 罗洪义, 胡文军, 钟武烨.  深空探测先进电源技术综述 . 深空探测学报(中英文), 2020, 7(1): 24-34. doi: 10.15982/j.issn.2095-7777.2020.20200002
    [7] 王颖, 朱安文, 刘飞标, 田岱, 王铸.  超远深空探测任务的能源动力方案 . 深空探测学报(中英文), 2020, 7(2): 213-220. doi: 10.15982/j.issn.2095-7777.2020.20190327001
    [8] 雷英俊, 朱立颖, 张文佳.  我国深空探测任务电源系统发展需求 . 深空探测学报(中英文), 2020, 7(1): 35-40. doi: 10.15982/j.issn.2095-7777.2020.20190712001
    [9] 蔡明辉, 杨涛, 韩建伟.  载人深空探测磁场主动辐射防护技术研究 . 深空探测学报(中英文), 2019, 6(2): 165-172. doi: 10.15982/j.issn.2095-7777.2019.02.008
    [10] 陈莉丹, 谢剑锋, 刘勇, 陈明.  中国深空探测任务轨道控制技术综述 . 深空探测学报(中英文), 2019, 6(3): 210-218. doi: 10.15982/j.issn.2095-7777.2019.03.002
    [11] 金颢, 徐瑞, 崔平远, 朱圣英.  基于状态转移图的启发式深空探测器任务规划方法 . 深空探测学报(中英文), 2019, 6(4): 364-368. doi: 10.15982/j.issn.2095-7777.2019.04.008
    [12] 李永, 丁凤林, 周成.  深空探测推进技术发展趋势 . 深空探测学报(中英文), 2018, 5(4): 323-330. doi: 10.15982/j.issn.2095-7777.2018.04.002
    [13] 金颢, 徐瑞, 崔平远, 朱圣英.  基于扩展状态深空探测器任务规划方法 . 深空探测学报(中英文), 2018, 5(6): 569-574. doi: 10.15982/j.issn.2095-7777.2018.06.010
    [14] 李群智, 贾阳, 彭松, 韩璐.  月面巡视探测器任务规划顶层设计与实现 . 深空探测学报(中英文), 2017, 4(1): 58-65. doi: 10.15982/j.issn.2095-7777.2017.01.009
    [15] 张建琴, 徐建明, 贾巍, 邱宝贵, 肖杰.  深空探测太阳电池阵应用及关键技术分析 . 深空探测学报(中英文), 2016, 3(1): 3-9. doi: 10.15982/j.issn.2095-7777.2016.01.001
    [16] 沈自才, 代巍, 白羽, 刘荣强, 丁义刚, 刘业楠.  载人深空探测任务的空间环境工程关键问题 . 深空探测学报(中英文), 2016, 3(2): 99-107. doi: 10.15982/j.issn.2095-7777.2016.02.001
    [17] 王伟, 马彦涵, 周易倩, 方宝东.  深空探测磁动力技术研究进展 . 深空探测学报(中英文), 2015, 2(3): 203-207. doi: 10.15982/j.issn.2095-7777.2015.03.002
    [18] 李朝玉, 徐瑞.  一种基于时标状态的启发式航天器任务规划算法 . 深空探测学报(中英文), 2015, 2(1): 20-26. doi: 10.15982/j.issn.2095-7777.2015.01.003
    [19] 张大鹏, 雷勇军.  深空探测返回舱着陆冲击动力学分析 . 深空探测学报(中英文), 2014, 1(2): 150-155.
    [20] 吴伟仁, 于登云.  深空探测发展与未来关键技术 . 深空探测学报(中英文), 2014, 1(1): 5-17.
  • 加载中
图(10) / 表 (7)
计量
  • 文章访问数:  195
  • HTML全文浏览量:  41
  • PDF下载量:  29
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-04-25
  • 修回日期:  2021-05-01
  • 网络出版日期:  2021-07-15
  • 刊出日期:  2021-06-30

基于知识图谱的深空探测器任务规划建模

doi: 10.15982/j.issn.2096-9287.2021.20210030
    基金项目:  国家重点研发计划资助项目(2019YFA0706500)
    作者简介:

    王鑫(1992– ),女,博士生,主要研究方向:深度学习、强化学习、知识图谱等。通讯地址:北京市海淀区中关村南大街5号北京理工大学(100081) E-mail:xinwtt@163.com

    徐瑞(1975– ),男,教授,主要研究方向:航天器自主任务规划、自主导航、智能控制。通讯地址:北京理工大学宇航学院(100081)E-mail:xurui@bit.edu.cn

    通讯作者: 赵清杰(1966– ),女,教授,主要研究方向:图像与视频智能分析、机器学习与人工智能、数据处理与可视化等。本文通讯作者。通讯地址:北京市海淀区中关村南大街5号北京理工大学(100081) E-mail:zhaoqj@bit.edu.cn
  • ● Traditional deep probe is rigidly connected. It is prone to overtuning,flipping and losing connection during landing. However,this paper considers the flexible connected multi-agent deep probe. ● Traditional deep space exploration is based on PDDL. This method is not only complicated,but also incomplete at present. It has many shortcomings when solving multi-agent deep space probe,such as dividing the actions of different agents into disjoint subsets to complete the description of multi-agent planning. However,there are both cooperative and mutually exclusive relationships between different agents. The knowledge graph can solve the relationship between agents well. ● PDDL is an integrated software,which is not convenient to apply to deep learning and other cutting-edge technology methods. However,the knowledge map method saves the results in json format,which can be easily integrated with these methods.
  • 中图分类号: TP3

摘要: 设计具有任务自主规划能力的深空柔性多智能体探测器是未来深空探测技术研究和发展的重要方向。针对多智能体深空探测器在任务规划时涉及的对象多、约束复杂、深空环境不确定,以及传统的任务规划语言无法对其进行准确、直观、简洁描述的问题,提出基于知识图谱的多智能体深空探测器的知识表示方法。该方法首先对探测器系统进行知识抽取,然后通过知识融合将系统设备及其状态和动作进行关联,最后采用知识加工挖掘多智能体之间潜在的关系。通过与MA-PDDL方法进行对比,验证所提出的方法简单、直观,更有利于探测器实现自主、灵活、准确的任务规划。

注释:
1)  ● Traditional deep probe is rigidly connected. It is prone to overtuning,flipping and losing connection during landing. However,this paper considers the flexible connected multi-agent deep probe. ● Traditional deep space exploration is based on PDDL. This method is not only complicated,but also incomplete at present. It has many shortcomings when solving multi-agent deep space probe,such as dividing the actions of different agents into disjoint subsets to complete the description of multi-agent planning. However,there are both cooperative and mutually exclusive relationships between different agents. The knowledge graph can solve the relationship between agents well. ● PDDL is an integrated software,which is not convenient to apply to deep learning and other cutting-edge technology methods. However,the knowledge map method saves the results in json format,which can be easily integrated with these methods.

English Abstract

王鑫, 赵清杰, 徐瑞. 基于知识图谱的深空探测器任务规划建模[J]. 深空探测学报(中英文), 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
引用本文: 王鑫, 赵清杰, 徐瑞. 基于知识图谱的深空探测器任务规划建模[J]. 深空探测学报(中英文), 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
WANG Xin, ZHAO Qingjie, XU Rui. Modeling of Mission Planning for Deep Space Probe Based on Knowledge Graph[J]. Journal of Deep Space Exploration, 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
Citation: WANG Xin, ZHAO Qingjie, XU Rui. Modeling of Mission Planning for Deep Space Probe Based on Knowledge Graph[J]. Journal of Deep Space Exploration, 2021, 8(3): 315-323. doi: 10.15982/j.issn.2096-9287.2021.20210030
    • 深空探测器自主性的首要表现是能够自主规划任务,根据要求选择所要执行的活动,自主分配资源和时间,使得探测器能够完成相应的任务[1-3]。对任务规划进行知识表示是实现探测器任务规划前提。王晓晖等[4]采用基于时间线的方法对深空探测器的约束进行简化。朱丽颖等[5]基于PDDL(Planning Domain Definition Language)将活动的时间信息、资源信息和活动之间的约束关系等信息进行建模。吴坤等[6]通过在MA-PDDL中加入连续的规划元素对动态环境下多智能体协作问题进行建模。Fier等[7]采用有限域状态变量对MA-PDDL(Multi-Agent Planning Domain Definition Language,MA-PDDL)中规划任务进行简洁表示。

      知识图谱[8-9]是人工智能的一个重要分支,它将复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制显示出来,目前在金融[10]、医疗[11]、政务[12]等领域得到了广泛的应用。知识图谱的基本组成是一个<实体–关系–实体>三元组,以及实体及其相关属性–值,实体间通过关系相互联结,构成网状的知识结构。鉴于传统任务规划表示方法的缺点和知识图谱的优点,本文对复杂的多智能体深空该探测器采用知识图谱对其进行知识表示。

    • 多智能体深空探测器主要是智能体之间通过采用各智能体间的通讯、合作、协调、调度、管理及控制来表达深空探测器系统的结构、功能和特性。建立合适的任务规划模型,对智能体进行知识表示是实现多智能体探测器任务规划的重要前提。但是深空探测系统具有复杂的约束和较大的规划空间,而且深空环境不确定,人类对天体的认知尚浅,对深空探测的任务规划进行知识表示是非常困难的。

      多智能体深空探测器任务规划需要表达的基本要素有探测器子系统、星上资源和约束条件,多智能体探测器每个智能体节点具有柔性系统、导航系统、制导系统、姿态系统、推进系统、相机系统、热控系统、通信系统和数据存储系统等。每个系统涉及的动作如表1所示。星上资源主要包括可耗尽资源和非可耗尽资源。其中,可耗尽资源是指可以通过一定的手段重新获得资源;非可耗尽资源是指资源有限,资源消耗完后相关系统无法运行。约束关系主要有有限资源、持续时间、活动并发性、计算资源约束。多智能体深空探测器任务规划的部分状态及其含义如表2所示,部分基本动作及其含义如表3所示。

      表 1  多智能体深空探测器系统及动作

      Table 1.  Multi-agent deep space probe systems and actions

      系统动作
      柔性系统加电/加热、展开
      推进系统开机、准备、点火、关机
      导航系统开机、模式切换、待命、关机
      相机系统开机、拍照、待命、关机
      制导系统开机、模式切换、工作、关机
      姿态系统开机、姿态机动、姿态保持、关机
      热控系统开机、准备、加热、冷却、关机
      通信系统开机、准备、对轨通信、对地通信、关机
      数字存储系统开机、写数据、读数据、空闲、关机

      表 2  多智能体深空探测器的状态及其描述

      Table 2.  States and descriptions of multi-agent space probe

      状态含义
      camera_on_agent相机在智能体上
      camera_off_agent相机不在智能体上
      camer_available相机是否可用
      data_memory_capacity数据存储设备剩余内存
      fuel_quantity燃料数量
      battery_quantity电池电能数量
      time_posture姿态保持时间

      表 3  多智能体深空探测器系统基本动作及其描述

      Table 3.  Basic actions and descriptions of multi-agent space probe

      动作含义
      power_up_flexible_system柔性系统加电
      power_heat_flexible_system柔性系统加热
      switch_on相机打开
      switch_off相机关闭
      take_pic相机拍照
      align_camera相机对齐
      priority_new_than_pret_task任务new比任务pret优先级高
      light_fire推进系统点火
      agent_has_camera智能体有相机
    • 针对深空探测器任务规划的特点,本文提出采用知识图谱对其进行知识表示。为便于描述,首先给出以下几个定义。

      定义1 智能体是指深空探测器的节点。深空探测器可以由多个节点构成,本文以3个节点探测器作为示例。

      定义2 深空探测器任务规划领域模型是用数学方法对深空探测器着陆过程的抽象,用一个四元组表示,$\Sigma = (O,S,A,C)$$O$是系统中所有对象的集合,$S$是系统中所有可能出现的状态集合,$A$是智能体可能执行的动作集合,$C$是对探测器规划时的约束条件集合。

      定义3 知识图谱中的实体表示深空探测器的3个节点及节点上的系统设备。

      定义4 知识图谱中的属性表示深空探测器系统的状态和动作。

      定义5 知识图谱中的关系表示系统设备之间以及设备和其所具有的状态及动作之间的关系。

      知识图谱的构建由知识抽取[13]、知识融合和知识加工3部分构成,构建流程如图1所示。

      图  1  多智能体深空探测器知识图谱构建流程图

      Figure 1.  Flow chart of constructing knowledge graph of multi-agent deep space detector

    • 知识抽取包括实体抽取、属性抽取和关系抽取3部分。多智能体深空探测设备的知识抽取是指从文本数据中提取出智能体上系统设备名字、设备状态和动作,以及它们之间的关系。

    • 实体抽取也称为命名实体识别(Named Entity Recognition,NER),是指从文本数据集中自动识别出命名实体。多智能体深空探测器的柔性附着需要经历主减速段、柔性展开段、协同减速段、避障决策段和最终附着段5个阶段,不同阶段探测器执行不同的任务,某些系统设备随着执行的任务发生相应的变化。针对探测器系统动态变化这个特点,本文构建基于门控循环单元模型(Gated Recurrent Unit,GRU)的序列模型对多智能体深空探测器进行实体抽取,流程如图2所示。3个智能体节点均具有计算设备,而且GRU的计算量Flops相对较小,因此采用分布式在线训练GRU模型。

      图  2  深空探测器实体抽取流程图

      Figure 2.  Entity extraction flow chart of deep space detector

      智能体上的系统不同时刻会有不同的状态,某个时间段内的数据连接在一起构成一个时序数据,采用GRU对其进行特征提取,最后将特征图和其对应的标签一起训练分类器。新的历史数据在特征提取之后,通过分类器预测其实体标签。在用GRU进行特征提取时,输入输出公式如式(1)~(4)所示

      $${O_t} = \sigma [{W_{so}}*{{\boldsymbol{S}}_t} + {W_{ho}}*{H_{t - 1}} + {b_o}]$$ (1)
      $${\tilde H_t} = {W_{sh}}*{{\boldsymbol{S}}_t} + {W_{hh}}*({O_t} \odot {H_{t - 1}}) + {b_n}$$ (2)
      $${Z_t} = \sigma [{W_{sz}}*{{\boldsymbol{S}}_t} + {W_{hz}}*{H_{t - 1}} + {b_z}]$$ (3)
      $${H_t} = (1 - {Z_t}) \odot {H_{t - 1}} + {Z_t} \odot \tanh [{\tilde H_t}]$$ (4)

      其中:${{\boldsymbol{S}}_t}$表示智能体在$t$时刻的基本状态向量;${H_{t - 1}}$表示前一隐层的状态;$ * $表示卷积,$ \odot $表示元素相乘;$W$表示权重;$b$表示偏置;$\sigma [ \cdot]$表示logistic sigmoid函数;${Z_t}$表示$t$时刻更新门的状态;${r_t}$表示$t$时刻重置门的状态。

    • 关系抽取[14]是从文本中抽取系统设备之间的关系以及系统设备及其状态和动作之间的关系。本文采用Att-BiLSTM[15]表2所示的关系进行抽取。Att-BiLSTM的结构如图3所示。Att-BiLSTM相较于GRU需要更多的计算量,虽然3个智能体设备均具有计算资源,但计算量有限,因此对Att-BiLSTM采用离线训练。

      图  3  Att-BiLSTM网络结构图

      Figure 3.  Network structure of Att-BiLSTM

      Att-BiLSTM由输入层、Embedding层、LSTM层、Attention层和输出层5部分构成。输入层是描述探测器智能体的句子,用$({x_1},{x_2}, \cdots ,{x_r})$表示,Embedding层将句子中的每一个词映射成一个固定长度的向量,然后LSTM层利用双向LSTM对Embedding向量计算,在通过Attention层对双向LSTM的结果进行加权,最后输出层输出探测器系统设备之间、系统设备及其所处的状态和动作之间的关系。在关系抽取时,Attention层生成一个权重向量,为卷积层提取的词汇分配不同大小的权重,这些词汇与对应的权重相乘,可以在迭代过程中将词汇级特征合并为句子级的特征,节省网络的推理的时间以及计算资源。Attention层的计算方法如式(5)~(7)所示,采用Softmax对提取的向量进行分类,如公式(8)~(9)所示

      $$M = \tanh (H)$$ (5)
      $$\alpha = soft\max ({\boldsymbol w^{\rm T}}{\boldsymbol{M}})$$ (6)
      $$r = {\boldsymbol{H}}{{\boldsymbol \alpha} {\rm ^T}}$$ (7)
      $$\hat p(y|S) = soft\max ({W^{(S)}}h* + {b^{(S)}})$$ (8)
      $$\hat y = \mathop {arg\max }\limits_y \hat p (y|S)$$ (9)

      其中:${\boldsymbol{H}}$表示所有$T$个词经过BiLSTM的向量集合;${\boldsymbol{M}}$表示词向量集合;$\tanh $$soft\max $表示激活函数;${{\boldsymbol w}^{\rm T}}$表示权重;$\alpha $表示词向量集合$M$的得分;$r$是句子表示;$y$表示句子标签;$\hat p(y|S)$表示在句子$S$条件下属于$y$的概率;$\hat y $表示预测标签。

    • 属性抽取是指从文本数据中抽取出探测器系统设备的状态和动作。本文采用ReNoun[16]方法对表2表3所示的状态和动作进行抽取,流程如图4所示。

      图  4  属性抽取流程图

      Figure 4.  Attribute extraction flow chart

    • 多智能体深空探测器的知识抽取可以获取实体、关系和属性等知识要素,但是这些数据之间的关系是扁平化的、缺乏层次性和逻辑性,需要进行知识融合。知识图谱的知识融合[17]包括实体链接和知识合并两部分。

      实体链接是指从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作,首先根据给定的实体指称项从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链接到正确的实体对象。例如多个系统具有开机和关机的动作,开机和关机就是实体指称项,通过汉明距离(Hamming distance)计算它们与每个系统之间的相似性,选出相似性最高的系统与其进行匹配。但是在匹配过程中,可能因为系统设备名称相同而产生歧义,通过实体消歧,将其与正确的设备进行匹配。此外,可能存在多个指称对应同一实体的问题,通过共指消解进行处理。

      知识合并主要包含两部分,即合并外部知识库和合并关系数据库。合并外部知识库是指将外部知识库融合到本地知识库,即是将深空探测器的外部数据库与构建的本地知识库进行数据层和模式层的融合。对于关系数据库合并,采用资源描述框架进行融合。

    • 通过知识提取和知识融合,可以得到关于多智能体深空探测器任务规划的基本事实表示,但是要最终获得结构化、网络化的知识体系,还需要本体构建以及知识推理对知识进行加工。

    • 本体是同一领域内的不同主题之间进行交流的语义基础,是树状结构,相邻层次的节点(概念)之间有严格的“IsA”关系。在知识图谱中,本体位于模式层,用于描述概念层次体系,是知识库中知识的概念模板。

      以数据驱动的自动化方式构建本体,包含3个阶段。

      1)实体并列关系相似度计算

      实体并列关系相似度计算是考察任意两个给定实体属于同一类的指标测度,相似度越高,表明这两个实体越有可能属于同一语义类别。本文采用相关性聚类对实体并列关系的相似度进行计算。如式(10)~(12)所示

      $$\min \sum {{r_{xy}}w_{xy}^ - + (1 - {r_{xy}})w_{xy}^ + } $$ (10)
      $$w_{xy}^ + = {p_{xy}}$$ (11)
      $$w_{xy}^ - = 1 - {p_{xy}}$$ (12)

      其中:${r_{xy}}$表示$x,y$被分配在同一类中;${p_{x,y}}$表示$x,y$是同一类的概率(即$x,y$之间的相似度);$w_{xy}^ + $$w_{xy}^ - $分别表示切断$x,y$之间的边的代价和保留边的代价。相关性聚类的目标就是使用最小的代价找到一个聚类方案。

      2)实体上下位关系抽取

      实体上下位关系抽取即确定实体的属性。深空探测器的设备采用字符串表示,而字符串又可以理解为一种集合,因此采用Dice系数来度量属性的相似度

      $$si{m_{{\rm Dice}}}(s,t) = \frac{{2|S \cap T|}}{{|S| + |T|}}$$ (13)

      其中:$S$$T$表示集合;$|S|$$|T|$分别表示集合的个数;$|S \cap T|$表示$S$$T$的交集。

      3)本体的生成

      主要任务是对各层次得到的概念进行聚类,并对其进行语义类的标定(为该类中的实体指定一个或多个公共上位词)。

    • 知识推理[18]是指从知识库中已有的实体关系数据出发,进行计算及推理,建立实体间的新关联,从而拓展和丰富知识网络。由于深空环境不确定,多智体深空探测器在着陆过程中可能出现一些突发情况,比如某个智能体节点或者某个系统设备出现故障,或者探测器在运行过程中发现其它星体或者障碍物,此时探测器系统设备或者探测器与其它星体或障碍物之间存在一些隐藏关系,通过进行知识推理可以挖掘出这些隐藏关系,丰富对探测器任务规划的知识,可以实现探测器更好的运行。本文基于张量神经网络(Neural Tensor Network,NTN)[19]进行知识推理,结构如图5所示。

      图  5  NTN神经张量模型结构图

      Figure 5.  Network structure of NTN

    • 对于深空探测器本文以3个节点为基准,每个节点视为一个智能体,每个智能体以相机、数据存储设备、太阳能充电器等设备以及每个设备所处的状态和执行的操作作为实体进行示例构建知识图谱。

      本实验环境为ubuntu18.04,GPU显卡为GeForce GTX 1080,深度学习框架为PyTorch,CUDA10.1。基于GRU的序列模型的超参数如表4所示。Att-BiLSTM的超参数如表5所示。NTN模型的超参数如表6所示。知识提取实验结果如图6所示。

      表 4  GRU序列模型超参数

      Table 4.  GRU sequence model hyperparameters

      超参数大小
      num_seqs100
      hidden_size3
      lr0.01
      batch_size16
      num_epoch100

      表 5  Att-BiLSTM模型超参数

      Table 5.  Att-BiLSTM hyperparameters

      超参数大小
      dropout0.2
      hidden_size30
      lr0.1
      batch_size16
      num_epoch100
      lstm_out_dropout0.2
      att_out_dropout0.2

      表 6  NTN模型超参数

      Table 6.  NTN model hyperparameters

      超参数大小
      Tensor_dim64
      hidden_size30
      Atten_size32
      lr0.001
      batch_size16
      num_epoch100
      dropout_p0.05

      本文以探测器智能体的部分设备进行示例。通过图6可以看出通过知识抽取可以提取出探测器的节点以及节点上的设备如相机、数据存储设备、燃料等实体。

      通过知识提取和知识融合获得的实验结果如表7所示。通过表7可以看出通过采用知识融合对提取的知识进行实体和关系之间的一一对应,例如,可以得到探测器距离着陆点具有1 km,探测器的着陆速度为13.5 m/s等。构建的知识图谱整体结构如图7所示,采用neo4j[20]对知识图谱进行保存,保存格式为json格式。

      图  6  知识提取结果图

      Figure 6.  The result of knowledge extraction

      表 7  多智能体探测器知识融合

      Table 7.  Multi-agent detector knowledge fusion

      实体属性关系
      detectorposition1 km
      detectorvelocity13.5 m/s
      detectoragent1has
      agent1camera1has
      camera1align1is
      camera1target1no

      图  7  多智能体深空探测器任务规划知识图谱示意图

      Figure 7.  Schematic diagram of the knowledge graph of multi-agent deep space detector mission planning

      复杂的约束关系是深空探测器规划知识表示中的重要部分,本文以时间约束为例进行说明。深空探测器的大部分动作都无法瞬时完成,需要持续一定的时间。每个动作在执行过程中都有自己的开始时间、持续时间和结束时间。此外,动作的持续时间会受探测器所处的状态影响,可以将其分为动态时间和静态时间。在构建知识图谱时,将动作的持续时间作为动作的属性,并且静态时间添加标识符“static_taction”,动态时间添加标识符“dynamic_ taction”,对动作持续时间有影响的因素添加标识符“A_effect_action”,其中A表示影响因素,action表示深空探测器的动作。以探测器的姿态转动作为示例,结果如图8所示。

      图  8  姿态转动时间约束示意图

      Figure 8.  Schematic diagram of attitude rotation time constraint

      MA-PDDL采用通常采用一阶逻辑或命题逻辑等形式化语言来描述系统状态,通过状态的迁移来表示动作,在建立探测器的任务规划模型时,采用领域文件和问题文件进行描述。领域文件的定义如图9所示,问题文件的定义如图10所示。

      图  9  领域描述的BNF定义

      Figure 9.  BNF definition of domain description

      图  10  问题描述的BNF定义

      Figure 10.  BNF definition of problem description

      通过图7图9图10进行对比可以看出,MA-PDDL需要人工根据先验知识提前设计出领域文件和问题文件,无法简单、直观的对真实深空环境任务进行表示,而且深空环境存在不确定性,探测器时刻处于动态变化中,当出现意外情况时需要等待地面人工的指导,无法对任务进行实时的、精确的表示。

    • 面对不确定的深空环境和复杂的多智能体深空探测系统,本文构建知识图谱对其进行知识表示。该方法不仅可以全面直观地展示出柔性多智能体之间的关系,而且面对不确定的深空环境,可以通过知识推理自动地挖掘探测器各系统设备之间、探测器与深空环境之间的关系,通过与传统的MA-PDDL方法进行对比,本文提出的方法在不需要地面人工干预的情况下,可以对真实的情况建模,为后续进行任务规划提供了较为精确的知识表示,更有助于探测器进行任务规划,提高探测器成功着陆可能性。此外该方法的知识表示形式存储为json格式,可以灵活地运用于各种任务规划方法中。

参考文献 (20)

目录

    /

    返回文章
    返回