黄华
发明人: 王立志,张茂清,黄华
申请人: 北京理工大学
申请号: 202410047454.8
申请日期: 2024.01.12
摘要: 本发明公开的一种基于物理的滤光片设计及光谱成像方法,属于光谱成像技术领域。本发明实现方法为:从多层介质干涉原理出发,建立基于物理约束的滤光片模型,将滤光片的透过率参数化地表示为膜系厚度的函数。通过光谱成像系统成像过程模型,描述光谱图像被光谱成像系统捕获的前向过程。通过滤光片的结构参数和光谱重建网络的 ...
发明人: 张磊,郭晨帆,黄华
申请人: 北京理工大学
申请号: 202410278955.7
申请日期: 2024.03.12
摘要: 本发明公开一种基于课堂场景关系图的教学行为识别方法,属于行为识别技术领域。本发明基于Faster R‑CNN目标检测器,构建输入RGB课堂视频对应的课堂场景关系图,并以先空间维度后时间维度和先时间维度后空间维度这两种互补的方式,对课堂场景关系图中各种关系变化进行信息聚合,得到课堂场景关系图特征;基于 ...
作者: Zhu, Lin1; Chen, Xianzhang1; Wang, Xiao3; Huang, Hua1, 2
出处: 38th AAAI Conference on Artificial Intelligence, AAAI 2024 Vancouver, BC, Canada 2024
会议录: Vol.38 No.7 7757-7765
作者: 肖泽宇,熊志伟,王立志,黄华 (中国科学技术大学信息科学技术学院脑启发智能感知与认知教育部重点实验室;北京理工大学计算机学院;北京师范大学人工智能学院)
出处: Laser & Optoelectronics Progress 2024 第61卷 第16期
关键词: 光场;光场图像重建;光场图像增强;深度学习
摘要: 光场能够完整捕捉三维空间中的光线信息,记录光线在不同位置和方向上的强度,这一特性使其能够精准地感知复杂动态环境,在生命科学、工业检测和虚拟现实等领域中有巨大的研究价值和应用潜力。在光场的拍摄、处理和传输过程中,由于设备限制和外部影响因素如物体运动、噪声、低光照和恶劣天气,光场图像往往存在失真和降质, ...
作者: Zhu, Lin1; Jia, Kangmin1; Zhao, Yifan2; Qi, Yunshan2; Wang, Lizhi1; Huang, Hua1, 3 (1Beijing Institute of Technology, China;2Beihang University, China;3Beijing Normal University, China)
出处: arXiv 2024
作者: Zhu, Lin1; Chen, Xianzhang1; Wang, Xiao3; Huang, Hua1, 2 (1School of Computer Science and Technology, Beijing Institute of Technology, China;2School of Artificial Intelligence, Beijing Normal University, China;3School of Computer Science and Technology, Anhui University, China)
出处: arXiv 2024
作者: Zhang, Pengjie1; Zhu, Lin1; Wang, Lizhi1; Huang, Hua1 (1Beijing Institute of Technology, Beijing Normal University, China)
出处: arXiv 2024
发明人: 黄华,赵天琦
申请人: 北京理工大学
申请号: 202310807921.8
申请日期: 2023.07.03
摘要: 一种基于元学习的语音驱动个性化人脸模型生成方法,属于多模态视觉生成领域。通过分层次学习整体映射与个人说话风格,采用两阶段的训练方案:在元学习阶段,根据大量数据学习语音特征与人脸模型变形的整体映射;在微调阶段,通过少量样本在元学习阶段所得的整体映射上进行个性化训练,快速适应目标人的说话风格。利用自监督 ...
发明人: 朱林,陈现章,王立志,张磊,黄华
申请人: 北京理工大学
申请号: 202311242487.X
申请日期: 2023.09.25
摘要: 本发明公开一种基于脉冲神经网络的目标分割方法与系统,属于目标分割领域。本发明通过事件脉冲转换关系将连续的事件脉冲流转化为适配脉冲神经网络的输入表示;通过脉冲神经元提取信息并记忆过去特征,提高目标分割模型对连续事件脉冲输入的特征提取能力,并降低能量消耗;通过时空特征聚合模块融合多时间步长特征,提高目标 ...
发明人: 黄华,王同博
申请人: 北京理工大学
申请号: 202311160733.7
申请日期: 2023.09.08
摘要: 本发明公开的一种基于未来特征自监督学习的流式感知方法,属于计算机视觉领域。本发明实现方法为:构建未来特征自监督学习的流式感知模型,流式感知模型简称为FFSSL模型。FFSSL模型包括StreamYOLO子模型、YOLOX子模型、自监督模块。利用未来帧的外观特征来增强流式感知的性能,提高FFSSL模型 ...