Qu Bohao

Research Area

Multi-agent Systems
Reinforcement Learning
Trustworthy AI
Hyperbolic (non-Euclidean) Geometry

Publications

1. Bohao Qu, Xiaofeng Cao, Yi Chang, Ivor W. Tsang, and Yew-Soon Ong, ”Diversifying Policies With Non-Markov Dispersion to Expand the Solution Space,” IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024.

2. Bohao Qu, Xiaofeng Cao, Qing Guo, Yi Chang, Ivor W. Tsang, and Chengqi Zhang, ”Transductive Reward Inference on Graph,” IEEE Transactions on Knowledge and Data Engineering (TKDE), 2024.

3. Bohao Qu, Xiaofeng Cao, Bing Li, Menglin Zhang, Tuan-Anh Vu, Di Lin, Qing Guo, ”Exploiting Geometric Structures for Modelling Multi-Agent Behaviours: A New Thinking,” AAAI 2026 (Oral).

4. Siyuan Guo, Lixin Zou, Hechang Chen, Bohao Qu, Haotian Chi, Philip S. Yu, Yi Chang, ”Sample Efficient Offline-to-Online Reinforcement Learning,” IEEE Transactions on Knowledge and Data Engineering (TKDE), 2024.

5. Jiawei Liu, Xun Gong, Fen Fang, Muli Yang, Bohao Qu, Yunfeng hu, Hong Chen, Xulei Yang, Qing Guo, ”Open-Ended Instruction Realisation with LLM-Enabled Multi-Planner Scheduling in Autonomous Vehicles,” CVPR 2026.

6. Haotian Chi, Zhaogeng Liu, Xing Chen, Bohao Qu, Jifeng Hu, Yuan Jiang, Hechang Chen, ”State Temporal Difference Prediction for Deep Reinforcement Learning,” Pattern Recognition, 2025.

7. Menglin Zhang, Xiaoxin Guo, Bohao Qu, Xiaofeng Cao, Di Lin, Shuifa Sun, Ivor Tsang, Qing Guo, ”PhysLight: Accurate rPPG Heart Rate Measurement with Adaptive Video Relighting,” IEEE International Conference on Multimedia & Expo (ICME), 2025.

8. Kaiyu Wang, Danni Wang, Bohao Qu*, Menglin Zhang, Xianchang Wang, Ximing Li, ”A Multi-agent Deep Reinforcement Learning Method for Fully Noisy Observations,” Engineering Applications of Artificial Intelligence, 2025.

9. Kaiyu Wang, Bohao Qu*, Menglin Zhang, Xianchang Wang, ”SUNRISE: Multi-Agent Reinforcement Learning via Neighbors’ Observations under Fully Noisy Environments,” Expert Systems with Applications, 2025.

10. Zhixiao Sun, Haiyin Piao, Zhen Yang, Yiyang Zhao, Guang Zhan, Deyun Zhou, Guanglei Meng, Hechang Chen, Xing Chen, Bohao Qu and Yuanjie Lu, ”Multi-agent Hierarchical Policy Gradient for Air Combat Tactics Emergence via Self-play,” Engineering Applications of Artificial Intelligence, 2021.

11.Haiyin Piao, Zhixiao Sun, Guanglei Meng, Hechang Chen, Bohao Qu, Kuijun Lang, Yang Sun, Shengqi Yang, Xuanqi Peng, ”Beyond-Visual-Range Air Combat Tactics Auto-Generation by Reinforcement Learning,” IJCNN, 2020.

12. Yang Yu, Bohao Qu*, Xingi Du, Jifeng Hu, Zhejian Yang, Sinuo Zhang, Hechang Chen, ”A Lightweight Data Selection Network for Image Classification via Policy Gradient,” International Conference on Neural Information Processing, 2024."

Research Services

Journal Reviewer: TPAMI, TIP, JAIR, ESWA, EAAI
Conference Reviewer: ICML, KDD, AAAI, ICME