hqhQAQ

Hi there 👋

About Me

I am Qihan Huang, a final-year Ph.D student in College of Computer Science and Technology, Zhejiang University. Prior to this, I earned a Bachelor's degree in Software Engineering from Zhejiang University in 2021. During 2024 to 2025, I had a long-term research internship at Alibaba Group, focusing on multimodal large language models and image generation.

Currently, my research interest lies in reinforcement learning for MLLMs.

Publications

Reinforcement Learning for MLLMs

ICCV 2025 Boosting MLLM Reasoning with Text-Debiased Hint-GRPO, Qihan Huang, Weilong Dai, Jinlong Liu, et al.

Multimodal Generation

AAAI 2025 Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation, Qihan Huang, Siming Fu, Jinlong Liu, et al.
CVPR 2025 PatchDPO: Patch-level DPO for Finetuning-free Personalized Image Generation, Qihan Huang, Weilong Dai, Jinlong Liu, et al.
ICLR 2025 MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance, Xierui Wang, Siming Fu, Qihan Huang, et al.

Multimodal Alignment

NeurIPS 2024 LG-CAV: Train Any Concept Activation Vector with Language Guidance, Qihan Huang, Jie Song, Mengqi Xue, et al.
AAAI 2024 On the Concept Trustworthiness in Concept Bottleneck Models, Qihan Huang, Jie Song, Haofei Zhang, et al.
ICCV 2023 Evaluation and Improvement of Interpretability for Self-Explainable Part-Prototype Networks, Qihan Huang, Mengqi Xue, Wenqi Huang, et al.
IJCAI 2024 ProtoPFormer: Concentrating on Prototypical Parts in Vision Transformers for Interpretable Image Recognition, Mengqi Xue, Qihan Huang, Haofei Zhang, et al.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

hqhQAQ

Achievements