Publications | Sigma Lab

2026

CVPR

SplitFlux: Learning to Decouple Content and Style from a Single Image

Yitong Yang, Yinglin Wang, Changshuo Wang, Yongjun Zhang, Ziyang Chen, and Shuting He

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2026

Corresponding author

PDF
TIFS

Transferable Adversarial Attack on Referring Video Object Segmentation

Meiwen Ding, Song Xia, Yi Yu, Shuting He, and Xudong Jiang

IEEE Transactions on Information Forensics and Security (TIFS), 2026

PDF
ICLR

Quadratic Direct Forecast for Training Multi-Step Time-Series Forecast Models

Hao Wang, Licheng Pan, Yuan Lu, Zhichao Chen, Tianqiao Liu, Shuting He, Zhixuan Chu, Qingsong Wen, Haoxuan Li, and Zhouchen Lin

In International Conference on Learning Representations (ICLR), 2026

PDF Code
ICLR

DistDF: Time-Series Forecasting Needs Joint-Distribution Wasserstein Alignment

Hao Wang, Licheng Pan, Yuan Lu, Zhixuan Chu, Xiaoxi Li, Shuting He, Zhichao Chen, Haoxuan Li, Qingsong Wen, and Zhouchen Lin

In International Conference on Learning Representations (ICLR), 2026

PDF Code
AAAI

FantasyStyle: Controllable Stylized Distillation for 3D Gaussian Splatting

Yitong Yang, Yinglin Wang, Changshuo Wang, Huajie Wang, and Shuting He

In AAAI Conference on Artificial Intelligence (AAAI), 2026

Corresponding author

PDF Code
IJCV

GREx: Generalized Referring Expression Segmentation, Comprehension, and Generation

Henghui Ding, Chang Liu, Shuting He, Xudong Jiang, and Yu-Gang Jiang

International Journal of Computer Vision (IJCV), 2026

Corresponding author

PDF

2025

TPAMI

MeViS: A Multi-Modal Dataset for Referring Motion Expression Video Segmentation

Henghui Ding, Chang Liu, Shuting He, Kaining Ying, Xudong Jiang, Chen Change Loy, and Yu-Gang Jiang

IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

Corresponding author

PDF Code
ICML

ReferSplat: Referring Segmentation in 3D Gaussian Splatting

Shuting He, Guangquan Jie, Changshuo Wang, Yun Zhou, Shuming Hu, Guanbin Li, and Henghui Ding

In International Conference on Machine Learning ( ICML ), 2025

Oral, Acceptance Rate 1.0%

PDF Code
NeurIPS

Reasoning Beyond Points: A Visual Introspective Approach for Few-Shot 3D Segmentation

Changshuo Wang, Shuting He, Xiang Fang, Zhijian Hu, Jia-Hong Huang, Yixian Shen, and Prayag Tiwari

In Annual Conference on Neural Information Processing Systems ( NeurIPS ), 2025

PDF Code
NeurIPS

Iterative Missing Data Imputation with Model Form Adaptation and Non-Missing Feature Supervision

Hao Wang, Zhengnan Li, Zhichao Chen, Xu Chen, Shuting He, Guangyi Liu, Haoxuan Li, and Zhouchen Lin

In Annual Conference on Neural Information Processing Systems ( NeurIPS ), 2025

PDF Code
ACM MM

Prompt-Softbox-Prompt: A Free-Text Embedding Control for Image Editing

Yitong Yang, Yinglin Wang, Tian Zhang, Jing Wang, and Shuting He

In ACM International Conference on Multimedia ( ACM MM ), 2025

Corresponding author

PDF Code
ACM MM

Seeing the Overlooked: Bio-Visual Inspired Weak Saliency Feedback Transformer for Person Re-identification

Changshuo Wang, Shuting He, Xiang Fang, Fangzhe Nan, and Prayag Tiwari

In ACM International Conference on Multimedia ( ACM MM ), 2025

PDF
ACM MM

HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation

Weihuang Lin, Yiwei Ma, Xiaoshuai Sun, Shuting He, Jiayi Ji, Liujuan Cao, and Rongrong Ji

In ACM International Conference on Multimedia ( ACM MM ), 2025

PDF
ICCV

GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding

Zijun Lin, Shuting He, Cheston Tan, and Bihan Wen

In IEEE International Conference on Computer Vision (ICCV), 2025

PDF
ICCV

SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation

Shiqi Huang, Shuting He, Huaiyuan Qin, and Bihan Wen

In IEEE International Conference on Computer Vision (ICCV), 2025

Highlight, Acceptance Rate 5.0%

PDF Code
SIGIR

GlFoMR: A Glance-then-Focus Multimodal Reasoning Framework for Diagram Question Answering Number

Yaxian Wang, Bifan Wei, Jun Liu, Lingling Zhang, Shuting He, Jun Li, and Qika Lin

In International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

PDF
CVPR

Point Clouds Meets Physics: Dynamic Acoustic Field Fitting Network for Point Cloud Understanding

Changshuo Wang, Shuting He, Xiang Fang, Jiawei Han, Zhonghang Liu, Xin Ning, Weijun Li, and Prayag Tiwari

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025

PDF
AAAI

ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation

Shiqi Huang, Shuting He, and Bihan Wen

In AAAI Conference on Artificial Intelligence (AAAI), 2025

PDF Code
AAAI

Taylor Series-Inspired Local Structure Fitting Network for Few-shot Point Cloud Semantic Segmentation

Changshuo Wang, Shuting He, Xiang Fang, Meiqing Wu, Siew Kei Lam, and Prayag Tiwari

In AAAI Conference on Artificial Intelligence (AAAI), 2025

PDF Code
AAAI

Hierarchical Alignment-enhanced Adaptive Grounding Network for Generalized Referring Expression Comprehension

Yaxian Wang, Henghui Ding, Shuting He, Xudong Jiang, Bifan Wei, and Jun Liu

In AAAI Conference on Artificial Intelligence (AAAI), 2025

PDF
CVPRW

PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild

Henghui Ding, Chang Liu, Nikhila Ravi, Shuting He, Yunchao Wei, Song Bai, and Philip Torr

In IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2025

PDF
TIFS

Looking Clearer with Text: A Hierarchical Context Blending Network for Occluded Person Re-Identification

Changshuo Wang, Shuting He, Meiqing Wu, Siew-Kei Lam, Prayag Tiwari, and Xingyu Gao

IEEE Transactions on Information Forensics and Security (TIFS), 2025

PDF

2024

CVPR

Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation

Shuting He and Henghui Ding

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024

PDF Code
ECCV

SegPoint: Segment Any Point Cloud via Large Language Model

Shuting He and Henghui Ding

In European Conference on Computer Vision ( ECCV ), 2024

PDF Code
ACM MM

RefMask3D: Language-Guided Transformer for 3D Referring Segmentation

Shuting He and Henghui Ding

In ACM International Conference on Multimedia ( ACM MM ), 2024

PDF Code
CVPR

Context-Aware Integration of Language and Visual References for Natural Language Tracking

Yanyan Shao, Shuting He, Qi Ye, Yuchao Feng, Wenhan Luo, and Jiming Chen

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2024

PDF Code
ACM MM

Dual-head Genre-instance Transformer Network for Arbitrary Style Transfer

Meichen Liu, Shuting He, Songnan Lin, and Bihan Wen

In ACM International Conference on Multimedia ( ACM MM ), 2024

PDF
ECCVW

1st Place Solution to VISDA-2020: Bias Elimination for Domain Adaptive Pedestrian Re-Identification

Jianyang Gu, Hao Luo, Weihua Chen, Yiqi Jiang, Yuqi Zhang, Shuting He, Fan Wang, Hao Li, and Wei Jiang

In European Conference on Computer Vision Workshops (ECCVW), 2024

PDF Code
TIP

VGSG: Vision-Guided Semantic-Group Network for Text-based Person Search

Shuting He, Hao Luo, Wei Jiang, Xudong Jiang, and Henghui Ding

IEEE Transactions on Image Processing (TIP), 2024

PDF
TIFS

Region Generation and Assessment Network for Occluded Person Re-Identification

Shuting He, Weihua Chen, Kai Wang, Hao Luo, Fan Wang, Wei Jiang, and Henghui Ding

IEEE Transactions on Information Forensics and Security (TIFS), 2024

PDF
RS

Leveraging Mixed Data Sources for Enhanced Road Segmentation in Synthetic Aperture Radar Images

Tian Lan, Shuting He, Yuanyuan Qing, and Bihan Wen

Remote Sensing (RS), 2024

PDF

2023

CVPR

Primitive Generation and Semantic-related Alignment for Universal Zero-Shot Segmentation

Shuting He, Henghui Ding, and Wei Jiang

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023

PDF Code
CVPR

Semantic-Promoted Debiasing and Background Disambiguation for Zero-Shot Instance Segmentation

Shuting He, Henghui Ding, and Wei Jiang

In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2023

PDF
ICCV

MOSE: A New Dataset for Video Object Segmentation in Complex Scenes

Henghui Ding, Chang Liu, Shuting He, Xudong Jiang, Philip H. S. Torr, and Song Bai

In IEEE International Conference on Computer Vision (ICCV), 2023

PDF Code
ICCV

MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions

Henghui Ding, Chang Liu, Shuting He, Xudong Jiang, and Chen Change Loy

In IEEE International Conference on Computer Vision (ICCV), 2023

PDF Code
TIP

Prototype Adaption and Projection for Few- and Zero-shot 3D Point Cloud Semantic Segmentation

Shuting He, Xudong Jiang, Wei Jiang, and Henghui Ding

IEEE Transactions on Image Processing (TIP), 2023

PDF Code

2022

T-ITS

Transformer-Based Domain-Specific Representation for Unsupervised Domain Adaptive Vehicle Re-Identification

Ran Wei, Jianyang Gu, Shuting He, and Wei Jiang

IEEE Transactions on Intelligent Transportation Systems (T-ITS), 2022

PDF

2021

ICCV

TransReID: Transformer-based Object Re-Identification

Shuting He, Hao Luo, Pichao Wang, Fan Wang, Hao Li, and Wei Jiang

In IEEE International Conference on Computer Vision (ICCV), 2021

PDF Code
CVPRW

An Empirical Study of Vehicle Re-Identification on the AI City Challenge

Hao Luo, Weihua Chen, Xianzhe Xu, Jianyang Gu, Yuqi Zhang, Chong Liu, Yiqi Jiang, Shuting He, and Fan Wang

In IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2021

PDF Code

2020

CVPRW

Multi-domain Learning and Identity Mining for Vehicle Re-Identification

Shuting He, Hao Luo, Weihua Chen, Miao Zhang, Yuqi Zhang, Fan Wang, Hao Li, and Wei Jiang

In IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), 2020

PDF Code