Publications | Yuhan Shen

Yuhan Shen, Ehsan Elhamifar . Understanding Multi-Task Activities from Single-Task Videos. CVPR (highlight), 2025.

PDF Poster Supplementary

Yuhan Shen, Huiyu Wang, Xitong Yang, Matt Feiszli, Ehsan Elhamifar, Lorenzo Torresani, Effrosyni Mavroudi . Learning to Segment Referred Objects from Narrated Egocentric Videos. CVPR (oral), 2024.

PDF Poster Slides Supplementary

Yuhan Shen, Ehsan Elhamifar . Progress-Aware Online Action Segmentation for Egocentric Procedural Task Videos. CVPR, 2024.

PDF Code Poster Supplementary

Yuhan Shen, Linjie Yang, Longyin Wen, Haichao Yu, Ehsan Elhamifar, Heng Wang . Exploring the Role of Audio in Video Captioning. CVPR MULA Workshop, 2024.

PDF Slides Supplementary

Yuhan Shen, Ehsan Elhamifar . Semi-Weakly-Supervised Learning of Complex Actions from Instructional Task Videos. CVPR, 2022.

PDF Code Poster Slides Supplementary

Yuhan Shen, Lu Wang, Ehsan Elhamifar . Learning to Segment Actions from Visual and Language Instructions via Differentiable Weak Sequence Alignment. CVPR (oral), 2021.

PDF Code Poster Slides Supplementary

Kexin He, Yuhan Shen, Wei-Qiang Zhang, Jia Liu . Staged Training Strategy and Multi-Activation for Audio Tagging with Noisy and Sparse Multi-Label Data. ICASSP, 2020.

PDF DOI

Kexin He*, Yuhan Shen*, Wei-Qiang Zhang . Multiple Neural Networks with Ensemble Method for Audio Tagging with Noisy Labels and Minimal Supervision. DCASE Workshop, 2019.

PDF DOI

Yu-Han Shen, Ke-Xin He, Wei-Qiang Zhang . Learning How to Listen: A Temporal-Frequential Attention Model for Sound Event Detection. Interspeech (oral), 2019.

PDF DOI

Ke-Xin He*, Yu-Han Shen*, Wei-Qiang Zhang . Hierarchical Pooling Structure for Weakly Labeled Sound Event Detection. Interspeech, 2019.

PDF DOI

Yu-Han Shen, Ke-Xin He, Wei-Qiang Zhang . SAM-GCNN: A Gated Convolutional Neural Network with Segment-Level Attention Mechanism for Home Activity Monitoring. ISSPIT, 2018.

PDF DOI