Publications

3 results for Nina Shvetsova

What When and Where? Self-Supervised Spatio Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions
- - Brian Chen
  - Nina Shvetsova
  - et al.
- 2024
- CVPR 2024
Conference paper
C2KD: Cross-Lingual Cross-Modal Knowledge Distillation for Multilingual Text-Video Retrieval
- - Andrew Rouditchenko
  - Yung-Sung Chuang
  - et al.
- 2023
- ICASSP 2023
Conference paper
Everything at Once - Multi-modal Fusion Transformer for Video Retrieval
- - Nina Shvetsova
  - Brian Chen
  - et al.
- 2022
- CVPR 2022
Conference paper