Publications

2 results at MLSys 2024

Flash: Fast Model Adaptation in ML-Centric Cloud Platforms
- - Haoran Qiu
  - Weichao Mao
  - et al.
- 2024
- MLSys 2024
Conference paper
GPU OPTIMIZATIONS FOR EFFICIENT AND COST-EFFECTIVE ACCESS TO DIVERSE LARGE LANGUAGE MODELS IN RESEARCH CLUSTER
- - Chen Wang
  - Yue Zhu
  - et al.
- 2024
- MLSys 2024
Poster