Publications

3 results for Yujun Zhou

Capability-Oriented Training Induced Alignment Risk
- - Yujun Zhou
  - Yue Huang
  - et al.
- 2026
- ICML 2026
Conference paper
ProbeLLM: Automating Principled Diagnosis of LLM Failures
- - Yue Huang
  - Zhengzhe Jiang
  - et al.
- 2026
- ICML 2026
Conference paper
Building a Foundational Guardrail for General Agentic Systems via Synthetic Data
- - Yue Huang
  - Hang Hua
  - et al.
- 2026
- ICLR 2026
Conference paper