Publications

90 results for Prasanna Sattigeri

Multi-component Causal Tracing in Large Language Models
- - Zirui Yan
  - Dennis Wei
  - et al.
- 2026
- ACL 2026
Conference paper
Building a Foundational Guardrail for General Agentic Systems via Synthetic Data
- - Yue Huang
  - Hang Hua
  - et al.
- 2026
- ICLR 2026
Conference paper
When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails
- - Manish Nagireddy
  - Inkit Padhi
  - et al.
- 2025
- AIES 2025
Conference paper
Multi-Level Explanations for Generative Language Models
- - Lucas Monteiro Paes
  - Dennis Wei
  - et al.
- 2025
- ACL 2025
Conference paper
Granite Guardian: Comprehensive LLM Safeguarding
- - Inkit Padhi
  - Manish Nagireddy
  - et al.
- 2025
- NAACL 2025
Conference paper
Contextual Value Alignment
- - Kush Varshney
  - Miao Liu
  - et al.
- 2025
- ICASSP 2025
Conference paper
The RealHumanEval: Evaluating Large Language Models’ Abilities to Support Programmers
- - Hussein Mozannar
  - Valerie Chen
  - et al.
- 2025
- TMLR
Paper
Large Language Model Confidence Estimation via Black-Box Access
- - Tejaswini Pedapati
  - Amit Dhurandhar
  - et al.
- 2025
- TMLR
Paper
Interventional Causal Discovery in a Mixture of DAGs
- - Burak Varici
  - Dmitriy Katz-Rogozhnikov
  - et al.
- 2024
- NeurIPS 2024
Conference paper
Graph-based Uncertainty Metrics for Long-form Language Model Generations
- - Mingjian Jiang
  - Yangjun Yangjun
  - et al.
- 2024
- NeurIPS 2024
Conference paper