Publications

81 results for Elizabeth Daly

Auto-BenchmarkCard: Automated Synthesis of Benchmark Documentation
- - Aris Hofmann
  - Inge Vejsbjerg
  - et al.
- 2026
- AAAI 2026
Demo paper
Risk Atlas Nexus: A System for Managing AI Risks
- - Inge Vejsbjerg
  - Rahul Nair
  - et al.
- 2026
- AAAI 2026
Demo paper
Who Sees the Risk? Stakeholder Conflicts and Explanatory Policies in LLM-based Risk Assessment
- - Srishti Yadav
  - Jasmina Gajcin
  - et al.
- 2026
- AAAI 2026
Workshop paper
BenchmarkCards: Standardized Documentation for Large Language Model Benchmarks
- - Anna Sokol
  - Elizabeth Daly
  - et al.
- 2025
- NeurIPS 2025
Conference paper
FactReasoner: A Probabilistic Approach to Long-Form Factuality Assessment for Large Language Models
- - Radu Marinescu
  - Debarun Bhattacharjya
  - et al.
- 2025
- EMNLP 2025
Paper
Synthetic Data for Evaluation: Supporting LLM-as-a-Judge Workflows with EvalAssist
- - Elizabeth Daly
  - Erik Miehling
  - et al.
- 2025
- EMNLP 2025
Demo paper
Optimistic Exploration for Risk-Averse Constrained Reinforcement Learning
- - Radu Marinescu
  - Elizabeth Daly
  - et al.
- 2025
- ECAI 2025
Conference paper
Localizing Persona Representations in LLMs
- - Celia Cintas
  - Miriam Rateike
  - et al.
- 2025
- AIES 2025
Conference paper
Localizing Persona Representations in LLMs
- - Celia Cintas
  - Miriam Rateike
  - et al.
- 2025
- COLM 2025
Workshop paper
EvalAssist: Insights on Task-Specific Evaluations and AI-assisted Judgement Strategy Preferences
- - Zahra Ashktorab
  - Michael Desmond
  - et al.
- 2025
- UIST 2025
Conference paper