Publications

31 results at ACL 2025

JuStRank: Benchmarking LLM Judges for System Ranking
- - Ariel Gera
  - Odellia Boni
  - et al.
- 2025
- ACL 2025
Conference paper
Generating OpenAPI Specifications from Online API Documentation with Large Language Models
- - Koren Lazar
  - Matan Vetzler
  - et al.
- 2025
- ACL 2025
Conference paper
Think Again! The Effect of Test-Time Compute on Preferences, Opinions, and Beliefs of Large Language Models
- - George Kour
  - Itay Nakash
  - et al.
- 2025
- ACL 2025
Conference paper
NGQA: A Nutritional Graph Question Answering Benchmark for Personalized Health-aware Nutritional Reasoning
- - Zheyuan Zhang
  - Yiyang Li
  - et al.
- 2025
- ACL 2025
Conference paper
ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries
- - Kishan Maharaj
  - Vitobha Munigala
  - et al.
- 2025
- ACL 2025
Conference paper
The Nature of NLP: Analyzing Contributions in NLP Papers
- - Aniket Pramanick
  - Yufang Hou
  - et al.
- 2025
- ACL 2025
Conference paper
R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory
- - Tenghao Huang
  - Kinjal Basu
  - et al.
- 2025
- ACL 2025
Conference paper
Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation
- - Shivalika Singh
  - Angelika Romanou
  - et al.
- 2025
- ACL 2025
Conference paper
A Perspective on LLM Data Generation with Few-shot Examples: from Intent to Kubernetes Manifest
- - Antonino Angi
  - Liubov Nedoshivina
  - et al.
- 2025
- ACL 2025
Conference paper
Combining Domain and Alignment Vectors Provides Better Knowledge-Safety Trade-offs in LLMs
- - Megh Thakkar
  - Quentin Fournier
  - et al.
- 2025
- ACL 2025
Conference paper