Publications

Combining Domain and Alignment Vectors Provides Better Knowledge-Safety Trade-offs in LLMs
- - Megh Thakkar
  - Quentin Fournier
  - et al.
- 2025
- ACL 2025
R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory
- - Tenghao Huang
  - Kinjal Basu
  - et al.
- 2025
- ACL 2025
DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation
- - Eliya Habba
  - Ofir Arviv
  - et al.
- 2025
- ACL 2025
BI-Bench : A Comprehensive Benchmark Dataset and Unsupervised Evaluation for BI Systems
- - Ankush Gupta
  - Aniya Aggarwal
  - et al.
- 2025
- ACL 2025
REAL-MM-RAG: A Real-World Multi-Modal Retrieval Benchmark
- - Navve Wasserman
  - Roi Pony
  - et al.
- 2025
- ACL 2025
Conceptual Diagnostics for Knowledge Graphs and Large Language Models
- - Rosario Uceda-Sosa
  - Maria Chang
  - et al.
- 2025
- ACL 2025
A Perspective on LLM Data Generation with Few-shot Examples: from Intent to Kubernetes Manifest
- - Antonino Angi
  - Liubov Nedoshivina
  - et al.
- 2025
- ACL 2025
EpMAN: Episodic Memory AttentioN for Generalizing to Longer Contexts
- - SUBHAJIT CHAUDHURY
  - Payel Das
  - et al.
- 2025
- ACL 2025
MTRAG: A Multi-Turn Conversational Benchmark for Evaluating Retrieval-Augmented Generation Systems
- - Yannis Katsis
  - Sara Rosenthal
  - et al.
- 2025
- ACL 2025
Multi-Sense Embeddings for Language Models and Knowledge Distillation
- - Qitong Wang
  - Mohammed Zaki
  - et al.
- 2025
- ACL 2025