Publications

7 results for Abhishek Bhandwaldar

Rollout Roulette: A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods
- - Isha Puri
  - Shivchander Sudalairaj
  - et al.
- 2025
- NeurIPS 2025
Conference paper
UNVEILING THE SECRET RECIPE: A GUIDE FOR SUPERVISED FINE-TUNING SMALL LLMS
- - Aldo Pareja
  - Nikhil Shivakumar Nayak
  - et al.
- 2025
- ICLR 2025
Conference paper
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets
- - Zhang-wei Hong
  - Aviral Kumar
  - et al.
- 2023
- NeurIPS 2023
Conference paper
The ThreeDWorld Transport Challenge: A Visually Guided Task-and-Motion Planning Benchmark Towards Physically Realistic Embodied AI
- - Chuang Gan
  - Siyuan Zhou
  - et al.
- 2022
- ICRA 2022
Conference paper
ThreeDWorld: A Platform for Interactive Multi-Modal Physical Simulation
- - Chuang Gan
  - Jeremy Schwartz
  - et al.
- 2021
- NeurIPS 2021
Conference paper
OPEn: An Open-ended Physics Environment for Learning Without a Task
- - Chuang Gan
  - Abhishek Bhandwaldar
  - et al.
- 2021
- IROS 2021
Conference paper
AGENT: A Benchmark for Core Psychological Reasoning
- - Tianmin Shu
  - Abhishek Bhandwaldar
  - et al.
- 2021
- ICML 2021
Conference paper