Papers

12094 papers

ICLR2025

What Makes Large Language Models Reason in (Multi-Turn) Code Generation?

Summary pending...

Large language ModelsMulti-turn Code GenerationChain-of-Thought

Paper

ICLR2025

Towards Robust and Parameter-Efficient Knowledge Unlearning for LLMs

Summary pending...

Machine UnlearningLarge Language ModelsLow-rank Adaptation

Paper

ICLR2025

Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions

Summary pending...

Clarifying QuestionsQAAmbiguity

Paper

ICLR2025

GraphEval: A Lightweight Graph-Based LLM Framework for Idea Evaluation

Summary pending...

Idea EvaluationView-graphLightweight model

Paper

ICLR2025

Exact Certification of (Graph) Neural Networks Against Label Poisoning

Summary pending...

graph neural networksrobustnesscertificates

Paper

ICLR2025

A Generalist Hanabi Agent

Summary pending...

Multi-Agent Reinforcement Learning (MARL)Cooperative gameMulti Agent Text-based game

Paper

ICLR2025

Revealing and Mitigating Over-Attention in Knowledge Editing

Summary pending...

model editingmechanistic interpretabilityNLP

Paper

ICLR2025

GEVRM: Goal-Expressive Video Generation Model For Robust Visual Manipulation

Summary pending...

Robot Manipulation; Vision Language Action Model

Paper

ICLR2025

Neural Sampling from Boltzmann Densities: Fisher-Rao Curves in the Wasserstein Geometry

Summary pending...

SamplingBoltzmann densitiesFisher-Rao Curves

Paper

ICLR2025

Lift Your Molecules: Molecular Graph Generation in Latent Euclidean Space

Summary pending...

Drug DesignComputational BiologyMolecule Generation

Paper

ICLR2025

Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective

Summary pending...

text-to-image synthesissemanticsevaluation

Paper

ICLR2025

Correcting the Mythos of KL-Regularization: Direct Alignment without Overoptimization via Chi-Squared Preference Optimization

Summary pending...

Reinforcement Learning TheoryOffline Reinforcement Learningsingle-policy concentrability

Paper

ICLR2025

Protecting against simultaneous data poisoning attacks

Summary pending...

backdoorsbackdoor defensesdata poisoning

Paper

ICLR2025

DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback

Summary pending...

iterative data generationllm agentlifelong learning

Paper

ICLR2025

LIFe-GoM: Generalizable Human Rendering with Learned Iterative Feedback Over Multi-Resolution Gaussians-on-Mesh

Summary pending...

Generalizable human renderingerror feedbackdual representation

Paper

ICLR2025

High-Dimensional Bayesian Optimisation with Gaussian Process Prior Variational Autoencoders

Summary pending...

Variational autoencodersGaussian processesBayesian optimisation

Paper

ICLR2025

RB-Modulation: Training-Free Stylization using Reference-Based Modulation

Summary pending...

Inverse ProblemsGenerative ModelingDiffusion Models

Paper

ICLR2025

From Probability to Counterfactuals: the Increasing Complexity of Satisfiability in Pearl's Causal Hierarchy

Summary pending...

complexitycausal reasoningPearl's Causal Hierarchy

Paper

ICLR2025

RobustKV: Defending Large Language Models against Jailbreak Attacks via KV Eviction

Summary pending...

Jailbreak AttackLarge Language ModelKV cache optimization

Paper

ICLR2025

Beyond Content Relevance: Evaluating Instruction Following in Retrieval Models

Summary pending...

LLMInstruction-FollowingRetrieval Model

Paper