ICML 2025 Thursday 07/17

Timezone: America/Vancouver

Full Schedule Sun 7/13 Mon 7/14 Tue 7/15 Wed 7/16 Thu 7/17 Fri 7/18 Sat 7/19

Meetup

ICML Lounge Area

7:30 AM - 5:00 PM

This meeting room is for ICML delegates to relax and recharge in a comfortable environment.

... more

Registration Desk

What to optimize for – from robot arms to frontier AI - Anca Dragan

Anca Dragan

8:30 AM - 9:30 AM

How to move losses down, and rewards and metrics up: from a robot’s arm motion in my PhD, to the policy of a virtual assistant or of a self-driving car in my Berkeley lab and at Waymo later, to the Gemini model today at Google DeepMind, that’s been the name of the game. But throughout it all, what I cared about more was what those losses/rewards/metrics ought to be in the first place. What started as an intuition in grad school – that what to optimize was the deeper and harder question than how to optimize – became a central pursuit when I became faculty, as my lab and I sought to understand the ins and outs of how agents can accomplish what we want without unintended side effects. Now at the heart of frontier AI development, that experience is coming in handy as we work to make Gemini a useful and safe collaborator for humanity.

... more

Speaker Bio

Anca Dragan co-leads post training for Gemini and heads AI safety and alignment at Google DeepMind. She is on leave from UC Berkeley, where is an associate professor in Electrical Engineering and Computer Science and runs the InterACT lab. Anca obtained her PhD at Carnegie Mellon in the Robotics Institute in 2015. She has been honored by several career awards and spotlights, including the Presidential Early Career Award for Scientists and Engineers, and the Sloan fellowship.

... more

Exhibit Hall

Exhibits

9:30 AM - 1:00 PM

Oral

Oral 5A Safety and Security

10:00 AM - 11:00 AM

4 Events in this session

STAIR: Improving Safety Alignment with Introspective Reasoning

Yichi Zhang · Siyuan Zhang · Yao Huang · Zeyu Xia · Zhengwei Fang · Xiao Yang · Ranjie Duan · Dong Yan · Yinpeng Dong · Jun Zhu

AutoAdvExBench: Benchmarking Autonomous Exploitation of Adversarial Example Defenses

Nicholas Carlini · Edoardo Debenedetti · Javier Rando · Milad Nasr · Florian Tramer

Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards

Yangsibo Huang · Milad Nasr · Anastasios Angelopoulos · Nicholas Carlini · Wei-Lin Chiang · Christopher A. Choquette Choo · Daphne Ippolito · Matthew Jagielski · Katherine Lee · Ken Ziyu Liu · Ion Stoica · Florian Tramer · Chiyuan Zhang

Model Immunization from a Condition Number Perspective

Amber Yijia Zheng · Cedar Site Bai · Brian Bullins · Raymond A. Yeh

Go to Event Page

Oral

Oral 5E Learning Theory

10:00 AM - 11:00 AM

4 Events in this session

Statistical Query Hardness of Multiclass Linear Classification with Random Classification Noise

Ilias Diakonikolas · Mingchen Ma · Lisheng Ren · Christos Tzamos

All-Purpose Mean Estimation over R: Optimal Sub-Gaussianity with Outlier Robustness and Low Moments Performance

Jasper Lee · Walter McKelvie · Maoyuan Song · Paul Valiant

A Generalization Result for Convergence in Learning-to-Optimize

Michael Sucker · Peter Ochs

Theoretical Limitations of Ensembles in the Age of Overparameterization

Niclas Dern · John Cunningham · Geoff Pleiss

Go to Event Page

Oral

Oral 5B Deep Learning Algorithms

10:00 AM - 11:00 AM

4 Events in this session

DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs

Jongwoo Ko · Tianyi Chen · Sungnyun Kim · Tianyu Ding · Luming Liang · Ilya Zharkov · Se-Young Yun

ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $\alpha$-$\beta$-Divergence

Guanghui Wang · Zhiyong Yang · Zitai Wang · Shi Wang · Qianqian Xu · Qingming Huang

Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning

Fangwen Wu · Lechao Cheng · Shengeng Tang · Xiaofeng Zhu · Chaowei Fang · Dingwen Zhang · Meng Wang

From Weight-Based to State-Based Fine-Tuning: Further Memory Reduction on LoRA with Parallel Control

Chi Zhang · REN Lianhai · Jingpu Cheng · Qianxiao Li

Go to Event Page

Oral

Oral 5C Probablistic Models

10:00 AM - 11:00 AM

4 Events in this session

Rényi Neural Processes

Xuesong Wang · He Zhao · Edwin V. Bonilla

A Unified Framework for Entropy Search and Expected Improvement in Bayesian Optimization

Nuojin Cheng · Leonard Papenmeier · Stephen Becker · Luigi Nardi

Score Matching with Missing Data

Josh Givens · Song Liu · Henry Reeve

Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs

Jie Hu · Yi-Ting Ma · Do-Young Eun

Go to Event Page

Oral

Oral 5D Applications in Math and Physics

10:00 AM - 11:00 AM

4 Events in this session

The dark side of the forces: assessing non-conservative force models for atomistic machine learning

Filippo Bigi · Marcel Langer · Michele Ceriotti

LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models

Parshin Shojaee · Ngoc Hieu Nguyen · Kazem Meidani · Amir Barati Farimani · Khoa Doan · Chandan Reddy

Neural Discovery in Mathematics: Do Machines Dream of Colored Planes?

Konrad Mundinger · Max Zimmer · Aldo Kiem · Christoph Spiegel · Sebastian Pokutta

Machine Learning meets Algebraic Combinatorics: A Suite of Datasets Capturing Research-level Conjecturing Ability in Pure Mathematics

Herman Chau · Helen Jenne · Davis Brown · Jesse He · Mark Raugas · Sara Billey · Henry Kvinge

Go to Event Page

Mentorship

Science Communication 101: How to write an elevator pitch for your research

Julien Besset

11:00 AM - 12:00 PM

Science communication skills are often lacking from academic programs, but knowing how to explain your research effectively will help you when presenting it to your peers, performing in a job interview, or soliciting funding for a project. This hands-on session will give you practical tips and exercises to craft a short, effective and accessible overview of your work for a wide range of audiences and applications.

... more

Poster

Poster Session 5 West

11:00 AM - 1:30 PM

217 Events in this session

Disentangling and Integrating Relational and Sensory Information in Transformer Architectures

Awni Altabaa · John Lafferty

Predicting mutational effects on protein binding from folding energy

Arthur Deng · Karsten Householder · Fang Wu · K. Garcia · Brian Trippe

SpikF: Spiking Fourier Network for Efficient Long-term Prediction

Wenjie Wu · Dexuan Huo · Hong Chen

Local Pan-privacy for Federated Analytics

Vitaly Feldman · Audra McMillan · Guy Rothblum · Kunal Talwar

The Lock-in Hypothesis: Stagnation by Algorithm

Tianyi Qiu · Zhonghao He · Tejasveer Chugh · Max Kleiman-Weiner

EgoPrivacy: What Your First-Person Camera Says About You?

Yijiang Li · Genpei Zhang · Jiacheng Cheng · Yi Li · Xiaojun Shan · Dashan Gao · Jiancheng Lyu · Yuan Li · Ning Bi · Nuno Vasconcelos

EnIGMA: Interactive Tools Substantially Assist LM Agents in Finding Security Vulnerabilities

Talor Abramovich · Meet Udeshi · Minghao Shao · Kilian Lieret · Haoran Xi · Kimberly Milner · Sofija Jancheska · John Yang · Carlos Jimenez · Farshad Khorrami · Prashanth Krishnamurthy · Brendan Dolan-Gavitt · Muhammad Shafique · Karthik Narasimhan · Ramesh Karri · Ofir Press

Improving Generalization with Flat Hilbert Bayesian Inference

Tuan Truong · Quyen Tran · Ngoc Quan Pham · Nhat Ho · Dinh Phung · Trung Le

Ranked from Within: Ranking Large Multimodal Models Without Labels

Weijie Tu · Weijian Deng · Dylan Campbell · Yu Yao · Jiyang Zheng · Tom Gedeon · Tongliang Liu

Eliciting Language Model Behaviors with Investigator Agents

Xiang Li · Neil Chowdhury · Daniel Johnson · Tatsunori Hashimoto · Percy Liang · Sarah Schwettmann · Jacob Steinhardt

Monte Carlo Tree Search for Comprehensive Exploration in LLM-Based Automatic Heuristic Design

Zhi Zheng · Zhuoliang Xie · Zhenkun Wang · Bryan Hooi

Exponential Family Variational Flow Matching for Tabular Data Generation

Andres Guzman Cordero · Floor Eijkelboom · Jan-Willem van de Meent

Quantum Speedup for Hypergraph Sparsification

Chenghua Liu · Minbo Gao · Zhengfeng Ji · Ying

Phase transitions for the existence of unregularized M-estimators in single index models

Takuya Koriyama · Pierre C Bellec

Learning With Multi-Group Guarantees For Clusterable Subpopulations

Jessica Dai · Nika Haghtalab · Eric Zhao

Minimax Optimal Regret Bound for Reinforcement Learning with Trajectory Feedback

Zihan Zhang · Yuxin Chen · Jason Lee · Simon Du · Ruosong Wang

General agents need world models

Jonathan Richens · Tom Everitt · David Abel

De-coupled NeuroGF for Shortest Path Distance Approximations on Large Terrain Graphs

Samantha Chen · Pankaj Agarwal · Yusu Wang

Reinforcement Learning with Random Time Horizons

Enric Borrell · Lorenz Richter · Christof Schuette

RepoAudit: An Autonomous LLM-Agent for Repository-Level Code Auditing

Jinyao Guo · Chengpeng Wang · Xiangzhe Xu · Zian Su · Xiangyu Zhang

OV-MER: Towards Open-Vocabulary Multimodal Emotion Recognition

Zheng Lian · Haiyang Sun · Licai Sun · Haoyu Chen · Lan Chen · Hao Gu · Zhuofan Wen · Shun Chen · Zhang Siyuan · Hailiang Yao · Bin Liu · Rui Liu · Shan Liang · Ya Li · Jiangyan Yi · Jianhua Tao

Adaptive Flow Matching for Resolving Small-Scale Physics

Stathi Fotiadis · Noah Brenowitz · Tomas Geffner · Yair Cohen · Michael Pritchard · Arash Vahdat · Morteza Mardani

Zebra: In-Context Generative Pretraining for Solving Parametric PDEs

Louis Serrano · Armand Kassaï Koupaï · Thomas Wang · Pierre ERBACHER · patrick gallinari

Compositional Flows for 3D Molecule and Synthesis Pathway Co-design

Tony Shen · Seonghwan Seo · Ross Irwin · Kieran Didi · Simon Olsson · Woo Youn Kim · Martin Ester

Geometric and Physical Constraints Synergistically Enhance Neural PDE Surrogates

Yunfei Huang · David S. Greenberg

Flexibility-conditioned protein structure design with flow matching

Vsevolod Viliuga · Leif Seute · Nicolas Wolf · Simon Wagner · Arne Elofsson · Jan Stuehmer · Frauke Gräter

All-atom Diffusion Transformers: Unified generative modelling of molecules and materials

Chaitanya Joshi · Xiang Fu · Yi-Lun Liao · Vahe Gharakhanyan · Benjamin Kurt Miller · Anuroop Sriram · Zachary Ulissi

Closed-form Solutions: A New Perspective on Solving Differential Equations

Shu Wei · Yanjie Li · Lina Yu · Weijun Li · Min Wu · Linjun Sun · Jingyi Liu · Hong Qin · Deng Yusong · Jufeng Han · Yan Pang

Reinforcement Learning for Quantum Control under Physical Constraints

Jan Ole Ernst · Aniket Chatterjee · Tim Franzmeyer · Axel Kuhn

GenMol: A Drug Discovery Generalist with Discrete Diffusion

Seul Lee · Karsten Kreis · Srimukh Veccham · Meng Liu · Danny Reidenbach · Yuxing Peng · Saee Paliwal · Weili Nie · Arash Vahdat

The dark side of the forces: assessing non-conservative force models for atomistic machine learning

Filippo Bigi · Marcel Langer · Michele Ceriotti

LLM-SRBench: A New Benchmark for Scientific Equation Discovery with Large Language Models

Parshin Shojaee · Ngoc Hieu Nguyen · Kazem Meidani · Amir Barati Farimani · Khoa Doan · Chandan Reddy

Fixing the Double Penalty in Data-Driven Weather Forecasting Through a Modified Spherical Harmonic Loss Function

Christopher Subich · Syed Husain · Leo Separovic · Jing Yang

Riemann Tensor Neural Networks: Learning Conservative Systems with Physics-Constrained Networks

Anas Jnini · Lorenzo Breschi · Flavio Vella

DragSolver: A Multi-Scale Transformer for Real-World Automotive Drag Coefficient Estimation

Ye Liu · Yuntian Chen

PPDiff: Diffusing in Hybrid Sequence-Structure Space for Protein-Protein Complex Design

Zhenqiao Song · Tianxiao Li · Lei Li · Martin Min

CoastalBench: A Decade-Long High-Resolution Dataset to Emulate Complex Coastal Processes

Zelin Xu · Yupu Zhang · Tingsong Xiao · Maitane Lizaso · Jose Gonzalez-Ondina · Zibo Liu · Shigang Chen · Zhe Jiang

Energy-Based Flow Matching for Generating 3D Molecular Structure

Wenyin Zhou · Christopher I Sprague · Vsevolod Viliuga · Matteo Tadiello · Arne Elofsson · Hossein Azizpour

Deep Electromagnetic Structure Design Under Limited Evaluation Budgets

Shijian Zheng · Fangxiao Jin · Shuhai Zhang · Quan Xue · Mingkui Tan

Learning Condensed Graph via Differentiable Atom Mapping for Reaction Yield Prediction

Ankit Ghosh · Gargee Kashyap · Sarthak Mittal · Nupur Jain · Raghavan B Sunoj · Abir De

Counting atoms faster: policy-based nuclear magnetic resonance pulse sequencing for atomic abundance measurement

Rohan Shenoy · Evan Coleman · Hans Gaensbauer · Elsa Olivetti

TextCenGen: Attention-Guided Text-Centric Background Adaptation for Text-to-Image Generation

Tianyi Liang · Jiangqi Liu · Yifei Huang · Shiqi Jiang · Jianshen Shi · Changbo Wang · Chenhui Li

Better to Teach than to Give: Domain Generalized Semantic Segmentation via Agent Queries with Diffusion Model Guidance

Fan Li · Xuan Wang · Min Qi · Zhaoxiang Zhang · yuelei xu

ExtPose: Robust and Coherent Pose Estimation by Extending ViTs

Glory Rongyu CHEN · Li'an Zhuo · Linlin Yang · Qi WANG · Liefeng Bo · Bang Zhang · Angela Yao

Robust Secure Swap: Responsible Face Swap With Persons of Interest Redaction and Provenance Traceability

Yunshu Dai · Jianwei Fei · Fangjun Huang · Chip Hong Chang

Predicting High-precision Depth on Low-Precision Devices Using 2D Hilbert Curves

Mykhailo Uss · Ruslan Yermolenko · Oleksii Shashko · Olena Kolodiazhna · Ivan Safonov · Volodymyr Savin · Yoonjae Yeo · Seowon Ji · Jaeyun Jeong

LLaVA-ReID: Selective Multi-image Questioner for Interactive Person Re-Identification

Yiding Lu · Mouxing Yang · Dezhong Peng · Peng Hu · Yijie Lin · Xi Peng

DragLoRA: Online Optimization of LoRA Adapters for Drag-based Image Editing in Diffusion Model

Siwei Xia · Li Sun · Tiantian Sun · Qingli Li

Improving Compositional Generation with Diffusion Models Using Lift Scores

Chenning Yu · Sicun Gao

PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting for Novel View Synthesis

Sunghwan Hong · Jaewoo Jung · Heeseong Shin · Jisang Han · Jiaolong Yang · Chong Luo · Seungryong Kim

The Four Color Theorem for Cell Instance Segmentation

Ye Zhang · Yu Zhou · Yifeng Wang · Jun Xiao · Ziyue Wang · Yongbing Zhang · Jianxu Chen

Instruct2See: Learning to Remove Any Obstructions Across Distributions

Junhang Li · Yu Guo · Xian · Shengfeng He

MiraGe: Editable 2D Images using Gaussian Splatting

Joanna Waczyńska · Tomasz Szczepanik · Piotr Borycki · Slawomir Tadeja · Thomas Bohné · Przemysław Spurek

SSHR: More Secure Generative Steganography with High-Quality Revealed Secret Images

Jiannian Wang · Yao Lu · Guangming Lu

Not All Tokens Matter All The Time: Dynamic Token Aggregation Towards Efficient Detection Transformers

Jiacheng Cheng · Xiwen Yao · Xiang Yuan · Junwei Han

DCBM: Data-Efficient Visual Concept Bottleneck Models

Katharina Prasse · Patrick Knab · Sascha Marton · Christian Bartelt · Margret Keuper

LotteryCodec: Searching the Implicit Representation in a Random Network for Low-Complexity Image Compression

Haotian Wu · Gongpu Chen · Pier Luigi Dragotti · Deniz Gunduz

Flex3D: Feed-Forward 3D Generation with Flexible Reconstruction Model and Input View Curation

Junlin Han · Jianyuan Wang · Andrea Vedaldi · Phil Torr · Filippos Kokkinos

Origin Identification for Text-Guided Image-to-Image Diffusion Models

Wenhao Wang · Yifan Sun · Zongxin Yang · Zhentao Tan · Zhengdong Hu · Yi Yang

Mutual Learning for SAM Adaptation: A Dual Collaborative Network Framework for Source-Free Domain Transfer

Yabo Liu · Waikeung Wong · Chengliang Liu · Xiaoling Luo · Yong Xu · Jinghua Wang

Rethinking Score Distilling Sampling for 3D Editing and Generation

Xingyu Miao · Haoran Duan · Yang Long · Jungong Han

Diffusion on Language Model Encodings for Protein Sequence Generation

Viacheslav Meshchaninov · Pavel Strashnov · Andrey Shevtsov · Fedor Nikolaev · Nikita Ivanisenko · Olga Kardymon · Dmitry Vetrov

FlashTP: Fused, Sparsity-Aware Tensor Product for Machine Learning Interatomic Potentials

Seung Lee · Hojoon Kim · Yutack Park · Dawoon Jeong · Seungwu Han · Yeonhong Park · Jae W. Lee

Unifying Specialized Visual Encoders for Video Language Models

Jihoon Chung · Tyler Zhu · Max Gonzalez Saez-Diez · Juan Carlos Niebles · Honglu Zhou · Olga Russakovsky

Symmetry-Robust 3D Orientation Estimation

Christopher Scarvelis · David Benhaim · Paul Zhang

FlowDrag: 3D-aware Drag-based Image Editing with Mesh-guided Deformation Vector Flow Fields

Gwanhyeong Koo · Sunjae Yoon · Younghwan Lee · Ji Woo Hong · Chang Yoo

RUN: Reversible Unfolding Network for Concealed Object Segmentation

Chunming He · Rihan Zhang · Fengyang Xiao · Chengyu Fang · Longxiang Tang · Yulun Zhang · Linghe Kong · Deng-Ping Fan · Kai Li · Sina Farsiu

The Limits of Predicting Agents from Behaviour

Alexis Bellot · Jonathan Richens · Tom Everitt

S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking

Tao Tang · Lijun Zhou · Pengkun Hao · Zihang He · Kalok Ho · Shuo Gu · Zhihui Hao · Haiyang Sun · Kun Zhan · Peng Jia · XianPeng Lang · Xiaodan Liang

Adaptive Sensitivity Analysis for Robust Augmentation against Natural Corruptions in Image Segmentation

Laura Zheng · Wenjie Wei · Tony Wu · Jacob Clements · Shreelekha Revankar · Andre Harrison · Yu Shen · Ming Lin

GoIRL: Graph-Oriented Inverse Reinforcement Learning for Multimodal Trajectory Prediction

Muleilan Pei · Shaoshuai Shi · Lu Zhang · Peiliang Li · Shaojie Shen

Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion

Anle Ke · Xu Zhang · Tong Chen · Ming Lu · Chao Zhou · Jiawen Gu · Zhan Ma

Divide and Conquer: Exploring Language-centric Tree Reasoning for Video Question-Answering

Zhaohe Liao · Jiangtong Li · Siyu Sun · Qingyang Liu · Fengshun Xiao · Tianjiao Li · Qiang Zhang · Guang Chen · Li Niu · Changjun Jiang · Liqing Zhang

NeuralCohort: Cohort-aware Neural Representation Learning for Healthcare Analytics

Changshuo Liu · Lingze Zeng · Kaiping Zheng · Shaofeng Cai · Beng Chin Ooi · James Yip

scSSL-Bench: Benchmarking Self-Supervised Learning for Single-Cell Data

Olga Ovcharenko · Florian Barkmann · Philip Toma · Imant Daunhawer · Julia Vogt · Sebastian Schelter · Valentina Boeva

NTPP: Generative Speech Language Modeling for Dual-Channel Spoken Dialogue via Next-Token-Pair Prediction

Qichao Wang · Ziqiao Meng · Wenqian Cui · Yifei Zhang · Pengcheng Wu · Bingzhe Wu · Irwin King · Liang Chen · Peilin Zhao

Flexible and Efficient Grammar-Constrained Decoding

Kanghee Park · Timothy Zhou · Loris D'Antoni

Otter: Generating Tests from Issues to Validate SWE Patches

Toufique Ahmed · Jatin Ganhotra · Rangeet Pan · Avraham Shinnar · Saurabh Sinha · Martin Hirzel

Are Large Language Models Ready for Multi-Turn Tabular Data Analysis?

Jinyang Li · Nan Huo · Yan Gao · Jiayi Shi · Yingxiu Zhao · Qu Ge · Bowen Qin · Yurong Wu · Xiaodong Li · Chenhao Ma · Jian-Guang Lou · Reynold Cheng

Aligning Spoken Dialogue Models from User Interactions

Anne Wu · Laurent Mazaré · Neil Zeghidour · Alexandre Défossez

SING: Spatial Context in Large Language Model for Next-Gen Wearables

Ayushi Mishra · Yang Bai · Priyadarshan Narayanasamy · Nakul Garg · Nirupam Roy

OmniAudio: Generating Spatial Audio from 360-Degree Video

Huadai Liu · Tianyi Luo · Kaicheng Luo · Qikai Jiang · Peiwen Sun · Jialei Wang · Rongjie Huang · Qian Chen · Wen Wang · Xiangtai Li · ShiLiang Zhang · Zhijie Yan · Zhou Zhao · Wei Xue

MindCustomer: Multi-Context Image Generation Blended with Brain Signal

Muzhou Yu · Shuyun Lin · Lei Ma · Bo Lei · Kaisheng Ma

Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse

Ryan Liu · Jiayi Geng · Addison J. Wu · Ilia Sucholutsky · Tania Lombrozo · Thomas Griffiths

Dendritic Localized Learning: Toward Biologically Plausible Algorithm

Changze Lv · Jingwen Xu · Yiyang Lu · Xiaohua Wang · Zhenghua Wang · Zhibo Xu · Di Yu · Xin Du · Xiaoqing Zheng · Xuanjing Huang

Galileo: Learning Global & Local Features of Many Remote Sensing Modalities

Gabriel Tseng · Anthony Fuller · Marlena Reil · Henry Herzog · Patrick Beukema · Favyen Bastani · James Green · Evan Shelhamer · Hannah Kerner · David Rolnick

Neural Discovery in Mathematics: Do Machines Dream of Colored Planes?

Konrad Mundinger · Max Zimmer · Aldo Kiem · Christoph Spiegel · Sebastian Pokutta

AlphaQCM: Alpha Discovery in Finance with Distributional Reinforcement Learning

Zhoufan Zhu · Ke Zhu

Unbiased Recommender Learning from Implicit Feedback via Weakly Supervised Learning

Eric Wang · Zhichao Chen · Haotian Wang · Yanchao Tan · Licheng Pan · Tianqiao Liu · Xu Chen · Haoxuan Li · Zhouchen Lin

AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting

Abdelhakim Benechehab · Vasilii Feofanov · Giuseppe Paolo · Albert Thomas · Maurizio Filippone · Balázs Kégl

Cross-City Latent Space Alignment for Consistency Region Embedding

Meng Chen · Hongwei Jia · Zechen Li · Wenzhen Jia · Kai Zhao · Hongjun Dai · Weiming Huang

Counterfactual Voting Adjustment for Quality Assessment and Fairer Voting in Online Platforms with Helpfulness Evaluation

Chang Liu · Yixin Wang · Moontae Lee

DynaMind: Reasoning over Abstract Video Dynamics for Embodied Decision-Making

Ziru Wang · Mengmeng Wang · Jade Dai · Teli Ma · Guo-Jun Qi · Yong Liu · Guang Dai · Jingdong Wang

ELEMENTAL: Interactive Learning from Demonstrations and Vision-Language Models for Reward Design in Robotics

Letian Chen · Nina Moorman · Matthew Gombolay

Pre-training Auto-regressive Robotic Models with 4D Representations

Dantong Niu · Yuvan Sharma · Haoru Xue · Giscard Biamby · Junyi Zhang · Ziteng Ji · Trevor Darrell · Roi Herzig

Dynamical phases of short-term memory mechanisms in RNNs

Bariscan Kurtkaya · Fatih Dinc · Mert Yuksekgonul · Marta Blanco-Pozo · Ege Cirakman · Mark Schnitzer · Yucel Yemez · Hidenori Tanaka · Yuan · Nina Miolane

EEG-Language Pretraining for Highly Label-Efficient Clinical Phenotyping

Sam Gijsen · Kerstin Ritter

Inverse Reinforcement Learning with Switching Rewards and History Dependency for Characterizing Animal Behaviors

Jingyang Ke · Feiyang Wu · Jiyi Wang · Jeffrey Markowitz · Anqi Wu

ReverB-SNN: Reversing Bit of the Weight and Activation for Spiking Neural Networks

Yufei Guo · Yuhan Zhang · Zhou Jie · Xiaode Liu · Xin Tong · Yuanpei Chen · Weihang Peng · Zhe Ma

A Multi-Region Brain Model to Elucidate the Role of Hippocampus in Spatially Embedded Decision-Making

Yi Xie · Jaedong Hwang · Carlos Brody · David Tank · Ila R. Fiete

The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning

Dulhan Jayalath · Gilad Landau · Brendan Shillingford · Mark Woolrich · ʻŌiwi Parker Jones

Flow Matching for Few-Trial Neural Adaptation with Stable Latent Dynamics

Puli Wang · Yu Qi · Yueming Wang · Gang Pan

Identifying Neural Dynamics Using Interventional State Space Models

Amin Nejatbakhsh · Yixin Wang

Human-Aligned Image Models Improve Visual Decoding from the Brain

Nona Rajabi · Antonio Ribeiro · Miguel Vasco · Farzaneh Taleb · Mårten Björkman · Danica Kragic

Feature Learning beyond the Lazy-Rich Dichotomy: Insights from Representational Geometry

Chi-Ning Chou · Hang Le · Yichen Wang · SueYeon Chung

Not all solutions are created equal: An analytical dissociation of functional and representational similarity in deep linear neural networks

Lukas Braun · Erin Grant · Andrew Saxe

Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability

Chen Wei · Chi Zhang · Jiachen Zou · Haotian Deng · Dietmar Heinke · Quanying Liu

MapEval: A Map-Based Evaluation of Geo-Spatial Reasoning in Foundation Models

Mahir Labib Dihan · Tanvir Hassan · Md Tanvir Parvez · Md Hasebul Hasan · Almash Alam · Muhammad Aamir Cheema · Mohammed Eunus Ali · Md Rizwan Parvez

Bridging Layout and RTL: Knowledge Distillation based Timing Prediction

Mingjun Wang · Yihan Wen · Bin Sun · Jianan Mu · Juan Li · Xiaoyi Wang · Jing Ye · Bei Yu · Huawei Li

Bridging Protein Sequences and Microscopy Images with Unified Diffusion Models

Dihan Zheng · Bo Huang

Machine Learning meets Algebraic Combinatorics: A Suite of Datasets Capturing Research-level Conjecturing Ability in Pure Mathematics

Herman Chau · Helen Jenne · Davis Brown · Jesse He · Mark Raugas · Sara Billey · Henry Kvinge

Feedforward Few-shot Species Range Estimation

Christian Lange · Max Hamilton · Elijah Cole · Alexander Shepard · Samuel Heinrich · Angela Zhu · Subhransu Maji · Grant Horn · Oisin Mac Aodha

In-Context Adaptation to Concept Drift for Learned Database Operations

Jiaqi Zhu · Shaofeng Cai · Shen · Gang Chen · Fang Deng · Beng Chin Ooi

DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts

Tobias Braun · Mark Rothermel · Marcus Rohrbach · Anna Rohrbach

SPD: Sync-Point Drop for Efficient Tensor Parallelism of Large Language Models

Han-Byul Kim · Duc Hoang · Arnav Kundu · Mohammad Samragh · Minsik Cho

Loss Functions and Operators Generated by f-Divergences

Vincent Roulet · Tianlin Liu · Nino Vieillard · Michael Sander · Mathieu Blondel

Enhancing Performance of Explainable AI Models with Constrained Concept Refinement

Geyu Liang · Senne Michielssen · Salar Fattahi

The Surprising Agreement Between Convex Optimization Theory and Learning-Rate Scheduling for Large Model Training

Fabian Schaipp · Alexander Hägele · Adrien Taylor · Umut Simsekli · Francis Bach

FedECADO: A Dynamical System Model of Federated Learning

Aayushya Agarwal · Gauri Joshi · Lawrence Pileggi

Distributed Event-Based Learning via ADMM

Guner Dilsad ER · Sebastian Trimpe · Michael Muehlebach

Joint Learning of Energy-based Models and their Partition Function

Michael Sander · Vincent Roulet · Tianlin Liu · Mathieu Blondel

A Bregman Proximal Viewpoint on Neural Operators

Abdel-Rahim Mezidi · Jordan Patracone · Saverio Salzo · Amaury Habrard · Massimiliano Pontil · Rémi Emonet · Marc Sebban

Multinoulli Extension: A Lossless Yet Effective Probabilistic Framework for Subset Selection over Partition Constraints

Qixin Zhang · Wei Huang · Can Jin · Puning Zhao · Yao Shu · Li Shen · Dacheng Tao

Hybrid Quantum-Classical Multi-Agent Pathfinding

Thore Gerlach · Loong Kuan Lee · Frederic BARBARESCO · Nico Piatkowski

Improved Theoretically-Grounded Evolutionary Algorithms for Subset Selection with a Linear Cost Constraint

Dan-Xuan Liu · Chao Qian

Simple Randomized Rounding for Max-Min Eigenvalue Augmentation

Jourdain Lamperski · Haeseong Yang · Oleg Prokopyev

Aequa: Fair Model Rewards in Collaborative Learning via Slimmable Networks

Nurbek Tastan · Samuel Horváth · Karthik Nandakumar

BSemiFL: Semi-supervised Federated Learning via a Bayesian Approach

Haozhao Wang · Shengyu Wang · Jiaming Li · Hao Ren · Xingshuo Han · Wenchao Xu · Shangwei Guo · Tianwei Zhang · Ruixuan Li

On the Tension between Byzantine Robustness and No-Attack Accuracy in Distributed Learning

Yi-Rui Yang · Chang-Wei Shi · Wu-Jun Li

Improving Value Estimation Critically Enhances Vanilla Policy Gradient

Tao Wang · Ruipeng Zhang · Sicun Gao

Can We Predict Performance of Large Models across Vision-Language Tasks?

Qinyu Zhao · Ming Xu · Kartik Gupta · Akshay Asthana · Liang Zheng · Stephen Gould

Efficient Online Reinforcement Learning for Diffusion Policy

Haitong Ma · Tianyi Chen · Kai Wang · Na Li · Bo Dai

Vintix: Action Model via In-Context Reinforcement Learning

Andrei Polubarov · Nikita Lyubaykin · Alexander Derevyagin · Ilya Zisman · Denis Tarasov · Alexander Nikulin · Vladislav Kurenkov

Policy Gradient with Tree Expansion

Gal Dalal · Assaf Hallak · Gugan Chandrashekhar Mallika Thoppe · Shie Mannor · Gal Chechik

Behavioral Exploration: Learning to Explore via In-Context Adaptation

Andrew Wagenmaker · Zhiyuan Zhou · Sergey Levine

Craftium: Bridging Flexibility and Efficiency for Rich 3D Single- and Multi-Agent Environments

Mikel Malagón · Josu Ceberio · Jose A Lozano

Categorical Distributional Reinforcement Learning with Kullback-Leibler Divergence: Convergence and Asymptotics

Tyler Kastner · Mark Rowland · Yunhao Tang · Murat Erdogdu · Amir-massoud Farahmand

Beyond The Rainbow: High Performance Deep Reinforcement Learning on a Desktop PC

Tyler Clark · Mark Towers · Christine Evers · Jonathon Hare

Directly Forecasting Belief for Reinforcement Learning with Delays

Qingyuan Wu · Yuhui Wang · Simon Zhan · Yixuan Wang · Chung-Wei Lin · Chen Lv · Qi Zhu · Jürgen Schmidhuber · Chao Huang

Online Learning in Risk Sensitive constrained MDP

Arnob Ghosh · Mehrdad Moharrami

Rank-One Modified Value Iteration

Arman Sharifi Kolarijani · Tolga Ok · Peyman Mohajerin Esfahani · Mohamad Amin Sharifi Kolarijani

Improved Off-policy Reinforcement Learning in Biological Sequence Design

Hyeonah Kim · Minsu Kim · Taeyoung Yun · Sanghyeok Choi · Emmanuel Bengio · Alex Hernandez-Garcia · Jinkyoo Park

DEALing with Image Reconstruction: Deep Attentive Least Squares

Mehrsa Pourya · Erich Kobler · Michael Unser · Sebastian Neumayer

Density Ratio Estimation-based Bayesian Optimization with Semi-Supervised Learning

Jungtaek Kim

Adaptive Partitioning Schemes for Optimistic Optimization

Raja Sunkara · Ardhendu Tripathy

Diversity By Design: Leveraging Distribution Matching for Offline Model-Based Optimization

Michael S Yao · James Gee · Osbert Bastani

Meta-Black-Box-Optimization through Offline Q-function Learning

Zeyuan Ma · Zhiguang Cao · Zhou Jiang · Hongshu Guo · Yue-Jiao Gong

A Near-Optimal Single-Loop Stochastic Algorithm for Convex Finite-Sum Coupled Compositional Optimization

Bokun Wang · Tianbao Yang

Learning Curves of Stochastic Gradient Descent in Kernel Regression

Haihan Zhang · Weicheng Lin · Yuanshi Liu · Cong Fang

Exact risk curves of signSGD in High-Dimensions: quantifying preconditioning and noise-compression effects

Kevin Xiao · Noah Marshall · Atish Agarwala · Elliot Paquette

Cover learning for large-scale topology representation

Luis Scoccola · Uzu Lim · Heather Harrington

Task-Aware Virtual Training: Enhancing Generalization in Meta-Reinforcement Learning for Out-of-Distribution Tasks

Jeongmo Kim · Yisak Park · Minung Kim · Seungyul Han

KEA: Keeping Exploration Alive by Proactively Coordinating Exploration Strategies

Shih-Min Yang · Martin Magnusson · Johannes Stork · Todor Stoyanov

PIGDreamer: Privileged Information Guided World Models for Safe Partially Observable Reinforcement Learning

Dongchi Huang · Jiaqi WANG · Yang Li · Chunhe Xia · Tianle Zhang · Kaige Zhang

Learning Utilities from Demonstrations in Markov Decision Processes

Filippo Lazzati · Alberto Maria Metelli

O-MAPL: Offline Multi-agent Preference Learning

The Viet Bui · Tien Mai · Thanh Nguyen

Learning Mean Field Control on Sparse Graphs

Christian Fabian · Kai Cui · Heinz Koeppl

Learning Imperfect Information Extensive-form Games with Last-iterate Convergence under Bandit Feedback

Canzhe Zhao · Yutian Cheng · Jing Dong · Baoxiang Wang · Shuai Li

Sleeping Reinforcement Learning

Simone Drago · Marco Mussi · Alberto Maria Metelli

Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning

Mehrdad Moghimi · Hyejin Ku

Unveiling Markov heads in Pretrained Language Models for Offline Reinforcement Learning

Wenhao Zhao · Qiushui Xu · Linjie Xu · Lei Song · Jinyu Wang · Chunlai Zhou · Jiang Bian

Trust-Region Twisted Policy Improvement

Joery de Vries · Jinke He · Yaniv Oren · Matthijs T. J. Spaan

LARM: Large Auto-Regressive Model for Long-Horizon Embodied Intelligence

Zhuoling Li · Xiaogang Xu · Zhenhua Xu · Ser-Nam Lim · Hengshuang Zhao

Latent Imputation before Prediction: A New Computational Paradigm for De Novo Peptide Sequencing

Ye DU · Chen Yang · Nanxi Yu · Wanyu LIN · Qian Zhao · Shujun Wang

Algorithms and Hardness for Active Learning on Graphs

Vincent Cohen-Addad · Silvio Lattanzi · Simon Meierhans

Curse of High Dimensionality Issue in Transformer for Long Context Modeling

Shuhai Zhang · Zeng You · Yaofo Chen · Zhiquan Wen · Qianyue Wang · Zhijie Qiu · Yuanqing Li · Mingkui Tan

Mirror, Mirror of the Flow: How Does Regularization Shape Implicit Bias?

Tom Jacobs · Chao Zhou · Rebekka Burkholz

Consensus Is All You Get: The Role of Attention in Transformers

Alvaro Rodriguez Abella · João Pedro Silvestre · Paulo Tabuada

From Kernels to Features: A Multi-Scale Adaptive Theory of Feature Learning

Noa Rubin · Kirsten Fischer · Javed Lindner · Inbar Seroussi · Zohar Ringel · Michael Krämer · Moritz Helias

Equivariant Neural Tangent Kernels

Philipp Misof · Pan Kessel · Jan Gerken

Compact Matrix Quantum Group Equivariant Neural Networks

Edward Pearce-Crump

Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Attention Layers

Thiziri Nait Saada · Alireza Naderi · Jared Tanner

Gradient Flow Provably Learns Robust Classifiers for Orthonormal GMMs

Hancheng Min · Rene Vidal

Nearly Optimal Sample Complexity for Learning with Label Proportions

Robert Busa-Fekete · Travis Dick · Claudio Gentile · Haim Kaplan · Tomer Koren · Uri Stemmer

A Two-Stage Learning-to-Defer Approach for Multi-Task Learning

Yannis Montreuil · Shu Heng Yeo · Axel Carlier · Lai Xing Ng · Wei Tsang Ooi

All-Purpose Mean Estimation over R: Optimal Sub-Gaussianity with Outlier Robustness and Low Moments Performance

Jasper Lee · Walter McKelvie · Maoyuan Song · Paul Valiant

Generation from Noisy Examples

Ananth Raman · Vinod Raman

When do neural networks learn world models?

Tianren Zhang · Guanyu Chen · Feng Chen

Meta Optimality for Demographic Parity Constrained Regression via Post-Processing

Kazuto Fukuchi

Sample-Optimal Agnostic Boosting with Unlabeled Data

Udaya Ghai · Karan Singh

On the Generalization Ability of Next-Token-Prediction Pretraining

Zhihao Li · Xue JIANG · Liyuan Liu · xuelin zhang · Hong Chen · Feng Zheng

Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees

Yannis Montreuil · Axel Carlier · Lai Xing Ng · Wei Tsang Ooi

Provable Benefits of Unsupervised Pre-training and Transfer Learning via Single-Index Models

Taj Jones-McCormick · Aukosh Jagannath · Subhabrata Sen

Rapid Overfitting of Multi-Pass SGD in Stochastic Convex Optimization

Shira Vansover-Hager · Tomer Koren · Roi Livni

Hypothesis Testing for Generalized Thurstone Models

Anuran Makur · Japneet Singh

Statistical Query Hardness of Multiclass Linear Classification with Random Classification Noise

Ilias Diakonikolas · Mingchen Ma · Lisheng Ren · Christos Tzamos

System-Aware Unlearning Algorithms: Use Lesser, Forget Faster

Linda Lu · Ayush Sekhari · Karthik Sridharan

Theoretical Limitations of Ensembles in the Age of Overparameterization

Niclas Dern · John Cunningham · Geoff Pleiss

Mixture of Experts Provably Detect and Learn the Latent Cluster Structure in Gradient-Based Learning

Ryotaro Kawata · Kohsei Matsutani · Yuri Kinoshita · Naoki Nishikawa · Taiji Suzuki

A-PSRO: A Unified Strategy Learning Method with Advantage Metric for Normal-form Games

Yudong Hu · Haoran Li · Congying Han · Tiande Guo · Bonan Li · Mingqiang Li

Finite-Time Convergence Rates in Stochastic Stackelberg Games with Smooth Algorithmic Agents

Eric Frankel · Kshitij Kulkarni · Dmitriy Drusvyatskiy · Sewoong Oh · Lillian Ratliff

Best of Both Worlds: Regret Minimization versus Minimax Play

Adrian Müller · Jon Schneider · EFSTRATIOS PANTELEIMON SKOULAKIS · Luca Viano · Volkan Cevher

Computing Voting Rules with Improvement Feedback

Evi Micha · Vasilis Varsamis

Should Decision-Makers Reveal Classifiers in Online Strategic Classification?

Han Shao · Shuo Xie · Kunhe Yang

A General Representation-Based Approach to Multi-Source Domain Adaptation

Ignavier Ng · Yan Li · Zijian Li · Yujia Zheng · Guangyi Chen · Kun Zhang

Projection Optimization: A General Framework for Multi-Objective and Multi-Group RLHF

Nuoya Xiong · Aarti Singh

Fluctuations of the largest eigenvalues of transformed spiked Wigner matrices

Aro Lee · Ji Oon Lee

Heavy-Tailed Linear Bandits: Huber Regression with One-Pass Update

Jing Wang · Yu-Jie Zhang · Peng Zhao · Zhi-Hua Zhou

Linear Bandits with Partially Observable Features

Wonyoung Kim · Sungwoo PARK · Garud Iyengar · Assaf Zeevi · Min-hwan Oh

Learning-Augmented Algorithms for MTS with Bandit Access to Multiple Predictors

Matei Gabriel Cosa · Marek Elias

Ranking with Multiple Oracles: From Weak to Strong Stochastic Transitivity

Tao Jin · Yue Wu · Quanquan Gu · Farzad Farnoud

Instance-Optimal Pure Exploration for Linear Bandits on Continuous Arms

Sho Takemori · Yuhei Umeda · Aditya Gopalan

Near Optimal Non-asymptotic Sample Complexity of 1-Identification

Zitian Li · Wang Chi Cheung

A Classification View on Meta Learning Bandits

Mirco Mutti · Jeongyeol Kwon · Shie Mannor · Aviv Tamar

High Probability Bound for Cross-Learning Contextual Bandits with Unknown Context Distributions

Ruiyuan Huang · Zengfeng Huang

No-Regret is not enough! Bandits with General Constraints through Adaptive Regret Minimization

Martino Bernasconi · Matteo Castiglioni · Andrea Celli

Bayesian Optimization from Human Feedback: Near-Optimal Regret Bounds

Aya Kayal · Sattar Vakili · Laura Toni · Da-shan Shiu · Alberto Bernacchia

Dimension-Free Adaptive Subgradient Methods with Frequent Directions

Sifan Yang · Yuanyu Wan · Peijia Li · Yibo Wang · Xiao Zhang · Zhewei Wei · Lijun Zhang

A Generalization Result for Convergence in Learning-to-Optimize

Michael Sucker · Peter Ochs

Graph-Based Algorithms for Diverse Similarity Search

Piyush Anand · Piotr Indyk · Ravishankar Krishnaswamy · Sepideh Mahabadi · Vikas Raykar · Kirankumar Shiragur · Haike Xu

Learning Mixtures of Experts with EM: A Mirror Descent Perspective

Quentin Fruytier · Aryan Mokhtari · Sujay Sanghavi

Decision Theoretic Foundations for Conformal Prediction: Optimal Uncertainty Quantification for Risk-Averse Agents

Shayan Kiyani · George Pappas · Aaron Roth · Hamed Hassani

Actor-Critics Can Achieve Optimal Sample Efficiency

Kevin Tan · Wei Fan · Yuting Wei

Do We Need to Verify Step by Step? Rethinking Process Supervision from a Theoretical Perspective

Zeyu Jia · Alexander Rakhlin · Tengyang Xie

Catoni Contextual Bandits are Robust to Heavy-tailed Rewards

Chenlu Ye · Yujia Jin · Alekh Agarwal · Tong Zhang

Logarithmic Regret for Online KL-Regularized Reinforcement Learning

Heyang Zhao · Chenlu Ye · Wei Xiong · Quanquan Gu · Tong Zhang

A Computationally Efficient Algorithm for Infinite-Horizon Average-Reward Linear MDPs

Kihyuk Hong · Ambuj Tewari

Go to Event Page

Poster

Poster Session 5 East

11:00 AM - 1:30 PM

350 Events in this session

Safe Delta: Consistently Preserving Safety when Fine-Tuning LLMs on Diverse Datasets

Ning LU · Shengcai Liu · Jiahao Wu · Weiyu CHEN · Zhirui Zhang · Yew Soon ONG · Qi Wang · Ke Tang

Direct Density Ratio Optimization: A Statistically Consistent Approach to Aligning Large Language Models

Rei Higuchi · Taiji Suzuki

Latent Preference Coding: Aligning Large Language Models via Discrete Latent Codes

Zhuocheng Gong · Jian Guan · Wei Wu · Huishuai Zhang · Dongyan Zhao

Two Tickets are Better than One: Fair and Accurate Hiring Under Strategic LLM Manipulations

Lee Cohen · Connie Hong · Jack Hsieh · Judy Hanwen Shen

Accelerating Spectral Clustering under Fairness Constraints

Francesco Tonin · Alex Lambert · Johan Suykens · Volkan Cevher

XAttnMark: Learning Robust Audio Watermarking with Cross-Attention

Yixin Liu · Lie Lu · Jihui Jin · Lichao Sun · Andrea Fanelli

Optimizing Noise Distributions for Differential Privacy

Atefeh Gilani · Felipe Gomez · Shahab Asoodeh · Flavio Calmon · Oliver Kosut · Lalitha Sankar

Certification for Differentially Private Prediction in Gradient-Based Training

Matthew Wicker · Philip Sosnin · Igor Shilov · Adrianna Janik · Mark Müller · Yves-Alexandre de Montjoye · Adrian Weller · Calvin Tsay

Watch Out Your Album! On the Inadvertent Privacy Memorization in Multi-Modal Large Language Models

Tianjie Ju · Yi Hua · Hao Fei · Zhenyu Shao · Yubin Zheng · Haodong Zhao · Mong-Li Lee · Wynne Hsu · Zhuosheng Zhang · Gongshen Liu

Efficient Source-free Unlearning via Energy-Guided Data Synthesis and Discrimination-Aware Multitask Optimization

Xiuyuan Wang · Chaochao Chen · Weiming Liu · Xinting Liao · Fan Wang · Xiaolin Zheng

Leveraging Sparsity for Sample-Efficient Preference Learning: A Theoretical Perspective

Yunzhen Yao · Lie He · Michael Gastpar

Mixture of Experts Made Intrinsically Interpretable

Xingyi Yang · Constantin Venhoff · Ashkan Khakzar · Christian Schroeder de Witt · Puneet Dokania · Adel Bibi · Phil Torr

Avoiding Leakage Poisoning: Concept Interventions Under Distribution Shifts

Mateo Espinosa Zarlenga · Gabriele Dominici · Pietro Barbiero · Zohreh Shams · Mateja Jamnik

Automatically Interpreting Millions of Features in Large Language Models

Gonçalo Paulo · Alex Mallen · Caden Juang · Nora Belrose

A Versatile Influence Function for Data Attribution with Non-Decomposable Loss

Junwei Deng · Weijing Tang · Jiaqi Ma

Selective Preference Aggregation

Shreyas Kadekodi · Hayden McTavish · Berk Ustun

Jacobian Sparse Autoencoders: Sparsify Computations, Not Just Activations

Lucy Farnik · Tim Lawson · Conor Houghton · Laurence Aitchison

Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty

Meera Hahn · Wenjun Zeng · Nithish Kannen · Rich Galt · Kartikeya Badola · Been Kim · Zi Wang

Discovering Spoofing Attempts on Language Model Watermarks

Thibaud Gloaguen · Nikola Jovanović · Robin Staab · Martin Vechev

Causal Logistic Bandits with Counterfactual Fairness Constraints

Jiajun Chen · Jin Tian · Chris Quinn

Language Models over Canonical Byte-Pair Encodings

Tim Vieira · Tianyu Liu · Clemente Pasti · Yahya Emara · Brian DuSell · Benjamin LeBrun · Mario Giulianelli · Juan Luis Gastaldi · Timothy O'Donnell · Ryan Cotterell

Bayesian Inference for Correlated Human Experts and Classifiers

Markelle Kelly · Alex Boyd · Samuel Showalter · Mark Steyvers · Padhraic Smyth

How to Evaluate and Mitigate IP Infringement in Visual Generative AI?

Zhenting Wang · Chen Chen · Vikash Sehwag · Minzhou Pan · Lingjuan Lyu

Representative Ranking for Deliberation in the Public Sphere

Manon Revel · Smitha Milli · Tyler Lu · Jamelle Watson-Daniels · Maximilian Nickel

Trustworthy Machine Learning through Data-Specific Indistinguishability

Hanshen Xiao · Zhen Yang · Edward Suh

MIB: A Mechanistic Interpretability Benchmark

Aaron Mueller · Atticus Geiger · Sarah Wiegreffe · Dana Arad · Iván Arcuschin · Adam Belfki · Yik Siu Chan · Jaden Fiotto-Kaufman · Tal Haklay · Michael Hanna · Jing Huang · Rohan Gupta · Yaniv Nikankin · Hadas Orgad · Nikhil Prakash · Anja Reusch · Aruna Sankaranarayanan · Shun Shao · Alessandro Stolfo · Martin Tutek · Amir Zur · David Bau · Yonatan Belinkov

Addressing Concept Mislabeling in Concept Bottleneck Models Through Preference Optimization

Emiliano Penaloza · Tianyue Zhang · Laurent Charlin · Mateo Espinosa Zarlenga

Are Sparse Autoencoders Useful? A Case Study in Sparse Probing

Subhash Kantamneni · Josh Engels · Senthooran Rajamanoharan · Max Tegmark · Neel Nanda

Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups

Weiqiu You · Helen Qu · Marco Gatti · Bhuvnesh Jain · Eric Wong

Validating Mechanistic Interpretations: An Axiomatic Approach

Nils Palumbo · Ravi Mangal · Zifan Wang · Saranya Vijayakumar · Corina Pasareanu · Somesh Jha

Memorization Sinks: Isolating Memorization during LLM Training

Gaurav Ghosal · Pratyush Maini · Aditi Raghunathan

Variational Phylogenetic Inference with Products over Bipartitions

Evan Sidrow · Alexandre Bouchard-Côté · Lloyd Elliott

Continuously Updating Digital Twins using Large Language Models

Harry Amad · Nicolás Astorga · Mihaela van der Schaar

Causal Discovery from Conditionally Stationary Time Series

Carles Balsells-Rodas · Xavier Sumba · Tanmayee Narendra · Ruibo Tu · Gabriele Schweikert · Hedvig Kjellström · Yingzhen Li

Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs

Jie Hu · Yi-Ting Ma · Do-Young Eun

Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching

Aaron Havens · Benjamin Kurt Miller · Bing Yan · Carles Domingo i Enrich · Anuroop Sriram · Daniel S. Levine · Brandon Wood · Bin Hu · Brandon Amos · Brian Karrer · Xiang Fu · Guan-Horng Liu · Ricky T. Q. Chen

AutoStep: Locally adaptive involutive MCMC

Tiange Liu · Nikola Surjanovic · Miguel Biron-Lattes · Alexandre Bouchard-Côté · Trevor Campbell

Scaling Probabilistic Circuits via Monarch Matrices

Honghua Zhang · Meihua Dang · Benjie Wang · Stefano Ermon · Nanyun Peng · Guy Van den Broeck

Scalable Gaussian Processes with Latent Kronecker Structure

Jihao Andreas Lin · Sebastian Ament · Maximilian Balandat · David Eriksson · Jose Miguel Hernandez-Lobato · Eytan Bakshy

Stochastic Poisson Surface Reconstruction with One Solve using Geometric Gaussian Processes

Sidhanth Holalkere · David S Bindel · Silvia Sellán · Alexander Terenin

Towards Robustness and Explainability of Automatic Algorithm Selection

Xingyu Wu · Jibin Wu · Yu Zhou · Liang Feng · KC Tan

Efficient Quantification of Multimodal Interaction at Sample Level

Zequn Yang · Hongfa Wang · Di Hu

Editable Concept Bottleneck Models

Lijie Hu · Chenyang Ren · Zhengyu Hu · Hongbin Lin · Chenglong Wang · Zhen Tan · Weimin Lyu · Jingfeng Zhang · Hui Xiong · Di Wang

Density Ratio Estimation with Conditional Probability Paths

Hanlin Yu · Arto Klami · Aapo Hyvarinen · Anna Korba · Lemir Omar Chehab

Decision-aware Training of Spatiotemporal Forecasting Models to Select a Top-K Subset of Sites for Intervention

Kyle Heuton · Frederick Muench · Shikhar Shrestha · Thomas J Stopka · Michael Hughes

Fully Heteroscedastic Count Regression with Deep Double Poisson Networks

Spencer Young · Porter Jenkins · Longchao Da · Jeffrey Dotson · Hua Wei

FedBEns: One-Shot Federated Learning based on Bayesian Ensemble

Jacopo Talpini · Marco Savi · Giovanni Neglia

Training Flexible Models of Genetic Variant Effects from Functional Annotations using Accelerated Linear Algebra

Alan Amin · Andres Potapczynski · Andrew Wilson

A Unified Framework for Entropy Search and Expected Improvement in Bayesian Optimization

Nuojin Cheng · Leonard Papenmeier · Stephen Becker · Luigi Nardi

Learning Likelihood-Free Reference Priors

Nick Bishop · Daniel Jarne Ornia · Joel Dyer · Anisoara Calinescu · Michael Wooldridge

Scalable Sobolev IPM for Probability Measures on a Graph

Tam Le · Truyen Nguyen · Hideitsu Hino · Kenji Fukumizu

On Volume Minimization in Conformal Regression

Batiste Le Bars · Pierre Humbert

BOOD: Boundary-based Out-Of-Distribution Data Generation

Qilin Liao · Shuo Yang · Bo Zhao · Ping Luo · Hengshuang Zhao

QuRe: Query-Relevant Retrieval through Hard Negative Sampling in Composed Image Retrieval

Jaehyun Kwak · Izaaz Inhar · Se-Young Yun · Sung-Ju Lee

E-LDA: Toward Interpretable LDA Topic Models with Strong Guarantees in Logarithmic Parallel Time

Adam Breuer

Verification Learning: Make Unsupervised Neuro-Symbolic System Feasible

Lin-Han Jia · Wen-Chao Hu · Jie-Jing Shao · Lan-Zhe Guo · Yu-Feng Li

A Square Peg in a Square Hole: Meta-Expert for Long-Tailed Semi-Supervised Learning

Yaxin Hou · Yuheng Jia

Score Matching with Missing Data

Josh Givens · Song Liu · Henry Reeve

Optimizing Temperature for Language Models with Multi-Sample Inference

Weihua Du · Yiming Yang · Sean Welleck

DPCore: Dynamic Prompt Coreset for Continual Test-Time Adaptation

Yunbei Zhang · Akshay Mehra · Shuaicheng Niu · Jihun Hamm

Stabilizing Sample Similarity in Representation via Mitigating Random Consistency

Jieting Wang · ZhangZelong Zhang · Feijiang Li · Yuhua Qian · Xinyan Liang

Robust Automatic Modulation Classification with Fuzzy Regularization

Xinyan Liang · Ruijie Sang · Yuhua Qian · Qian Guo · Feijiang Li · Liang Du

Generalized Random Forests Using Fixed-Point Trees

David Fleischer · David A Stephens · Archer Yang

Surrogate Prompt Learning: Towards Efficient and Diverse Prompt Learning for Vision-Language Models

Liangchen Liu · Nannan Wang · Xi Yang · Xinbo Gao · Tongliang Liu

Model Immunization from a Condition Number Perspective

Amber Yijia Zheng · Cedar Site Bai · Brian Bullins · Raymond A. Yeh

Predicting the Susceptibility of Examples to Catastrophic Forgetting

Guy Hacohen · Tinne Tuytelaars

NegMerge: Sign-Consensual Weight Merging for Machine Unlearning

Hyo Seo Kim · Dongyoon Han · Junsuk Choe

Maximum Update Parametrization and Zero-Shot Hyperparameter Transfer for Fourier Neural Operators

Shanda Li · Shinjae Yoo · Yiming Yang

Set Valued Predictions For Robust Domain Generalization

Ron Tsibulsky · Daniel Nevo · Uri Shalit

Generalization Bounds via Meta-Learned Model Representations: PAC-Bayes and Sample Compression Hypernetworks

Benjamin Leblanc · Mathieu Bazinet · Nathaniel D'Amours · Alexandre Drouin · Pascal Germain

Human Cognition-Inspired Hierarchical Fuzzy Learning Machine

Junbiao Cui · Qin Yue · Jianqing Liang · Jiye Liang

Trusted Multi-View Classification with Expert Knowledge Constraints

Xinyan Liang · Shijie Wang · Yuhua Qian · Qian Guo · Liang Du · Bingbing Jiang · Tingjin Luo · Feijiang Li

Multivariate Conformal Selection

Tian Bai · Yue Zhao · Xiang Yu · Archer Yang

ENSUR: Equitable and Statistically Unbiased Recommendation

Nitin Bisht · Xiuwen Gong · Guandong Xu

Focal-SAM: Focal Sharpness-Aware Minimization for Long-Tailed Classification

Sicong Li · Qianqian Xu · Zhiyong Yang · Zitai Wang · Linchao Zhang · Xiaochun Cao · Qingming Huang

Tensorized Multi-View Multi-Label Classification via Laplace Tensor Rank

Qiyu Zhong · Yi Shan · Haobo Wang · Zhen Yang · Gengyu Lyu

Pareto-Optimal Fronts for Benchmarking Symbolic Regression Algorithms

Kei Sen Fong · Mehul Motani

LADA: Scalable Label-Specific CLIP Adapter for Continual Learning

Mao-Lin Luo · Zi-Hao Zhou · Tong Wei · Min-Ling Zhang

Shifting Time: Time-series Forecasting with Khatri-Rao Neural Operators

Srinath Dama · Kevin L Course · Prasanth B Nair

Approximate Forest Completion and Learning-Augmented Algorithms for Metric Minimum Spanning Trees

Nate Veldt · Thomas Stanley · Benjamin Priest · Trevor Steil · Keita Iwabuchi · T.S. Jayram · Geoffrey Sanders

TeDS: Joint Learning of Diachronic and Synchronic Perspectives in Quaternion Space for Temporal Knowledge Graph Completion

Jiujiang Guo · Mankun Zhao · Wenbin Zhang · Tianyi Xu · Linying Xu · Yu Jian · Yu Mei · Yu Ruiguo

TINED: GNNs-to-MLPs by Teacher Injection and Dirichlet Energy Distillation

Ziang Zhou · Zhihao DING · Jieming Shi · Qing Li · Shiqi Shen

Learning Single Index Models with Diffusion Priors

Anqi Tang · Youming Chen · Shuchen Xue · Zhaoqiang Liu

Random Feature Representation Boosting

Nikita Zozoulenko · Thomas Cass · Lukas Gonon

BDC-CLIP: Brownian Distance Covariance for Adapting CLIP to Action Recognition

Fei Long · Xiaoou Li · jiaming Lv · Yang Haoyuan · Xianjun Cheng · Peihua Li

Deterministic Sparse Fourier Transform for Continuous Signals with Frequency Gap

Xiaoyu Li · Zhao Song · Shenghao Xie

ResKoopNet: Learning Koopman Representations for Complex Dynamics with Spectral Residuals

Yuanchao Xu · Kaidi Shao · Nikos Logothetis · Zhongwei Shen

Discovering Global False Negatives On the Fly for Self-supervised Contrastive Learning

Vicente Balmaseda · Bokun Wang · Lin · Tianbao Yang

On the Importance of Embedding Norms in Self-Supervised Learning

Andrew Draganov · Sharvaree Vadgama · Sebastian Damrich · Jan Böhm · Lucas Maes · Dmitry Kobak · Erik Bekkers

Self-supervised Masked Graph Autoencoder via Structure-aware Curriculum

Haoyang Li · Xin Wang · Zeyang Zhang · Zongyuan Wu · Linxin Xiao · Wenwu Zhu

Banyan: Improved Representation Learning with Explicit Structure

Mattia Opper · Siddharth N

A Geometric Approach to Personalized Recommendation with Set-Theoretic Constraints Using Box Embeddings

Shib S Dasgupta · Michael Boratko · Andrew McCallum

Mitigating Local Cohesion and Global Sparseness in Graph Contrastive Learning with Fuzzy Boundaries

Yuena Lin · Haichun Cai · Jun-Yi Hang · Haobo Wang · Zhen Yang · Gengyu Lyu

Mixed-curvature decision trees and random forests

Philippe Chlenski · Quentin Chu · Raiyan Khan · Kaizhu Du · Antonio Moretti · Itsik Pe'er

Test-Time Adaptation with Binary Feedback

Taeckyung Lee · Sorn Chottananurak · Junsu Kim · Jinwoo Shin · Taesik Gong · Sung-Ju Lee

The Harder Path: Last Iterate Convergence for Uncoupled Learning in Zero-Sum Games with Bandit Feedback

Côme Fiegel · Pierre Menard · Tadashi Kozuno · Michal Valko · Vianney Perchet

An Optimistic Algorithm for online CMDPS with Anytime Adversarial Constraints

Jiahui Zhu · Kihyun Yu · Dabeen Lee · Xin Liu · Honghao Wei

One-Pass Feature Evolvable Learning with Theoretical Guarantees

Cun-Yuan Xing · Meng-Zhang Qian · Wu-Yang Chen · Wei Gao · Zhi-Hua Zhou

Bayesian Weight Enhancement with Steady-State Adaptation for Test-time Adaptation in Dynamic Environments

Jae-Hong Lee

Distributionally Robust Active Learning for Gaussian Process Regression

Shion Takeno · Yoshito Okura · Yu Inatsu · Tatsuya Aoyama · Tomonari Tanaka · Satoshi Akahane · Hiroyuki Hanada · Noriaki Hashimoto · Taro Murayama · Hanju Lee · Shinya Kojima · Ichiro Takeuchi

Learning with Exact Invariances in Polynomial Time

Ashkan Soleymani · Behrooz Tahmasebi · Stefanie Jegelka · Patrick Jaillet

Joker: Joint Optimization Framework for Lightweight Kernel Machines

Junhong Zhang · Zhihui Lai

An Expressive and Self-Adaptive Dynamical System for Efficient Function Learning

Chuan Liu · Chunshu Wu · Ruibing Song · Ang Li · Ying Nian Wu · Tong Geng

Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing

Han Jiang · Xiaoyuan Yi · Zhihua Wei · Ziang Xiao · Shu Wang · Xing Xie

Robust ML Auditing using Prior Knowledge

Jade Garcia Bourrée · Augustin Godinot · Sayan Biswas · Anne-Marie Kermarrec · Erwan Le Merrer · Gilles Tredan · Martijn de Vos · Milos Vujasinovic

WATCH: Adaptive Monitoring for AI Deployments via Weighted-Conformal Martingales

Drew Prinster · Xing Han · Anqi Liu · Suchi Saria

Modified K-means Algorithm with Local Optimality Guarantees

Mingyi Li · Michael R. Metel · Akiko Takeda

Global-Local Dirichlet Processes for Clustering Grouped Data in the Presence of Group-Specific Idiosyncratic Variables

Arhit Chakrabarti · Yang Ni · Debdeep Pati · Bani Mallick

Heterogeneous Sufficient Dimension Reduction and Subspace Clustering

Lei Yan · Xin Zhang · Qing Mai

Efficient Federated Incomplete Multi-View Clustering

Suyuan Liu · Hao Yu · Hao Tan · KE LIANG · Siwei Wang · Shengju Yu · En Zhu · Xinwang Liu

Dynamic Similarity Graph Construction with Kernel Density Estimation

Steinar Laenen · Peter Macgregor · He Sun

Online Sparsification of Bipartite-Like Clusters in Graphs

Joyentanuj Das · Suranjan De · He Sun

An Effective and Secure Federated Multi-View Clustering Method with Information-Theoretic Perspective

Xinyue Chen · Jinfeng Peng · Yuhao Li · Xiaorong Pu · Yang Yang · Yazhou Ren

Correlation Clustering Beyond the Pivot Algorithm

Soheil Behnezhad · Moses Charikar · Vincent Cohen-Addad · Alma Ghafari · Weiyun ma

Multi-View Graph Clustering via Node-Guided Contrastive Encoding

Yazhou Ren · Junlong Ke · Zichen Wen · Tianyi Wu · Yang Yang · Xiaorong Pu · Lifang He

Hierarchical Overlapping Clustering on Graphs: Cost Function, Algorithm and Scalability

Yicheng Pan · Renjie Chen · Pengyu Long · Bingchen Fan

KernelBench: Can LLMs Write Efficient GPU Kernels?

Anne Ouyang · Simon Guo · Simran Arora · Alex Zhang · William Hu · Christopher Re · Azalia Mirhoseini

Guardians of Image Quality: Benchmarking Defenses Against Adversarial Attacks on Image Quality Metrics

Aleksandr Gushchin · Khaled Abud · Georgii Bychkov · Ekaterina Shumitskaya · Anna Chistyakova · Sergey Lavrushkin · Bader Rasheed · Kirill Malyshev · Dmitriy Vatolin · Anastasia Antsiferova

From Crowdsourced Data to High-quality Benchmarks: Arena-Hard and Benchbuilder Pipeline

Tianle Li · Wei-Lin Chiang · Evan Frick · Lisa Dunlap · Tianhao Wu · Banghua Zhu · Joseph E Gonzalez · Ion Stoica

On the Adversarial Robustness of Multi-Kernel Clustering

Hao Yu · Weixuan Liang · KE LIANG · Suyuan Liu · Meng Liu · Xinwang Liu

Since Faithfulness Fails: The Performance Limits of Neural Causal Discovery

Mateusz Olko · Mateusz Gajewski · Joanna Wojciechowska · Mikołaj Morzy · Piotr Sankowski · Piotr Milos

Causal Effect Identification in lvLiNGAM from Higher-Order Cumulants

Daniele Tramontano · Yaroslav Kivva · Saber Salehkaleybar · Negar Kiyavash · Mathias Drton

Generative Intervention Models for Causal Perturbation Modeling

Nora Schneider · Lars Lorch · Niki Kilbertus · Bernhard Schölkopf · Andreas Krause

FairPFN: A Tabular Foundation Model for Causal Fairness

Jake Robertson · Noah Hollmann · Samuel Gabriel Müller · Noor Awad · Frank Hutter

Enhancing Treatment Effect Estimation via Active Learning: A Counterfactual Covering Perspective

Hechuan Wen · Tong Chen · Mingming Gong · Li Kheng Chai · Shazia Sadiq · Hongzhi Yin

Causal Attribution Analysis for Continuous Outcomes

Shanshan Luo · Yu yixuan · Chunchen LIU · Feng Xie · zhi geng

Causal-PIK: Causality-based Physical Reasoning with a Physics-Informed Kernel

Carlota Parés Morlans · Michelle Yi · Claire Chen · Sarah A Wu · Rika Antonova · Tobias Gerstenberg · Jeannette Bohg

Causal Abstraction Inference under Lossy Representations

Kevin Xia · Elias Bareinboim

Discovering Latent Causal Graphs from Spatiotemporal Data

Kun Wang · Sumanth Varambally · Duncan Watson-Parris · Yian Ma · Rose Yu

Transformer-Based Spatial-Temporal Counterfactual Outcomes Estimation

He Li · Haoang Chi · Mingyu Liu · Wanrong Huang · Liyang Xu · Wenjing Yang

Learning Joint Interventional Effects from Single-Variable Interventions in Additive Models

Armin Kekić · Sergio Hernan Garrido Mejia · Bernhard Schölkopf

Rethinking Causal Ranking: A Balanced Perspective on Uplift Model Evaluation

Minqin Zhu · Zexu Sun · Ruoxuan Xiong · Anpeng Wu · Baohong Li · Caizhi Tang · JUN ZHOU · Fei Wu · Kun Kuang

Inductive Gradient Adjustment for Spectral Bias in Implicit Neural Representations

Kexuan Shi · Hai Chen · Leheng Zhang · Shuhang Gu

Improving Soft Unification with Knowledge Graph Embedding Methods

Xuanming Cui · Chionh Peng · Adriel Kuek · Ser-Nam Lim

Generative Human Trajectory Recovery via Embedding-Space Conditional Diffusion

KAIJUN LIU · Sijie Ruan · Liang Zhang · Cheng Long · Shuliang Wang · Liang Yu

SAN: Hypothesizing Long-Term Synaptic Development and Neural Engram Mechanism in Scalable Model's Parameter-Efficient Fine-Tuning

Gaole Dai · Chun-Kai Fan · Yiming Tang · Zhi Zhang · Yuan Zhang · Yulu Gan · Qizhe Zhang · Cheng-Ching Tseng · Shanghang Zhang · Tiejun Huang

ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $\alpha$-$\beta$-Divergence

Guanghui Wang · Zhiyong Yang · Zitai Wang · Shi Wang · Qianqian Xu · Qingming Huang

Discovering a Zero (Zero-Vector Class of Machine Learning)

Harikrishna Metta · Venkatesh Babu Radhakrishnan

Volume Optimality in Conformal Prediction with Structured Prediction Sets

Chao Gao · Liren Shan · Vaidehi Srinivas · Aravindan Vijayaraghavan

NTK-DFL: Enhancing Decentralized Federated Learning in Heterogeneous Settings via Neural Tangent Kernel

Gabriel Thompson · Kai Yue · Chau-Wai Wong · Huaiyu (David) Dai

Importance Sampling for Nonlinear Models

Prakash Palanivelu Rajmohan · Fred Roosta

Feature Importance Metrics in the Presence of Missing Data

Henrik von Kleist · Joshua Wendland · Ilya Shpitser · Carsten Marr

Prediction-Powered Adaptive Shrinkage Estimation

Sida Li · Nikolaos Ignatiadis

Learning Representations of Instruments for Partial Identification of Treatment Effects

Jonas Schweisthal · Dennis Frauen · Maresa Schröder · Konstantin Hess · Niki Kilbertus · Stefan Feuerriegel

Falsification of Unconfoundedness by Testing Independence of Causal Mechanisms

Rickard K.A. Karlsson · Jesse H. Krijthe

Rethinking Time Encoding via Learnable Transformation Functions

Xi Chen · Yateng Tang · Jiarong Xu · Jiawei Zhang · Siwei Zhang · Sijia Peng · Xuehao Zheng · Yun Xiong

LAuReL: Learned Augmented Residual Layer

Gaurav Menghani · Ravi Kumar · Sanjiv Kumar

Solving Probabilistic Verification Problems of Neural Networks using Branch and Bound

David Boetius · Stefan Leue · Tobias Sutter

How to Train Your Multi-Exit Model? Analyzing the Impact of Training Strategies

Piotr Kubaty · Bartosz Wójcik · Bartłomiej Krzepkowski · Monika Michaluk · Tomasz Trzcinski · Jary Pomponi · Kamil Adamczewski

Positional Attention: Expressivity and Learnability of Algorithmic Computation

Artur Back de Luca · George Giapitzakis · Shenghao Yang · Petar Veličković · Kimon Fountoulakis

Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence

Yinbin Han · Meisam Razaviyayn · Renyuan Xu

Risk and cross validation in ridge regression with correlated samples

Alexander Atanasov · Jacob A Zavatone-Veth · Cengiz Pehlevan

Counting in Small Transformers: The Delicate Interplay between Attention and Feed-Forward Layers

Freya Behrens · Luca Biggio · Lenka Zdeborová

Softmax is not Enough (for Sharp Size Generalisation)

Petar Veličković · Christos Perivolaropoulos · Federico Barbero · Razvan Pascanu

Gradient Descent Converges Arbitrarily Fast for Logistic Regression via Large and Adaptive Stepsizes

Ruiqi Zhang · Jingfeng Wu · Peter Bartlett

Global Convergence and Rich Feature Learning in $L$-Layer Infinite-Width Neural Networks under $\mu$ Parametrization

Zixiang Chen · Greg Yang · Qingyue Zhao · Quanquan Gu

Features are fate: a theory of transfer learning in high-dimensional regression

Javan Tahir · Surya Ganguli · Grant Rotskoff

Understanding Input Selectivity in Mamba: Impact on Approximation Power, Memorization, and Associative Recall Capacity

Ningyuan Huang · Miguel Sarabia · Abhinav Moudgil · Pau Rodriguez · Luca Zappella · Federico Danieli

Pixel-level Certified Explanations via Randomized Smoothing

Alaa Anani · Tobias Lorenz · Mario Fritz · Bernt Schiele

SPMC: Self-Purifying Federated Backdoor Defense via Margin Contribution

Wenwen He · Wenke Huang · Bin Yang · ShuKan Liu · Mang Ye

Explaining the role of Intrinsic Dimensionality in Adversarial Training

Enes Altinisik · Safa Messaoud · Husrev Taha Sencar · Hassan Sajjad · Sanjay Chawla

CAT: Contrastive Adversarial Training for Evaluating the Robustness of Protective Perturbations in Latent Diffusion Models

Sen Peng · Mingyue Wang · Jianfei He · Jijia Yang · Xiaohua Jia

Collapse-Proof Non-Contrastive Self-Supervised Learning

EMANUELE SANSONE · Tim Lebailly · Tinne Tuytelaars

How does Labeling Error Impact Contrastive Learning? A Perspective from Data Dimensionality Reduction

Jun Chen · Hong Chen · Yonghua Yu · Yiming Ying

Self-Organizing Visual Prototypes for Non-Parametric Representation Learning

Thalles Silva · Helio Pedrini · Adín Ramírez Rivera

TimeBridge: Non-Stationarity Matters for Long-term Time Series Forecasting

Peiyuan Liu · Beiliang Wu · Yifan Hu · Naiqi Li · Tao Dai · Jigang Bao · Shutao Xia

SKOLR: Structured Koopman Operator Linear RNN for Time-Series Forecasting

Yitian Zhang · Liheng Ma · Antonios Valkanas · Boris Oreshkin · Mark Coates

UnHiPPO: Uncertainty-aware Initialization for State Space Models

Marten Lienen · Abdullah Saydemir · Stephan Günnemann

Retrieval Augmented Time Series Forecasting

Sungwon Han · Seungeon Lee · MEEYOUNG CHA · Sercan Arik · Jinsung Yoon

Enhancing Foundation Models for Time Series Forecasting via Wavelet-based Tokenization

Luca Masserano · Abdul Fatir Ansari · Boran Han · Xiyuan Zhang · Christos Faloutsos · Michael Mahoney · Andrew Wilson · Youngsuk Park · Syama Sundar Yadav Rangapuram · Danielle Maddix · Yuyang Wang

SDE Matching: Scalable and Simulation-Free Training of Latent Stochastic Differential Equations

Grigory Bartosh · Dmitry Vetrov · Christian Andersson Naesseth

Enhancing Certified Robustness via Block Reflector Orthogonal Layers and Logit Annealing Loss

Bo-Han Lai · Pin-Han Huang · Bo-Han Kung · Shang-Tse Chen

Can DBNNs Robust to Environmental Noise for Resource-constrained Scenarios?

Wendong Zheng · Junyang Chen · Husheng Guo · Wenjian Wang

Putnam-AXIOM: A Functional & Static Benchmark for Measuring Higher Level Mathematical Reasoning in LLMs

Aryan Gulati · Brando Miranda · Eric Chen · Emily Xia · Kai Fronsdal · Bruno de Moraes Dumont · Sanmi Koyejo

Diverse Prototypical Ensembles Improve Robustness to Subpopulation Shift

Nguyen Nhat Minh To · Paul Wilson · Viet Nguyen · Mohamed Harmanani · Michael Cooper · Fahimeh Fooladgar · Purang Abolmaesumi · Parvin Mousavi · Rahul G. Krishnan

Adversarial Robustness via Deformable Convolution with Stochasticity

Yanxiang Ma · Zixuan Huang · Minjing Dong · Shan You · Chang Xu

Kernel-based Unsupervised Embedding Alignment for Enhanced Visual Representation in Vision-language Models

Shizhan Gong · Yankai Jiang · DOU QI · Farzan Farnia

Interpreting CLIP with Hierarchical Sparse Autoencoders

Vladimir Zaigrajew · Hubert Baniecki · Przemysław Biecek

Understanding the Limits of Deep Tabular Methods with Temporal Shift

Haorun Cai · Han-Jia Ye

Test-Time Learning for Large Language Models

Jinwu Hu · Zitian Zhang · Guohao Chen · Xutao Wen · Chao Shuai · Wei Luo · Bin Xiao · Yuanqing Li · Mingkui Tan

TabFlex: Scaling Tabular Learning to Millions with Linear Attention

Yuchen Zeng · Tuan Dinh · Wonjun Kang · Andreas Mueller

Objective drives the consistency of representational similarity across datasets

Laure Ciernik · Lorenz Linhardt · Marco Morik · Jonas Dippel · Simon Kornblith · Lukas Muttenthaler

On the Importance of Gaussianizing Representations

Daniel Eftekhari · Vardan Papyan

Looking Beyond the Top-1: Transformers Determine Top Tokens in Order

Daria Lioubashevski · Tomer Schlank · Gabriel Stanovsky · Ariel Goldstein

Metadata Conditioning Accelerates Language Model Pre-training

Tianyu Gao · Alexander Wettig · Luxi He · Yihe Dong · Sadhika Malladi · Danqi Chen

Logits are All We Need to Adapt Closed Models

Gaurush Hiranandani · Haolun Wu · Subhojyoti Mukherjee · Sanmi Koyejo

Training Software Engineering Agents and Verifiers with SWE-Gym

Jiayi Pan · Xingyao Wang · Graham Neubig · Navdeep Jaitly · Heng Ji · Alane Suhr · Yizhe Zhang

Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models

Alina Shutova · Vladimir Malinovskii · Vage Egiazarian · Denis Kuznedelev · Denis Mazur · Surkov Nikita · Ivan Ermakov · Dan Alistarh

MA-LoT: Model-Collaboration Lean-based Long Chain-of-Thought Reasoning enhances Formal Theorem Proving

Ruida Wang · Rui Pan · Yuxin Li · Jipeng Zhang · Yizhen Jia · Shizhe Diao · Renjie Pi · Junjie Hu · Tong Zhang

Mechanistic Unlearning: Robust Knowledge Unlearning and Editing via Mechanistic Localization

Phillip Guo · Aaquib Syed · Abhay Sheshadri · Aidan Ewart · Gintare Karolina Dziugaite

Autonomy-of-Experts Models

Ang Lv · Ruobing Xie · Yining Qian · Songhao Wu · Xingwu Sun · Zhanhui Kang · Di Wang · Rui Yan

Scaling Laws for Floating–Point Quantization Training

Xingwu Sun · Shuaipeng Li · Ruobing Xie · Weidong Han · Kan Wu · Zhen Yang · Yixing Li · An Wang · SHUAI LI · Jinbao Xue · Yu Cheng · Yangyu Tao · Zhanhui Kang · Cheng-Zhong Xu · Di Wang · Jie Jiang

QuantSpec: Self-Speculative Decoding with Hierarchical Quantized KV Cache

Rishabh Tiwari · Haocheng Xi · Aditya Tomar · Coleman Hooper · Sehoon Kim · Maxwell Horton · Mahyar Najibi · Michael Mahoney · Kurt Keutzer · Amir Gholaminejad

Joint MoE Scaling Laws: Mixture of Experts Can Be Memory Efficient

Jan Ludziejewski · Maciej Pióro · Jakub Krajewski · Maciej Stefaniak · Michał Krutul · Jan Małaśnicki · Marek Cygan · Piotr Sankowski · Kamil Adamczewski · Piotr Milos · Sebastian Jaszczur

Demystifying Singular Defects in Large Language Models

Haoqi Wang · Tong Zhang · Mathieu Salzmann

NextCoder: Robust Adaptation of Code LMs to Diverse Code Edits

Tushar Aggarwal · Swayam Singh · Abhijeet Awasthi · Aditya Kanade · Nagarajan Natarajan

Overcoming Multi-step Complexity in Multimodal Theory-of-Mind Reasoning: A Scalable Bayesian Planner

Chunhui Zhang · Zhongyu Ouyang · Kwonjoon Lee · Nakul Agarwal · Sean Houlihan · Soroush Vosoughi · Shao-Yuan Lo

An Architecture Search Framework for Inference-Time Techniques

Jon Saad-Falcon · Adrian Lafuente · Shlok Natarajan · Nahum Maru · Hristo Todorov · Etash Guha · Estefany Kelly Buchanan · Mayee Chen · Neel Guha · Christopher Re · Azalia Mirhoseini

Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems

Shaokun Zhang · Ming Yin · Jieyu Zhang · Jiale Liu · Zhiguang Han · Jingyang Zhang · Beibin Li · Chi Wang · Huazheng Wang · Yiran Chen · Qingyun Wu

Deliberation in Latent Space via Differentiable Cache Augmentation

Luyang Liu · Jonas Pfeiffer · Jiaxing Wu · Jun Xie · Arthur Szlam

Enhancing Decision-Making of Large Language Models via Actor-Critic

Heng Dong · Kefei Duan · Chongjie Zhang

Joint Localization and Activation Editing for Low-Resource Fine-Tuning

Wen Lai · Alexander Fraser · Ivan Titov

VinePPO: Refining Credit Assignment in RL Training of LLMs

Amirhossein Kazemnejad · Milad Aghajohari · Eva Portelance · Alessandro Sordoni · Siva Reddy · Aaron Courville · Nicolas Le Roux

Spurious Correlations in High Dimensional Regression: The Roles of Regularization, Simplicity Bias and Over-Parameterization

Simone Bombari · Marco Mondelli

Overcoming Vocabulary Mismatch: Vocabulary-agnostic Teacher Guided Language Modeling

Haebin Shin · Lei Ji · Xiao Liu · Yeyun Gong

EpiCoder: Encompassing Diversity and Complexity in Code Generation

Yaoxiang Wang · Haoling Li · Xin Zhang · Jie Wu · Xiao Liu · Wenxiang Hu · Zhongxin Guo · Yangyu Huang · Ying Xin · Yujiu Yang · Jinsong Su · Qi Chen · Scarlett Li

Adversarial Combinatorial Semi-bandits with Graph Feedback

Yuxiao Wen

Targeted Low-rank Refinement: Enhancing Sparse Language Models with Precision

Li Shen · Anke Tang · Yong Luo · Tao Sun · Han Hu · Xiaochun Cao

Dialogue Without Limits: Constant-Sized KV Caches for Extended Response in LLMs

Ravi Ghadia · Avinash Kumar · Gaurav Jain · Prashant J. Nair · Poulami Das

Optimizing Test-Time Compute via Meta Reinforcement Finetuning

Yuxiao Qu · Matthew Yang · Amrith Setlur · Lewis Tunstall · Edward Beeching · Russ Salakhutdinov · Aviral Kumar

Reasoning-as-Logic-Units: Scaling Test-Time Reasoning in Large Language Models Through Logic Unit Alignment

Cheryl Li · Tianyuan Xu · Yiwen Guo

Rethinking Chain-of-Thought from the Perspective of Self-Training

Zongqian Wu · Baoduo Xu · Ruochen Cui · Mengmeng Zhan · Xiaofeng Zhu · Lei Feng

Locate-then-edit for Multi-hop Factual Recall under Knowledge Editing

Zhuoran Zhang · Yongxiang Li · Zijian Kan · Keyuan Cheng · Lijie Hu · Di Wang

MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces

Loris Gaven · Thomas Carta · Clément Romac · Cédric Colas · sylvain lamprier · Olivier Sigaud · Pierre-Yves Oudeyer

InfAlign: Inference-aware language model alignment

Ananth Balashankar · Ziteng Sun · Jonathan Berant · Jacob Eisenstein · Michael Collins · Adrian Hutter · Jong Lee · Chirag Nagpal · Flavien Prost · Aradhana Sinha · Ananda Suresh · Ahmad Beirami

Neutral residues: revisiting adapters for model extension

Franck TALLA · Edouard Grave · Herve Jegou

Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capability

Zicheng Lin · Tian Liang · Jiahao Xu · Qiuzhi Liu · Xing Wang · Ruilin Luo · Chufan Shi · Siheng Li · Yujiu Yang · Zhaopeng Tu

An Interpretable N-gram Perplexity Threat Model for Large Language Model Jailbreaks

Valentyn Boreiko · Alexander Panfilov · Václav Voráček · Matthias Hein · Jonas Geiping

Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation

Jingyu Liu · Beidi Chen · Ce Zhang

Collapse or Thrive: Perils and Promises of Synthetic Data in a Self-Generating World

Joshua Kazdan · Rylan Schaeffer · Apratim Dey · Matthias Gerstgrasser · Rafael Rafailov · David Donoho · Sanmi Koyejo

Language Models May Verbatim Complete Text They Were Not Explicitly Trained On

Ken Ziyu Liu · Christopher A. Choquette Choo · Matthew Jagielski · Peter Kairouz · Sanmi Koyejo · Percy Liang · Nicolas Papernot

Scaling Laws for Upcycling Mixture-of-Experts Language Models

Seng Pei Liew · Takuya Kato · Sho Takase

CLOVER: Cross-Layer Orthogonal Vectors Pruning

Fanxu Meng · Pingzhi Tang · Fan Jiang · Muhan Zhang

Independence Tests for Language Models

Sally Zhu · Ahmed Ahmed · Rohith Kuditipudi · Percy Liang

GSM-$\infty$: How Do your LLMs Behave over Infinitely Increasing Reasoning Complexity and Context Length?

Yang Zhou · Hongyi Liu · Zhuoming Chen · Yuandong Tian · Beidi Chen

The Best of Both Worlds: Bridging Quality and Diversity in Data Selection with Bipartite Graph

Minghao Wu · Thuy-Trang Vu · Lizhen Qu · Reza Haffari

Compositional Generalization via Forced Rendering of Disentangled Latents

Qiyao Liang · Daoyuan Qian · Liu Ziyin · Ila R. Fiete

An Efficient Pruner for Large Language Model with Theoretical Guarantee

Canhong Wen · Yihong Zuo · Wenliang Pan

EvoMesh: Adaptive Physical Simulation with Hierarchical Graph Evolutions

Huayu Deng · Xiangming Zhu · Yunbo Wang · Xiaokang Yang

OmniBal: Towards Fast Instruction-Tuning for Vision-Language Models via Omniverse Computation Balance

Yongqiang Yao · Jingru Tan · Feizhao Zhang · Jiahao Hu · Yazhe Niu · JinXin · Bo Li · Pengfei Liu · Ruihao Gong · Dahua Lin · Ningyi Xu

Cost-efficient Collaboration between On-device and Cloud Language Models

Avanika Narayan · Dan Biderman · Sabri Eyuboglu · Avner May · Scott Linderman · James Zou · Christopher Re

DistiLLM-2: A Contrastive Approach Boosts the Distillation of LLMs

Jongwoo Ko · Tianyi Chen · Sungnyun Kim · Tianyu Ding · Luming Liang · Ilya Zharkov · Se-Young Yun

GRAM: A Generative Foundation Reward Model for Reward Generalization

Chenglong Wang · Yang Gan · Yifu Huo · Yongyu Mu · Qiaozhi He · MuRun Yang · Bei Li · Tong Xiao · Chunliang Zhang · Tongran Liu · Jingbo Zhu

Demonstration Selection for In-Context Learning via Reinforcement Learning

Xubin Wang · Jianfei Wu · Yuan Yichen · Deyu Cai · Mingzhe Li · Weijia Jia

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

KaShun SHUM · Yuzhen Huang · Hongjian Zou · dingqi · YiXuan Liao · Xiaoxin Chen · Qian Liu · Junxian He

AlphaVerus: Bootstrapping Formally Verified Code Generation through Self-Improving Translation and Treefinement

Pranjal Aggarwal · Bryan Parno · Sean Welleck

Does Graph Prompt Work? A Data Operation Perspective with Theoretical Analysis

Qunzhong WANG · Xiangguo Sun · Hong Cheng

Bootstrapping Self-Improvement of Language Model Programs for Zero-Shot Schema Matching

Nabeel Seedat · Mihaela van der Schaar

ResearchTown: Simulator of Human Research Community

Haofei Yu · Zhaochen Hong · Zirui Cheng · Kunlun Zhu · Keyang Xuan · Jinwei Yao · Tao Feng · Jiaxuan You

Pruning for GNNs: Lower Complexity with Comparable Expressiveness

Dun Ma · Jianguo Chen · Wenguo Yang · Suixiang Gao · Shengminjie Chen

SparseLoRA: Accelerating LLM Fine-Tuning with Contextual Sparsity

Samir Khaki · Xiuyu Li · Junxian Guo · Ligeng Zhu · Konstantinos N (Kostas) Plataniotis · Amir Yazdanbakhsh · Kurt Keutzer · Song Han · Zhijian Liu

TuCo: Measuring the Contribution of Fine-Tuning to Individual Responses of LLMs

Felipe Nuti · Tim Franzmeyer · Joao Henriques

Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models

Yukang Yang · Declan Campbell · Kaixuan Huang · Mengdi Wang · Jonathan Cohen · Taylor Webb

Heads up! Large Language Models Can Perform Tasks Without Your Instruction via Selective Attention Head Masking

Senyu Han · Hongchuan Zeng · Kai Yu · Lu Chen

Representative Language Generation

Charlotte Peale · Vinod Raman · Omer Reingold

LOGO --- Long cOntext aliGnment via efficient preference Optimization

Zecheng Tang · Zechen Sun · Juntao Li · Zhu Qiaoming · Min Zhang

Optimizing Large Language Model Training Using FP4 Quantization

Ruizhe Wang · Yeyun Gong · Xiao Liu · Guoshuai Zhao · Ziyue Yang · Baining Guo · Zheng-Jun Zha · Peng CHENG

Proposer-Agent-Evaluator (PAE): Autonomous Skill Discovery For Foundation Model Internet Agents

Yifei Zhou · Qianlan Yang · Kaixiang Lin · Min Bai · Xiong Zhou · Yu-Xiong Wang · Sergey Levine · Li Li

CateKV: On Sequential Consistency for Long-Context LLM Inference Acceleration

Haoyun Jiang · Haolin li · jianwei zhang · Fei Huang · Qiang Hu · Minmin Sun · Shuai Xiao · Yong Li · Junyang Lin · Jiangchao Yao

Adapting Precomputed Features for Efficient Graph Condensation

Yuan Li · Jun Hu · Zemin Liu · Bryan Hooi · Jia Chen · Bingsheng He

HyperNear: Unnoticeable Node Injection Attacks on Hypergraph Neural Networks

Tingyi Cai · Yunliang Jiang · Ming Li · Lu Bai · Changqin Huang · Yi Wang

Graph Adaptive Autoregressive Moving Average Models

Moshe Eliasof · Alessio Gravina · Andrea Ceni · Claudio Gallicchio · Davide Bacciu · Carola-Bibiane Schönlieb

LLM Enhancers for GNNs: An Analysis from the Perspective of Causal Mechanism Identification

Hang Gao · Huang Wenxuan · Fengge Wu · Zhao Junsuo · Changwen Zheng · Huaping Liu

RelGNN: Composite Message Passing for Relational Deep Learning

Tianlang Chen · Charilaos Kanatsoulis · Jure Leskovec

Beyond Message Passing: Neural Graph Pattern Machine

Zehong Wang · Zheyuan Zhang · Tianyi MA · Nitesh Chawla · Chuxu Zhang · Yanfang Ye

Beyond Topological Self-Explainable GNNs: A Formal Explainability Perspective

Steve Azzolin · SAGAR MALHOTRA · Andrea Passerini · Stefano Teso

Hierarchical Graph Tokenization for Molecule-Language Alignment

Yongqiang Chen · QUANMING YAO · Juzheng Zhang · James Cheng · Yatao Bian

ENAHPool: The Edge-Node Attention-based Hierarchical Pooling for Graph Neural Networks

Zhehan Zhao · Lu Bai · Lixin Cui · Ming Li · Ziyu Lyu · Lixiang Xu · Yue Wang · Edwin Hancock

MITIGATING OVER-EXPLORATION IN LATENT SPACE OPTIMIZATION USING LES

Omer Ronen · Ahmed Imtiaz Humayun · Richard Baraniuk · Randall Balestriero · Bin Yu

Improving the Diffusability of Autoencoders

Ivan Skorokhodov · Sharath Girish · Benran Hu · Willi Menapace · Yanyu Li · Rameen Abdal · Sergey Tulyakov · Aliaksandr Siarohin

I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models

Zhenxing Mi · Kuan-Chieh Wang · Guocheng Qian · Hanrong Ye · Runtao Liu · Sergey Tulyakov · Kfir Aberman · Dan Xu

ToMA: Token Merge with Attention for Diffusion Models

Wenbo Lu · Shaoyi Zheng · Yuxuan Xia · Shenji Wan

Epsilon-VAE: Denoising as Visual Decoding

Long Zhao · Sanghyun Woo · Ziyu Wan · Yandong li · Han Zhang · Boqing Gong · Hartwig Adam · Xuhui Jia · Ting Liu

Tractable Transformers for Flexible Conditional Generation

Anji Liu · Xuejie Liu · Dayuan Zhao · Mathias Niepert · Yitao Liang · Guy Van den Broeck

Elucidating Flow Matching ODE Dynamics via Data Geometry and Denoisers

Zhengchao Wan · Qingsong Wang · Gal Mishne · Yusu Wang

Variational Control for Guidance in Diffusion Models

Kushagra Pandey · Farrin Marouf Sofian · Felix Draxler · Theofanis Karaletsos · Stephan Mandt

Diffusion Counterfactual Generation with Semantic Abduction

Rajat Rasal · Avinash Kori · Fabio De Sousa Ribeiro · Tian Xia · Ben Glocker

MuseControlLite: Multifunctional Music Generation with Lightweight Conditioners

Fang-Duo Tsai · Shih-Lun Wu · Weijaw Lee · Sheng-Ping Yang · Bo-Rui Chen · Hao-Chung Cheng · Yi-Hsuan Yang

EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling

Theodoros Kouzelis · Ioannis Kakogeorgiou · Spyros Gidaris · Nikos Komodakis

Learning Robust Neural Processes with Risk-Averse Stochastic Optimization

Huafeng Liu · Yiran Fu · Liping Jing · Hui Li · Shuyang Lin · Jingyue Shi · Deqiang Ouyang · Jian Yu

Hessian Geometry of Latent Space in Generative Models

Alexander Lobashev · Dmitry Guskov · Maria Larchenko · Mikhail Tamm

Improving Flow Matching by Aligning Flow Divergence

Yuhao Huang · Taos Transue · Shih-Hsin Wang · William Feldman · Hong Zhang · Bao Wang

Reward-Guided Iterative Refinement in Diffusion Models at Test-Time with Applications to Protein and DNA Design

Masatoshi Uehara · su · Yulai Zhao · Xiner Li · Aviv Regev · Shuiwang Ji · Sergey Levine · Tommaso Biancalani

MODA: MOdular Duplex Attention for Multimodal Perception, Cognition, and Emotion Understanding

Zhicheng Zhang · Wuyou Xia · Chenxi Zhao · Zhou Yan · Xiaoqiang Liu · Yongjie Zhu · Wenyu Qin · Pengfei Wan · Di ZHANG · Jufeng Yang

Compute Optimal Inference and Provable Amortisation Gap in Sparse Autoencoders

Charles O'Neill · Alim Gumran · David Klindt

Rényi Neural Processes

Xuesong Wang · He Zhao · Edwin V. Bonilla

Direct Motion Models for Assessing Generated Videos

Kelsey Allen · Carl Doersch · Guangyao Zhou · Mohammed Suhail · Danny Driess · Ignacio Rocco · Yulia Rubanova · Thomas Kipf · Mehdi S. M. Sajjadi · Kevin Murphy · Joao Carreira · Sjoerd van Steenkiste

Highly Compressed Tokenizer Can Generate Without Training

Lukas Lao Beyer · Tianhong Li · Xinlei Chen · Sertac Karaman · Kaiming He

DCTdiff: Intriguing Properties of Image Generative Modeling in the DCT Space

Mang Ning · Mingxiao Li · Jianlin Su · Jia Haozhe · Lanmiao Liu · Martin Benes · Wenshuo Chen · Albert Ali Salah · Itir Onal Ertugrul

Diffusion Sampling Correction via Approximately 10 Parameters

Guangyi Wang · Wei Peng · lijiang Li · Wenyu Chen · Yuren Cai · Song-Zhi Su

Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation

Mingyu Kang · Yong Suk Choi

Scaling Video-Language Models to 10K Frames via Hierarchical Differential Distillation

CHUANQI CHENG · Jian Guan · Wei Wu · Rui Yan

GAPrompt: Geometry-Aware Point Cloud Prompt for 3D Vision Model

Zixiang Ai · Zichen Liu · Yuanhang Lei · Zhenyu Cui · Xu Zou · Jiahuan Zhou

LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding

Xiaoqian Shen · Yunyang Xiong · Changsheng Zhao · Lemeng Wu · Jun Chen · Chenchen Zhu · Zechun Liu · Fanyi Xiao · Balakrishnan Varadarajan · Florian Bordes · Zhuang Liu · Hu Xu · Hyunwoo Kim · Bilge Soran · Raghuraman Krishnamoorthi · Mohamed Elhoseiny · Vikas Chandra

Towards scientific discovery with dictionary learning: Extracting biological concepts from microscopy foundation models

Konstantin Donhauser · Kristina Ulicna · Gemma Moran · Aditya Ravuri · Kian Kenyon-Dean · Cian Eastwood · Jason Hartford

Exploring Criteria of Loss Reweighting to Enhance LLM Unlearning

Puning Yang · Qizhou Wang · Zhuo Huang · Tongliang Liu · Chengqi Zhang · Bo Han

MUDDFormer: Breaking Residual Bottlenecks in Transformers via Multiway Dynamic Dense Connections

Da Xiao · Qingye Meng · Shengping Li · xingyuan yuan

Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development

Daoyuan Chen · Haibin Wang · Yilun Huang · Ce Ge · Yaliang Li · Bolin Ding · Jingren Zhou

Distilling the Knowledge in Data Pruning

Emanuel Ben Baruch · Adam Botach · Igor Kviatkovsky · Manoj Aggarwal · Gerard Medioni

Sassha: Sharpness-aware Adaptive Second-order Optimization with Stable Hessian Approximation

Dahun Shin · Dongyeop Lee · Jinseok Chung · Namhoon Lee

Understanding the Logic of Direct Preference Alignment through Logic

Kyle Richardson · Vivek Srikumar · Ashish Sabharwal

Nonparametric Modern Hopfield Models

Jerry Yao-Chieh Hu · Bo-Yu Chen · Dennis Wu · Feng Ruan · Han Liu

EPIC: Efficient Position-Independent Caching for Serving Large Language Models

JUNHAO HU · Wenrui Huang · Weidong Wang · Haoyi Wang · tiancheng hu · zhang qin · Hao Feng · Xusheng Chen · Yizhou Shan · Tao Xie

LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models

Tzu-Tao (Tommy) Chang · Shivaram Venkataraman

MoH: Multi-Head Attention as Mixture-of-Head Attention

Peng Jin · Bo Zhu · Li Yuan · Shuicheng YAN

On the Emergence of Position Bias in Transformers

Xinyi Wu · Yifei Wang · Stefanie Jegelka · Ali Jadbabaie

ESPFormer: Doubly-Stochastic Attention with Expected Sliced Transport Plans

Ashkan Shahbazi · Elaheh Akbari · Darian Salehi · XINRAN LIU · Navid NaderiAlizadeh · Soheil Kolouri

Customizing the Inductive Biases of Softmax Attention using Structured Matrices

Yilun Kuang · Noah Amsel · Sanae Lotfi · Shikai Qiu · Andres Potapczynski · Andrew Wilson

Token Coordinated Prompt Attention is Needed for Visual Prompting

Zichen Liu · Xu Zou · Gang Hua · Jiahuan Zhou

How Transformers Learn Structured Data: Insights From Hierarchical Filtering

Jerome Garnier-Brun · Marc Mezard · Emanuele Moscato · Luca Saglietti

SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference

Jintao Zhang · Chendong Xiang · Haofeng Huang · Jia wei · Haocheng Xi · Jun Zhu · Jianfei Chen

Learning the RoPEs: Better 2D and 3D Position Encodings with STRING

Connor Schenck · Isaac Reid · Mithun Jacob · Alex Bewley · Joshua Ainslie · David Rendleman · Deepali Jain · Mohit Sharma · Kumar Avinava Dubey · Ayzaan Wahid · Sumeet Singh · René Wagner · Tianli Ding · Chuyuan Fu · Arunkumar Byravan · Jacob J Varley · Alexey Gritsenko · Matthias Minderer · Dmitry Kalashnikov · Jonathan Tompson · Vikas Sindhwani · Krzysztof Choromanski

Unpaired Point Cloud Completion via Unbalanced Optimal Transport

Taekyung Lee · Jaemoo Choi · Jaewoong Choi · Myungjoo Kang

Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning

Lianbo Ma · Jianlun Ma · Yuee Zhou · Guoyang Xie · Qiang He · Zhichao Lu

Physics-Informed DeepONets for drift-diffusion on metric graphs: simulation and parameter identification

Jan Blechschmidt · Tom-Christian Riemer · Max Winkler · Martin STOLL · Jan-Frederik Pietschmann

From Weight-Based to State-Based Fine-Tuning: Further Memory Reduction on LoRA with Parallel Control

Chi Zhang · REN Lianhai · Jingpu Cheng · Qianxiao Li

Leveraging Per-Instance Privacy for Machine Unlearning

Naz Sepahvand · Anvith Thudi · Berivan Isik · Ashmita Bhattacharyya · Nicolas Papernot · Eleni Triantafillou · Daniel Roy · Gintare Karolina Dziugaite

Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning

Fangwen Wu · Lechao Cheng · Shengeng Tang · Xiaofeng Zhu · Chaowei Fang · Dingwen Zhang · Meng Wang

BAnG: Bidirectional Anchored Generation for Conditional RNA Design

Roman Klypa · Alberto Bietti · Sergei Grudinin

Stay Hungry, Keep Learning: Sustainable Plasticity for Deep Reinforcement Learning

Huaicheng Zhou · Zifeng Zhuang · Donglin Wang

How to Synthesize Text Data without Model Collapse?

Xuekai Zhu · Daixuan Cheng · Hengli Li · Kaiyan Zhang · Ermo Hua · Xingtai Lv · Ning Ding · Zhouhan Lin · Zilong Zheng · Bowen Zhou

Explicit Discovery of Nonlinear Symmetries from Dynamic Data

Lexiang Hu · Yikang Li · Zhouchen Lin

STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization

Hao Li · Qi Lv · Rui Shao · Xiang Deng · Yinchuan Li · Jianye Hao · Liqiang Nie

Core Context Aware Transformers for Long Context Language Modeling

Yaofo Chen · Zeng You · Shuhai Zhang · Haokun Li · Yirui Li · Yaowei Wang · Mingkui Tan

Noise-Guided Predicate Representation Extraction and Diffusion-Enhanced Discretization for Scene Graph Generation

Guoqing Zhang · Shichao Kan · Fanghui Zhang · Wanru Xu · Yue Zhang · Yigang Cen

Position: Deep Learning is Not So Mysterious or Different

Andrew Wilson

Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process

Jing Yang

Position: Build Agent Advocates, Not Platform Agents

Sayash Kapoor · Noam Kolt · Seth Lazar

Position: Humanity Faces Existential Risk from Gradual Disempowerment

Jan Kulveit · Raymond Douglas · Nora Ammann · Deger Turan · David Krueger · David Duvenaud

Position: The Right to AI

Rashid Mushkani · Hugo Berard · Allison Cohen · Shin Koseki

Position: Strong Consumer Protection is an Inalienable Defense for AI Safety in the United States

Serena Booth

Position: Stop treating `AGI' as the north-star goal of AI research

Borhane Blili-Hamelin · Christopher Graziul · Leif Hancox-Li · Hananel Hazan · El-Mahdi El-Mhamdi · Avijit Ghosh · Katherine Heller · Jacob Metcalf · Fabricio Murai · Eryk Salvaggio · Andrew Smart · Todd Snider · Mariame Tighanimine · Talia Ringer · Margaret Mitchell · Shiri Dori-Hacohen

Adaptive Median Smoothing: Adversarial Defense for Unlearned Text-to-Image Diffusion Models at Inference Time

XIAOXUAN HAN · Songlin Yang · Wei Wang · Yang Li · JING DONG

AutoAdvExBench: Benchmarking Autonomous Exploitation of Adversarial Example Defenses

Nicholas Carlini · Edoardo Debenedetti · Javier Rando · Milad Nasr · Florian Tramer

Cannot See the Forest for the Trees: Invoking Heuristics and Biases to Elicit Irrational Choices of LLMs

Haoming Yang · Ke Ma · Xiaojun Jia · Yingfei Sun · Qianqian Xu · Qingming Huang

Position: The AI Conference Peer Review Crisis Demands Author Feedback and Reviewer Rewards

Jaeho Kim · Yunseok Lee · Seulki Lee

Position: Graph Learning Will Lose Relevance Due To Poor Benchmarks

Maya Bechler-Speicher · Ben Finkelshtein · Fabrizio Frasca · Luis Müller · Jan M Tönshoff · Antoine Siraudin · Viktor Zaverkin · Michael Bronstein · Mathias Niepert · Bryan Perozzi · Mikhail Galkin · Christopher Morris

Position: Explainable AI Cannot Advance Without Better User Studies

Matej Pičulin · Bernarda Petek · Irena Ograjenšek · Erik Štrumbelj

Position: Truly Self-Improving Agents Require Intrinsic Metacognitive Learning

Tennison Liu · Mihaela van der Schaar

The Ripple Effect: On Unforeseen Complications of Backdoor Attacks

Rui Zhang · Yun Shen · Hongwei Li · Wenbo Jiang · Hanxiao Chen · Yuan Zhang · Guowen Xu · Yang Zhang

Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards

ELITE: Enhanced Language-Image Toxicity Evaluation for Safety

Wonjun Lee · Doehyeon Lee · Eugene Choi · Sangyoon Yu · Ashkan Yousefpour · Haon Park · Bumsub Ham · Suhyun Kim

Improving Out-of-Distribution Detection with Markov Logic Networks

Konstantin Kirchheim · Frank Ortmeier

CASE-Bench: Context-Aware SafEty Benchmark for Large Language Models

Guangzhi Sun · Xiao Zhan · Shutong Feng · Phil Woodland · Jose Such

Towards Black-Box Membership Inference Attack for Diffusion Models

Jingwei Li · Jing Dong · Tianxing He · Jingzhao Zhang

STAIR: Improving Safety Alignment with Introspective Reasoning

Yichi Zhang · Siyuan Zhang · Yao Huang · Zeyu Xia · Zhengwei Fang · Xiao Yang · Ranjie Duan · Dong Yan · Yinpeng Dong · Jun Zhu

Underestimated Privacy Risks for Minority Populations in Large Language Model Unlearning

Rongzhe Wei · Mufei Li · Mohsen Ghassemi · Eleonora Kreacic · Yifan Li · Xiang Yue · Bo Li · Vamsi Potluru · Pan Li · Eli Chien

Breaking the $n^{1.5}$ Additive Error Barrier for Private and Efficient Graph Sparsification via Private Expander Decomposition

Anders Aamand · Justin Chen · Mina Dalirrooyfard · Slobodan Mitrovic · Yuriy Nevmyvaka · Sandeep Silwal · Yinzhan Xu

Test-time Adapted Reinforcement Learning with Action Entropy Regularization

Shoukai Xu · ZihaoLian · Mingkui Tan · Liu Liu · Zhong Zhang · Peilin Zhao

Breaking the Quadratic Barrier: Robust Cardinality Sketches for Adaptive Queries

Edith Cohen · Mihir Singhal · Uri Stemmer

Information Bottleneck-guided MLPs for Robust Spatial-temporal Forecasting

Min Chen · Guansong Pang · Wenjun Wang · Cheng Yan

Scaling Trends in Language Model Robustness

Nikolaus Howe · Ian McKenzie · Oskar Hollinsworth · Michał Zając · Tom Tseng · Aaron Tucker · Pierre-Luc Bacon · Adam Gleave

Automated Red Teaming with GOAT: the Generative Offensive Agent Tester

Maya Pavlova · Erik Brinkman · Krithika Iyer · Vítor Albiero · Joanna Bitton · Hailey Nguyen · Cristian Canton · Ivan Evtimov · Aaron Grattafiori

Differentially Private Space-Efficient Algorithms for Counting Distinct Elements in the Turnstile Model

Rachel Cummings · Alessandro Epasto · Jieming Mao · Tamalika Mukherjee · Tingting Ou · Peilin Zhong

Improved Sample Complexity for Private Nonsmooth Nonconvex Optimization

Guy Kornowski · Daogao Liu · Kunal Talwar

Differentially Private Boxplots

Kelly Ramsay · Jairo Diaz-Rodriguez

Rethinking the Temperature for Federated Heterogeneous Distillation

Fan Qi · Daxu Shi · Chuokun Xu · Shuai Li · Changsheng Xu

Gradient Inversion of Multimodal Models

Omri Ben Hemo · Alon Zolfi · Oryan Yehezkel · Omer Hofman · Roman Vainshtein · Hisashi Kojima · Yuval Elovici · Asaf Shabtai

Faster Rates for Private Adversarial Bandits

Hilal Asi · Vinod Raman · Kunal Talwar

On the Private Estimation of Smooth Transport Maps

Clément Lalanne · Franck Iutzeler · Loubes Jean-Michel · Julien Chhor

Go to Event Page

Town Hall

1:00 PM - 2:00 PM

Invited Talk

Closing the Loop: Machine Learning for Optimization and Discovery

Andreas Krause

2:00 PM - 3:00 PM

How can we accelerate scientific discovery when experiments are costly and uncertainty is high? From protein engineering to robotics, data efficiency is critical—but advances in lab automation and the rise of foundation models are creating rich new opportunities for intelligent exploration. In this talk, I’ll share recent work toward closing the loop between learning and experimentation, drawing on active learning, Bayesian optimization, and reinforcement learning. I’ll show how we can guide exploration in complex, high-dimensional spaces; how meta-learned generative priors enable rapid adaptation from simulation to reality; and how even foundation models can be adaptively steered at test time to reduce their epistemic uncertainty. I’ll conclude by highlighting key challenges and exciting opportunities for machine learning to drive optimization and discovery across science and engineering.

... more

Speaker Bio

Andreas Krause is a Professor of Computer Science at ETH Zurich, where he leads the Learning & Adaptive Systems Group, serves as Academic Co-Director of the Swiss Data Science Center, Chair of the ETH AI Center, and co-founded the ETH spin-off LatticeFlow AI. He is a Fellow at the Max Planck Institute for Intelligent Systems, ACM Fellow, IEEE Fellow, ELLIS Fellow and a Microsoft Research Faculty Fellow. He received the Rössler Prize, ERC Starting Investigator and Consolidator grants, the German Pattern Recognition Award, an NSF CAREER award, Test of Time awards at KDD 2019 and ICML 2020, as well as the ETH Golden Owl teaching award. Andreas Krause served as Program Co-Chair for ICML 2018 and General Chair for ICML 2023 and serves as Action Editor for the Journal of Machine Learning Research. From 2023-24, he served on the United Nations’ High-level Advisory Body on AI.

... more

Oral

Oral 6B Deep Learning Architectures

3:30 PM - 4:30 PM

4 Events in this session

Retrieval-Augmented Perception: High-resolution Image Perception Meets Visual RAG

Wenbin Wang · Yongcheng Jing · Liang Ding · Yingjie Wang · Li Shen · Yong Luo · Bo Du · Dacheng Tao

AutoGFM: Automated Graph Foundation Model with Adaptive Architecture Customization

Haibo Chen · Xin Wang · Zeyang Zhang · Haoyang Li · Ling Feng · Wenwu Zhu

Normalizing Flows are Capable Generative Models

Shuangfei Zhai · Ruixiang Zhang · Preetum Nakkiran · David Berthelot · Jiatao Gu · Huangjie Zheng · Tianrong Chen · Miguel Angel Bautista Martin · Navdeep Jaitly · Joshua M Susskind

In-Context Denoising with One-Layer Transformers: Connections between Attention and Associative Memory Retrieval

Matthew Smart · Alberto Bietti · Anirvan Sengupta

Go to Event Page

Oral

Oral 6D Evaluation

3:30 PM - 4:30 PM

4 Events in this session

On Path to Multimodal Generalist: General-Level and General-Bench

Hao Fei · Yuan Zhou · Juncheng Li · Xiangtai Li · Qingshan Xu · Bobo Li · Shengqiong Wu · Yaoting Wang · Junbao Zhou · Jiahao Meng · Qingyu Shi · Zhiyuan Zhou · Liangtao Shi · Minghe Gao · Daoan Zhang · Zhiqi Ge · Siliang Tang · Kaihang Pan · Yaobo Ye · Haobo Yuan · Tao Zhang · Weiming Wu · Tianjie Ju · Zixiang Meng · Shilin Xu · Liyu Jia · Wentao Hu · Meng Luo · Jiebo Luo · Tat-Seng Chua · Shuicheng YAN · Hanwang Zhang

What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities

Wendong Bu · Yang Wu · Qifan Yu · Minghe Gao · Bingchen Miao · Zhenkui Zhang · Kaihang Pan · liyunfei · Mengze Li · Wei Ji · Juncheng Li · Siliang Tang · Yueting Zhuang

How Do Large Language Monkeys Get Their Power (Laws)?

Rylan Schaeffer · Joshua Kazdan · John Hughes · Jordan Juravsky · Sara Price · Aengus Lynch · Erik Jones · Robert Kirk · Azalia Mirhoseini · Sanmi Koyejo

Suitability Filter: A Statistical Framework for Classifier Evaluation in Real-World Deployment Settings

Angéline Pouget · Mohammad Yaghini · Stephan Rabanser · Nicolas Papernot

Go to Event Page

Oral

Oral 6E Social and Economic Perspectives

3:30 PM - 4:30 PM

4 Events in this session

The Value of Prediction in Identifying the Worst-Off

Unai Fischer Abaigar · Christoph Kern · Juan Perdomo

Generative Social Choice: The Next Generation

Niclas Boehmer · Sara Fish · Ariel Procaccia

Statistical Collusion by Collectives on Learning Platforms

Etienne Gauthier · Francis Bach · Michael Jordan

Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All

Ermis Soumalias · Jakob Heiss · Jakob Weissteiner · Sven Seuken

Go to Event Page

Oral

Oral 6A Applications in Agents and Coding

3:30 PM - 4:30 PM

4 Events in this session

EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents

Rui Yang · Hanyang(Jeremy) Chen · Junyu Zhang · Mark Zhao · Cheng Qian · Kangrui Wang · Qineng Wang · Teja Koripella · Marziyeh Movahedi · Manling Li · Heng Ji · Huan Zhang · Tong Zhang

SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?

Samuel Miserendino · Michele Wang · Tejal Patwardhan · Johannes Heidecke

CodeIO: Condensing Reasoning Patterns via Code Input-Output Prediction

Junlong Li · Daya Guo · Dejian Yang · Runxin Xu · Yu Wu · Junxian He

ITBench: Evaluating AI Agents across Diverse Real-World IT Automation Tasks

Saurabh Jha · Rohan Arora · Yuji Watanabe · Takumi Yanagawa · Yinfang Chen · Jackson Clark · Bhavya Bhavya · Mudit Verma · Harshit Kumar · Hirokuni Kitahara · Noah Zheutlin · Saki Takano · Divya Pathak · Felix George · Xinbo Wu · Bekir Turkkan · Gerard Vanloo · Michael Nidd · Ting Dai · Oishik Chatterjee · Pranjal Gupta · Suranjana Samanta · Pooja Aggarwal · Rong Lee · Jae-wook Ahn · Debanjana Kar · Amit Paradkar · Yu Deng · Pratibha Moogi · Prateeti Mohapatra · Naoki Abe · Chandrasekhar Narayanaswami · Tianyin Xu · Lav Varshney · Ruchi Mahindru · Anca Sailer · Laura Shwartz · Daby Sow · Nicholas Fuller · Ruchir Puri

Go to Event Page

Oral

Oral 6C Learning Dynamics 2

3:30 PM - 4:30 PM

4 Events in this session

Learning dynamics in linear recurrent neural networks

Alexandra Proca · Clémentine Dominé · Murray Shanahan · Pedro Mediano

LoRA Training Provably Converges to a Low-Rank Global Minimum Or It Fails Loudly (But it Probably Won't Fail)

Junsu Kim · Jaeyeon Kim · Ernest Ryu

LoRA-One: One-Step Full Gradient Could Suffice for Fine-Tuning Large Language Models, Provably and Efficiently

Yuanhe Zhang · Fanghui Liu · Yudong Chen

Implicit Regularization for Tubal Tensor Factorizations via Gradient Descent

Santhosh Karnik · Anna Veselovska · Mark Iwen · Felix Krahmer

Go to Event Page

Poster

Poster Session 6 West

4:30 PM - 7:00 PM

213 Events in this session

From Feature Interaction to Feature Generation: A Generative Paradigm of CTR Prediction Models

MINGJIA YIN · Junwei Pan · Hao Wang · Ximei Wang · Shangyu Zhang · Jie Jiang · Defu Lian · Enhong Chen

RepLoRA: Reparameterizing Low-rank Adaptation via the Perspective of Mixture of Experts

Tuan Truong · Chau Nguyen · Huy Nguyen · Minh Le · Trung Le · Nhat Ho

NEAR: Neural Electromagnetic Array Response

Yinyan Bu · Jiajie Yu · Kai Zheng · Xinyu Zhang · Piya Pal

Sort Before You Prune: Improved Worst-Case Guarantees of the DiskANN Family of Graphs

Siddharth Gollapudi · Ravishankar Krishnaswamy · Kirankumar Shiragur · Harsh Wardhan

Designing Cyclic Peptides via Harmonic SDE with Atom-Bond Modeling

Xiangxin Zhou · Mingyu Li · xiao yi · Jiahan Li · Dongyu Xue · Zaixiang Zheng · Jianzhu Ma · Quanquan Gu

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

Xinyu Liu · Zixuan Xie · Shangtong Zhang

Incentivize without Bonus: Provably Efficient Model-based Online Multi-agent RL for Markov Games

Tong Yang · Bo Dai · Lin Xiao · Yuejie Chi

Convergence of Policy Mirror Descent Beyond Compatible Function Approximation

Uri Sherman · Tomer Koren · Yishay Mansour

Competitively Consistent Clustering

Niv Buchbinder · Roie Levin · Yue Yang

Robust Sparsification via Sensitivity

Chansophea Wathanak In · Yi Li · David Woodruff · Xuan Wu

Maximum Coverage in Turnstile Streams with Applications to Fingerprinting Measures

Alina Ene · Alessandro Epasto · Vahab Mirrokni · Hoai-An Nguyen · Huy Nguyen · David Woodruff · Peilin Zhong

Polynomial-Time Approximability of Constrained Reinforcement Learning

Jeremy McMahan

Fixed-Confidence Multiple Change Point Identification under Bandit Feedback

Joseph Lazzaro · Ciara Pike-Burke

No Free Lunch from Random Feature Ensembles: Scaling Laws and Near-Optimality Conditions

Benjamin Ruben · William Tong · Hamza Chaudhry · Cengiz Pehlevan

An Error Analysis of Flow Matching for Deep Generative Modeling

Zhengyu Zhou · Weiwei Liu

Synthesizing Software Engineering Data in a Test-Driven Manner

Lei Zhang · Jiaxi Yang · Min Yang · Jian Yang · Mouxiang Chen · Jiajun Zhang · Zeyu Cui · Binyuan Hui · Junyang Lin

Provably Efficient RL for Linear MDPs under Instantaneous Safety Constraints in Non-Convex Feature Spaces

Amirhossein Roknilamouki · Arnob Ghosh · Ming Shi · Fatemeh Nourzad · Eylem Ekici · Ness Shroff

ITBench: Evaluating AI Agents across Diverse Real-World IT Automation Tasks

Towards Practical Defect-Focused Automated Code Review

Junyi Lu · Lili Jiang · Xiaojia Li · Jianbing Fang · Fengjun Zhang · Li Yang · Chun Zuo

POQD: Performance-Oriented Query Decomposer for Multi-vector retrieval

Yaoyang Liu · Junlin Li · Yinjun Wu · Zhen Chen

Deep Neural Cellular Potts Models

Koen Minartz · Tim d'Hondt · Leon Hillmann · Jörn Starruß · Lutz Brusch · Vlado Menkovski

An All-Atom Generative Model for Designing Protein Complexes

Ruizhe Chen · Dongyu Xue · Xiangxin Zhou · Zaixiang Zheng · xiangxiang Zeng · Quanquan Gu

AnalogGenie-Lite: Enhancing Scalability and Precision in Circuit Topology Discovery through Lightweight Graph Modeling

Jian Gao · Weidong Cao · Xuan Zhang

Reinforced Learning Explicit Circuit Representations for Quantum State Characterization from Local Measurements

Manwen Liao · Yan Zhu · Weitian Zhang · Yuxiang Yang

M2PDE: Compositional Generative Multiphysics and Multi-component PDE Simulation

Tao Zhang · Zhenhai Liu · Feipeng Qi · Yongjun Jiao · Tailin Wu

UniMate: A Unified Model for Mechanical Metamaterial Generation, Property Prediction, and Condition Confirmation

Wangzhi Zhan · Chen Jianpeng · Dongqi Fu · Dawei Zhou

From Uncertain to Safe: Conformal Adaptation of Diffusion Models for Safe PDE Control

Peiyan Hu · Xiaowei Qian · Wenhao Deng · Rui Wang · Haodong Feng · Ruiqi Feng · Tao Zhang · Long Wei · Yue Wang · Zhi-Ming Ma · Tailin Wu

Rethink the Role of Deep Learning towards Large-scale Quantum Systems

Yusheng Zhao · Chi Zhang · Yuxuan Du

Calibrated Physics-Informed Uncertainty Quantification

Vignesh Gopakumar · Ander Gray · Lorenzo Zanisi · Timothy Nunn · Daniel Giles · Matt Kusner · Stanislas Pamela · Marc Deisenroth

Physics-Informed Weakly Supervised Learning For Interatomic Potentials

Makoto Takamoto · Viktor Zaverkin · Mathias Niepert

ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation

Angxiao Yue · Zichong Wang · Hongteng Xu

Unisoma: A Unified Transformer-based Solver for Multi-Solid Systems

Shilong Tao · Zhe Feng · Haonan Sun · Zhanxing Zhu · Yunhuai Liu

ELoRA: Low-Rank Adaptation for Equivariant GNNs

Chen Wang · Siyu Hu · Guangming Tan · Weile Jia

Holistic Physics Solver: Learning PDEs in a Unified Spectral-Physical Space

Xihang Yue · Yi Yang · Linchao Zhu

SCENT: Robust Spatiotemporal Learning for Continuous Scientific Data via Scalable Conditioned Neural Fields

David K Park · Xihaier Luo · Guang Zhao · Seungjun Lee · Miruna Oprescu · Shinjae Yoo

Semi-Supervised Blind Quality Assessment with Confidence-quantifiable Pseudo-label Learning for Authentic Images

Yan Zhong · Chenxi Yang · Suyuan Zhao · Tingting Jiang

L-Diffusion: Laplace Diffusion for Efficient Pathology Image Segmentation

Weihan Li · Linyun Zhou · YangJian · Shengxuming Zhang · Xiangtong Du · Xiuming Zhang · Jing Zhang · Chaoqing Xu · Mingli Song · Zunlei Feng

Improving LLM Video Understanding with 16 Frames Per Second

Yixuan Li · Changli Tang · Jimin Zhuang · Yudong Yang · Guangzhi Sun · Wei Li · Zejun MA · Chao Zhang

What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities

Wendong Bu · Yang Wu · Qifan Yu · Minghe Gao · Bingchen Miao · Zhenkui Zhang · Kaihang Pan · liyunfei · Mengze Li · Wei Ji · Juncheng Li · Siliang Tang · Yueting Zhuang

Enhancing Visual Localization with Cross-Domain Image Generation

Yuanze Wang · Yichao Yan · Shiming Song · Jin · Yilan Huang · Xingdong Sheng · Dianxi Shi

Learning Attribute-Aware Hash Codes for Fine-Grained Image Retrieval via Query Optimization

Peng Wang · Yong Li · Lin Zhao · Xiu-Shen Wei

One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation

Jianze Li · Jiezhang Cao · Yong Guo · Wenbo Li · Yulun Zhang

Large Displacement Motion Transfer with Unsupervised Anytime Interpolation

Guixiang Wang · Jianjun Li

Staged and Physics-Grounded Learning Framework with Hyperintensity Prior for Pre-Contrast MRI Synthesis

Dayang Wang · Srivathsa Pasumarthi Venkata · Ajit Shankaranarayanan · Greg Zaharchuk

History-Guided Video Diffusion

Kiwhan Song · Boyuan Chen · Max Simchowitz · Yilun Du · Russ Tedrake · Vincent Sitzmann

CAD-Editor: A Locate-then-Infill Framework with Automated Training Data Synthesis for Text-Based CAD Editing

Yu Yuan · Shizhao Sun · Qi Liu · Jiang Bian

IRBridge: Solving Image Restoration Bridge with Pre-trained Generative Diffusion Models

Hanting Wang · Tao Jin · Wang Lin · Shulei Wang · Hai Huang · Shengpeng Ji · Zhou Zhao

LightningDrag: Lightning Fast and Accurate Drag-based Image Editing Emerging from Videos

Yujun Shi · Jun Hao Liew · Hanshu Yan · Vincent Tan · Jiashi Feng

InfoSAM: Fine-Tuning the Segment Anything Model from An Information-Theoretic Perspective

Yuanhong Zhang · Muyao Yuan · Weizhan Zhang · Tieliang Gong · Wen Wen · Jiangyong Ying · Weijie Shi

ConText: Driving In-context Learning for Text Removal and Segmentation

Fei Zhang · Pei Zhang · Baosong Yang · Fei Huang · Yanfeng Wang · Ya Zhang

Point Cloud Dataset Distillation

Deyu Bo · Xinchao Wang

FuseUNet: A Multi-Scale Feature Fusion Method for U-like Networks

Quansong He · Xiangde Min · Kaishen Wang · Tao He

IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models

Hang Guo · Yawei Li · Tao Dai · Shutao Xia · Luca Benini

Continual Generalized Category Discovery: Learning and Forgetting from a Bayesian Perspective

Hao Dai · Jagmohan Chauhan

Elucidating the design space of language models for image generation

Xuantong Liu · Shaozhe Hao · Xianbiao Qi · Tianyang Hu · JUN WANG · Rong Xiao · Yuan YAO

An Empirical Study on Configuring In-Context Learning Demonstrations for Unleashing MLLMs' Sentimental Perception Capability

Daiqing Wu · Dongbao Yang · Sicheng Zhao · Can Ma · Yu ZHOU

Action Dubber: Timing Audible Actions via Inflectional Flow

Wenlong Wan · Weiying Zheng · Tianyi Xiang · Guiqing Li · Shengfeng He

MaskTwins: Dual-form Complementary Masking for Domain-Adaptive Image Segmentation

Jiawen Wang · Yinda Chen · Xiaoyu Liu · che liu · Dong Liu · Jianqing Gao · Zhiwei Xiong

Decomposition of Graphic Design with Unified Multimodal Model

Hui Nie · Zhao Zhang · Yutao Cheng · Maoke Yang · Gonglei Shi · Qingsong Xie · Jie Shao · Xinglong Wu

Efficient Multi-modal Long Context Learning for Training-free Adaptation

Zehong Ma · Shiliang Zhang · Longhui Wei · Qi Tian

Human Body Restoration with One-Step Diffusion Model and A New Benchmark

Jue Gong · Jingkai Wang · Zheng Chen · Xing Liu · Hong Gu · Yulun Zhang · Xiaokang Yang

Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots

Guangting Zheng · Yehao Li · Yingwei Pan · Jiajun Deng · Ting Yao · Yanyong Zhang · Tao Mei

Unlocking the Capabilities of Large Vision-Language Models for Generalizable and Explainable Deepfake Detection

Peipeng Yu · Jianwei Fei · Hui Gao · Xuan Feng · Zhihua Xia · Chip Hong Chang

DocVXQA: Context-Aware Visual Explanations for Document Question Answering

Mohamed Ali Souibgui · Changkyu Choi · Andrey Barsky · Kangsoo Jung · Ernest Valveny · Dimosthenis Karatzas

Ex-VAD: Explainable Fine-grained Video Anomaly Detection Based on Visual-Language Models

Chao Huang · Yushu Shi · Jie Wen · Wei Wang · Yong Xu · Xiaochun Cao

ADHMR: Aligning Diffusion-based Human Mesh Recovery via Direct Preference Optimization

Wenhao Shen · Wanqi Yin · Xiaofeng Yang · Cheng Chen · Chaoyue Song · Zhongang Cai · Lei Yang · Hao Wang · Guosheng Lin

BiMaCoSR: Binary One-Step Diffusion Model Leveraging Flexible Matrix Compression for Real Super-Resolution

Kai Liu · Kaicheng Yang · Zheng Chen · Zhiteng Li · Yong Guo · Wenbo Li · Linghe Kong · Yulun Zhang

Confounder-Free Continual Learning via Recursive Feature Normalization

Yash Shah · Camila Gonzalez · MohammadHassan Abbasi · Qingyu Zhao · Kilian M Pohl · Ehsan Adeli

AffinityFlow: Guided Flows for Antibody Affinity Maturation

Can Chen · Karla-Luise Herpoldt · Chenchao Zhao · Zichen Wang · Marcus Collins · Shang Shang · Ron Benson

SToFM: a Multi-scale Foundation Model for Spatial Transcriptomics

Suyuan Zhao · YIZHEN LUO · Ganbo Yang · Yan Zhong · Hao Zhou · Zaiqing Nie

H-Tuning: Toward Low-Cost and Efficient ECG-based Cardiovascular Disease Detection with Pre-Trained Models

Rushuang Zhou · Yuanting Zhang · Yining Dong

Multimodal Medical Code Tokenizer

Xiaorui Su · Shvat Messica · Yepeng Huang · Ruth Johnson · Lukas Fesser · Shanghua Gao · Faryad Sahneh · Marinka Zitnik

HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation

Tianwei Lin · Wenqiao Zhang · Sijing Li · Yuqian Yuan · Binhe Yu · Haoyuan Li · Wanggui He · Hao Jiang · Mengze Li · Song xiaohui · Siliang Tang · Jun Xiao · Hui Lin · Yueting Zhuang · Beng Chin Ooi

An Online Adaptive Sampling Algorithm for Stochastic Difference-of-convex Optimization with Time-varying Distributions

Yuhan Ye · Ying Cui · Jingyi Wang

From Token to Rhythm: A Multi-Scale Approach for ECG-Language Pretraining

Fuying Wang · Jiacheng Xu · Lequan Yu

Global Context-aware Representation Learning for Spatially Resolved Transcriptomics

Yunhak Oh · Junseok Lee · Yeongmin Kim · Sangwoo Seo · Namkyeong Lee · Chanyoung Park

Distributed Parallel Gradient Stacking(DPGS): Solving Whole Slide Image Stacking Challenge in Multi-Instance Learning

Boyuan Wu · wang · Xianwei Lin · Jiachun Xu · Jikai Yu · Zhou Shicheng · Hongda Chen · Lianxin Hu

P(all-atom) Is Unlocking New Path For Protein Design

Wei Qu · Jiawei Guan · Rui Ma · kezhai · weikun wu · haobo Wang

Active Evaluation Acquisition for Efficient LLM Benchmarking

Yang Li · Jie Ma · Miguel Ballesteros · Yassine Benajiba · Graham Horwood

Overcoming Non-monotonicity in Transducer-based Streaming Generation

Zhengrui Ma · Yang Feng · Min zhang

From Complex to Atomic: Enhancing Augmented Generation via Knowledge-Aware Dual Rewriting and Reasoning

Jinyu Wang · Jingjing Fu · Rui Wang · Lei Song · Jiang Bian

ALMTokenizer: A Low-bitrate and Semantic-rich Audio Codec Tokenizer for Audio Language Modeling

Dongchao Yang · Songxiang Liu · Haohan Guo · Jiankun Zhao · Yuanyuan Wang · Helin Wang · Zeqian Ju · Xubo Liu · Xueyuan Chen · Xu Tan · Xixin Wu · Helen M Meng

KBQA-o1: Agentic Knowledge Base Question Answering with Monte Carlo Tree Search

Haoran Luo · Haihong E · Yikai Guo · Qika Lin · Xiaobao Wu · Xinyu Mu · Wenhao Liu · Meina Song · Yifan Zhu · Anh Tuan Luu

Flow Matching for Denoised Social Recommendation

Yinxuan Huang · KE LIANG · Zhuofan Dong · Xiaodong Qu · Wang Tianxiang · Yue Han · Jingao Xu · Bin Zhou · Ye Wang

EvoControl: Multi-Frequency Bi-Level Control for High-Frequency Continuous Control

Samuel Holt · Todor Davchev · Dhruva Tirumala · Ben Moran · Atil Iscen · Antoine Laurens · Yixin Lin · Erik Frey · Markus Wulfmeier · Francesco Romano · Nicolas Heess

Learning Efficient Robotic Garment Manipulation with Standardization

zhou changshi · Feng Luan · hujiarui · Shaoqiang Meng · Zhipeng Wang · Yanchao Dong · Yanmin Zhou · Bin He

Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models

Lucy Xiaoyang Shi · brian ichter · Michael Equi · Liyiming Ke · Karl Pertsch · Quan Vuong · James Tanner · Anna Walling · Haohuan Wang · Niccolo Fusai · Adrian Li · Danny Driess · Lachy Groom · Sergey Levine · Chelsea Finn

Falcon: Fast Visuomotor Policies via Partial Denoising

Haojun Chen · Minghao Liu · Chengdong Ma · Xiaojian Ma · Zailin Ma · Huimin Wu · Yuanpei Chen · Yifan Zhong · Mingzhi Wang · Qing Li · Yaodong Yang

Learning Safe Control via On-the-Fly Bandit Exploration

Alexandre Capone · Ryan Cosner · Aaron Ames · Sandra Hirche

UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent

Jianke Zhang · Yanjiang Guo · Yucheng Hu · Xiaoyu Chen · Xiang Zhu · Jianyu Chen

BiAssemble: Learning Collaborative Affordance for Bimanual Geometric Assembly

Yan Shen · Ruihai Wu · Yubin Ke · Xinyuan Song · Zeyi Li · Xiaoqi Li · Hongwei Fan · Haoran Lu · Hao Dong

Rethinking Latent Redundancy in Behavior Cloning: An Information Bottleneck Approach for Robot Manipulation

Shuanghao Bai · Wanqi Zhou · Pengxiang Ding · Wei Zhao · Donglin Wang · Badong Chen

ReinboT: Amplifying Robot Visual-Language Manipulation with Reinforcement Learning

Hongyin Zhang · Zifeng Zhuang · Han Zhao · Pengxiang Ding · Hongchao Lu · Donglin Wang

One-Step Diffusion Policy: Fast Visuomotor Policies via Diffusion Distillation

Zhendong Wang · Max Li · Ajay Mandlekar · Zhenjia Xu · Jiaojiao Fan · Yashraj Narang · Jim Fan · Yuke Zhu · Yogesh Balaji · Mingyuan Zhou · Ming-Yu Liu · Yu Zeng

DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning

Gaoyue Zhou · Hengkai Pan · Yann LeCun · Lerrel Pinto

TeLoGraF: Temporal Logic Planning via Graph-encoded Flow Matching

Yue Meng · Chuchu Fan

SpikeVideoFormer: An Efficient Spike-Driven Video Transformer with Hamming Attention and $\mathcal{O}(T)$ Complexity

Shihao Zou · Qingfeng Li · Wei Ji · Jingjing Li · Yongkui Yang · Guoqi Li · Chao Dong

Neural Encoding and Decoding at Scale

Yizi Zhang · Yanchen Wang · Mehdi Azabou · Alexandre Andre · Zixuan Wang · Hanrui Lyu · International Brain Laboratory · Eva Dyer · Department of Statistics Liam Paninski · Cole Hurwitz

Contour Integration Underlies Human-Like Vision

Ben Lonnqvist · Elsa Scialom · Abdulkadir Gokce · Zehra Merchant · Michael Herzog · Martin Schrimpf

CogReact: A Reinforced Framework to Model Human Cognitive Reaction Modulated by Dynamic Intervention

Songlin Xu · Xinyu Zhang

Revisiting Noise Resilience Strategies in Gesture Recognition: Short-Term Enhancement in sEMG Analysis

Weiyu Guo · Ziyue Qiao · Ying Sun · Yijie Xu · Hui Xiong

OWLS: Scaling Laws for Multilingual Speech Recognition and Translation Models

William Chen · Jinchuan Tian · Yifan Peng · Brian Yan · Chao-Han Yang · Shinji Watanabe

Grammar-Forced Translation of Natural Language to Temporal Logic using LLMs

William English · Dominic Simon · Sumit Jha · Rickard Ewetz

DMOSpeech: Direct Metric Optimization via Distilled Diffusion Model in Zero-Shot Speech Synthesis

Yinghao Li · Rithesh Kumar · Zeyu Jin

Reducing Tool Hallucination via Reliability Alignment

Hongshen Xu · Zichen Zhu · Lei Pan · Zihan Wang · Su Zhu · Da Ma · Ruisheng Cao · Lu Chen · Kai Yu

FIC-TSC: Learning Time Series Classification with Fisher Information Constraint

Xiwen Chen · Wenhui Zhu · Peijie Qiu · Hao Wang · Huayu Li · ZIHAN LI · Yalin Wang · Aristeidis Sotiras · Abolfazl Razi

ITFormer: Bridging Time Series and Natural Language for Multi-Modal QA with Large-Scale Multitask Dataset

Yilin Wang · Peixuan Lei · Jie Song · Haoyuzhe · chen tao · Yuxuan Zhang · LEI JIA · Yuanxiang Li · Zhongyu Wei

CFPT: Empowering Time Series Forecasting through Cross-Frequency Interaction and Periodic-Aware Timestamp Modeling

Feifei Kou · Jiahao Wang · Lei Shi · Yuhan Yao · Yawen Li · Suguo Zhu · Zhongbao Zhang · Junping Du

FSTLLM: Spatio-Temporal LLM for Few Shot Time Series Forecasting

Yue Jiang · Yile Chen · Xiucheng Li · Qin Chao · SHUAI LIU · Gao Cong

MARS: Unleashing the Power of Variance Reduction for Training Large Models

Huizhuo Yuan · Yifeng Liu · Shuang Wu · zhou Xun · Quanquan Gu

A Non-isotropic Time Series Diffusion Model with Moving Average Transitions

Chenxi Wang · Linxiao Yang · Zhixian Wang · Liang Sun · Yi Wang

CVE-Bench: A Benchmark for AI Agents’ Ability to Exploit Real-World Web Application Vulnerabilities

Yuxuan Zhu · Antony Kellermann · Dylan Bowman · Philip Li · Akul Gupta · Adarsh Danda · Richard Fang · Conner Jensen · Eric Ihli · Jason Benn · Jet Geronimo · Avi Dhir · Sudhit Rao · Kaicheng Yu · Twm Stone · Daniel Kang

Targeted control of fast prototyping through domain-specific interface

Yu-Zhe Shi · Mingchen Liu · Hanlu Ma · Qiao Xu · Huamin Qu · Kun He · Lecheng Ruan · Qining Wang

CodeSync: Synchronizing Large Language Models with Dynamic Code Evolution at Scale

Chenlong Wang · Zhaoyang Chu · Zhengxiang Cheng · Xuyi Yang · Kaiyue Qiu · Yao Wan · Zhou Zhao · Xuanhua Shi · Hai Jin · Dongping Chen

Curriculum Learning for Biological Sequence Prediction: The Case of De Novo Peptide Sequencing

Xiang Zhang · Jiaqi Wei · Zijie Qiu · Sheng Xu · Nanqing Dong · ZhiQiang Gao · Siqi Sun

DeepLayout: Learning Neural Representations of Circuit Placement Layout

Yuxiang Zhao · zhuomin chai · Xun Jiang · Qiang Xu · Runsheng Wang · Yibo Lin

Learning Cascade Ranking as One Network

Yunli Wang · ZhenZhang · Zhiqiang Wang · Zixuan Yang · Yu Li · Jian Yang · Shiyang Wen · Peng Jiang · Kun Gai

Alpha-SQL: Zero-Shot Text-to-SQL using Monte Carlo Tree Search

Boyan Li · Jiayi Zhang · Ju Fan · Yanwei XU · Chong Chen · Nan Tang · Yuyu Luo

PatchPilot: A Cost-Efficient Software Engineering Agent with Early Attempts on Formal Verification

Hongwei Li · Yuheng Tang · Shiqi Wang · Wenbo Guo

End-to-End Learning Framework for Solving Non-Markovian Optimal Control

Xiaole Zhang · Peiyu Zhang · Xiongye Xiao · Shixuan Li · Vasileios Tzoumas · Vijay Gupta · Paul Bogdan

Optimization over Sparse Support-Preserving Sets: Two-Step Projection with Global Optimality Guarantees

William de Vazelhes · Xiaotong Yuan · Bin Gu

Graph-Supported Dynamic Algorithm Configuration for Multi-Objective Combinatorial Optimization

Robbert Reijnen · Yaoxin Wu · Zaharah Bukhsh · Yingqian Zhang

Triple-Optimistic Learning for Stochastic Contextual Bandits with General Constraints

Hengquan Guo · Lingkai Zu · Xin Liu

Embedding Safety into RL: A New Take on Trust Region Methods

Nikola Milosevic · Johannes Müller · Nico Scherf

Revisiting Convergence: Shuffling Complexity Beyond Lipschitz Smoothness

Qi He · Peiran Yu · Ziyi Chen · Heng Huang

Improved Last-Iterate Convergence of Shuffling Gradient Methods for Nonsmooth Convex Optimization

Zijian Liu · Zhengyuan Zhou

Improving Reward Model Generalization from Adversarial Process Enhanced Preferences

Zhilong Zhang · Tian Xu · Xinghao Du · Xingchen Cao · Yihao Sun · Yang Yu

Reinforcement Learning with Segment Feedback

Yihan Du · Anna Winnicki · Gal Dalal · Shie Mannor · R Srikant

Learning to Reuse Policies in State Evolvable Environments

Ziqian Zhang · Bohan Yang · Lihe Li · Yuqi Bian · Ruiqi Xue · Feng Chen · Yi-Chen Li · lei yuan · Yang Yu

Guided Zeroth-Order Methods for Stochastic Non-convex Problems with Decision-Dependent Distributions

Yuya Hikima · Hiroshi Sawada · Akinori Fujino

Natural Perturbations for Black-box Training of Neural Networks by Zeroth-Order Optimization

Hiroshi Sawada · Kazuo Aoyama · Yuya Hikima

Global Optimization with a Power-Transformed Objective and Gaussian Smoothing

Chen Xu

TSP: A Two-Sided Smoothed Primal-Dual Method for Nonconvex Bilevel Optimization

Songtao Lu

Generalized Smooth Bilevel Optimization with Nonconvex Lower-Level

Siqi Zhang · Xing Huang · Feihu Huang

Hybrid Batch Normalisation: Resolving the Dilemma of Batch Normalisation in Federated Learning

Hongyao Chen · Tianyang Xu · Xiaojun Wu · Josef Kittler

Demystifying Cost-Efficiency in LLM Serving over Heterogeneous GPUs

Youhe Jiang · Fangcheng Fu · Xiaozhe Yao · Guoliang HE · Xupeng Miao · Ana Klimovic · Bin Cui · Binhang Yuan · Eiko Yoneki

QoS-Efficient Serving of Multiple Mixture-of-Expert LLMs Using Partial Runtime Reconfiguration

HamidReza Imani · Jiaxin Peng · Peiman Mohseni · Abdolah Amirany · Tarek El-Ghazawi

DSP: Dynamic Sequence Parallelism for Multi-Dimensional Transformers

Xuanlei Zhao · Shenggan Cheng · Chang Chen · Zangwei Zheng · Ziming Liu · Zheming Yang · Yang You

Unified Breakdown Analysis for Byzantine Robust Gossip

Renaud Gaucher · Aymeric Dieuleveut · Hadrien Hendrikx

Layer-wise Quantization for Quantized Optimistic Dual Averaging

Anh Duc Nguyen · Ilia Markov · Zhengqing Wu · Ali Ramezani-Kebrya · Kimon Antonakopoulos · Dan Alistarh · Volkan Cevher

Provably Near-Optimal Federated Ensemble Distillation with Negligible Overhead

Won-Jun Jang · Hyeon-Seo Park · Si-Hyeon Lee

Large Language Model-driven Large Neighborhood Search for Large-Scale MILP Problems

Huigen Ye · Hua Xu · An Yan · Yaoyang Cheng

Neural Solver Selection for Combinatorial Optimization

Chengrui Gao · Haopu Shang · Ke Xue · Chao Qian

Don't Restart, Just Reuse: Reoptimizing MILPs with Dynamic Parameters

Sijia Zhang · Shuli Zeng · Shaoang Li · Feng Wu · Shaojie Tang · Xiangyang Li

Preference Optimization for Combinatorial Optimization Problems

Mingjun Pan · Guanquan Lin · You-Wei Luo · Bin Zhu · Zhien Dai · Lijun Sun · Chun Yuan

A Mixed-Curvature based Pre-training Paradigm for Multi-Task Vehicle Routing Solver

Suyu Liu · Zhiguang Cao · Shanshan Feng · Yew Soon ONG

BOPO: Neural Combinatorial Optimization via Best-anchored and Objective-guided Preference Optimization

Zijun Liao · Jinbiao Chen · Debing Wang · Zizhen Zhang · Jiahai Wang

Extreme Value Policy Optimization for Safe Reinforcement Learning

Shiqing Gao · Yihang Zhou · Shuai Shao · Haoyu Luo · Yiheng Bing · Jiaxin Ding · Luoyi Fu · Xinbing Wang

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation

Xiao Huang · Xu Liu · Enze Zhang · Tong Yu · Shuai Li

Reward Translation via Reward Machine in Semi-Alignable MDPs

Yun Hua · Haosheng Chen · Wenhao Li · Bo Jin · Baoxiang Wang · Hongyuan Zha · Xiangfeng Wang

Catching Two Birds with One Stone: Reward Shaping with Dual Random Networks for Balancing Exploration and Exploitation

Haozhe Ma · Fangling Li · Jing Lim · Zhengding Luo · Thanh Vinh Vo · Tze-Yun Leong

An Online Learning Approach to Prompt-based Selection of Generative Models and LLMs

Xiaoyan Hu · Ho-fung Leung · Farzan Farnia

Hyper: Hyperparameter Robust Efficient Exploration in Reinforcement Learning

Yiran Wang · Chenshu Liu · Yunfan Li · Sanae Amani · Bolei Zhou · Lin Yang

Reward-free World Models for Online Imitation Learning

Shangzhe Li · Zhiao Huang · Hao Su

Quantum Algorithms for Finite-horizon Markov Decision Processes

Bin Luo · Yuwen Huang · Jonathan Allcock · Xiaojun Lin · Shengyu Zhang · John C. S. Lui

Conservative Offline Goal-Conditioned Implicit V-Learning

Ke Kaiqiang · qian lin · Zongkai Liu · Shenghong He · Chao Yu

Graph-Assisted Stitching for Offline Hierarchical Reinforcement Learning

Seungho Baek · Taegeon Park · Jongchan Park · Seungjun Oh · Yusung Kim

C2IQL: Constraint-Conditioned Implicit Q-learning for Safe Offline Reinforcement Learning

Zifan LIU · Xinran Li · Jun Zhang

MODULI: Unlocking Preference Generalization via Diffusion Models for Offline Multi-Objective Reinforcement Learning

Yifu Yuan · Zhenrui Zheng · Zibin Dong · Jianye Hao

Ensemble Learned Bloom Filters: Two Oracles are Better than One

Ming Lin · Lin CHEN

Video-Enhanced Offline Reinforcement Learning: A Model-Based Approach

Minting Pan · Yitao Zheng · Jiajian Li · Yunbo Wang · Xiaokang Yang

Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport

Mingyang Sun · Pengxiang Ding · Weinan Zhang · Donglin Wang

Learning from Suboptimal Data in Continuous Control via Auto-Regressive Soft Q-Network

Jijia Liu · Feng Gao · Qingmin Liao · Chao Yu · Yu Wang

FOUNDER: Grounding Foundation Models in World Models for Open-Ended Embodied Decision Making

Yucen Wang · Rui Yu · Shenghua Wan · Le Gan · De-Chuan Zhan

A Forget-and-Grow Strategy for Deep Reinforcement Learning Scaling in Continuous Control

Zilin Kang · Chenyuan Hu · Yu Luo · Zhecheng Yuan · Ruijie Zheng · Huazhe Xu

Optimizing Language Models for Inference Time Objectives using Reinforcement Learning

Yunhao Tang · Kunhao Zheng · Gabriel Synnaeve · REMI MUNOS

Behavior-agnostic Task Inference for Robust Offline In-context Reinforcement Learning

Long Ma · Fangwei Zhong · Yizhou Wang

Deep Reinforcement Learning from Hierarchical Preference Design

Alexander Bukharin · Yixiao Li · Pengcheng He · Tuo Zhao

R*: Efficient Reward Design via Reward Structure Evolution and Parameter Alignment Optimization with Large Language Models

Pengyi Li · Jianye Hao · Hongyao Tang · Yifu Yuan · Jinbin Qiao · Zibin Dong · Yan Zheng

Learning dynamics in linear recurrent neural networks

Alexandra Proca · Clémentine Dominé · Murray Shanahan · Pedro Mediano

Understanding Nonlinear Implicit Bias via Region Counts in Input Space

Jingwei Li · Jing Xu · Zifan Wang · Huishuai Zhang · Jingzhao Zhang

On the Benefits of Active Data Collection in Operator Learning

Unique Subedi · Ambuj Tewari

Optimistic Algorithms for Adaptive Estimation of the Average Treatment Effect

Ojash Neopane · Aaditya Ramdas · Aarti Singh

Lower Bounds for Chain-of-Thought Reasoning in Hard-Attention Transformers

Alireza Amiribavandpour · Xinting Huang · Mark Rofin · Michael Hahn

Conformal Tail Risk Control for Large Language Model Alignment

Catherine Chen · Jingyan Shen · Xinyu Yang · Lihua Lei

Improved Approximations for Hard Graph Problems using Predictions

Anders Aamand · Justin Chen · Siddharth Gollapudi · Sandeep Silwal · Hao WU

Speeding up Policy Simulation in Supply Chain RL

Vivek Farias · Joren Gijsbrechts · Aryan Khojandi · Tianyi Peng · Andrew Zheng

Convergence Analysis of Policy Gradient Methods with Dynamic Stochasticity

Alessandro Montenegro · Marco Mussi · Matteo Papini · Alberto Maria Metelli

Rejecting Hallucinated State Targets during Planning

Mingde Zhao · Tristan Sylvain · Romain Laroche · Doina Precup · Yoshua Bengio

Simple Policy Optimization

Zhengpeng Xie · Qiang Zhang · Fan Yang · Marco Hutter · Renjing Xu

Ad Hoc Teamwork via Offline Goal-Based Decision Transformers

Xinzhi Zhang · Hoehi Chan · Deheng Ye · Yi Cai · Mengchen Zhao

DipLLM: Fine-Tuning LLM for Strategic Decision-making in Diplomacy

Kaixuan Xu · Jiajun Chai · Sicheng Li · Yuqian Fu · Yuanheng Zhu · Dongbin Zhao

Robust Multi-Agent Reinforcement Learning with Stochastic Adversary

Ziyuan Zhou · Guanjun Liu · Mengchu Zhou · Guo

LLM-Assisted Semantically Diverse Teammate Generation for Efficient Multi-agent Coordination

Lihe Li · lei yuan · Pengsen Liu · Tao Jiang · Yang Yu

PokéChamp: an Expert-level Minimax Language Agent

Seth Karten · Andy Nguyen · Chi Jin

Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization

Zelai Xu · Wanjun Gu · Chao Yu · Yi Wu · Yu Wang

Concurrent Reinforcement Learning with Aggregated States via Randomized Least Squares Value Iteration

Yan Chen · Jerry Bai · Yiteng Zhang · Maria Dimakopoulou · Shi Dong · Qi Sun · Zhengyuan Zhou

GradPS: Resolving Futile Neurons in Parameter Sharing Network for Multi-Agent Reinforcement Learning

Haoyuan Qin · Zhengzhu Liu · Chenxing Lin · Chennan Ma · Songzhu Mei · Siqi Shen · Cheng Wang

M³HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality

Ziyan Wang · Zhicheng Zhang · Fei Fang · Yali Du

Decoding Rewards in Competitive Games: Inverse Game Theory with Entropy Regularization

Junyi Liao · Zihan Zhu · Ethan Fang · Zhuoran Yang · Vahid Tarokh

Robust Autonomy Emerges from Self-Play

Marco Cusumano-Towner · David Hafner · Alexander Hertzberg · Brody Huval · Aleksei Petrenko · Eugene Vinitsky · Erik Wijmans · Taylor Killian · Stuart Bowers · Ozan Sener · Philipp Kraehenbuehl · Vladlen Koltun

Measuring Representational Shifts in Continual Learning: A Linear Transformation Perspective

Joonkyu Kim · Yejin Kim · Jy-yong Sohn

Low-Dimension-to-High-Dimension Generalization and Its Implications for Length Generalization

Yang Chen · Long Yang · Yitao Liang · Zhouchen Lin

Runtime Analysis of Evolutionary NAS for Multiclass Classification

Zeqiong Lv · Chao Qian · Yun Liu · Jiahao Fan · Yanan Sun

On the Role of Label Noise in the Feature Learning Process

Andi Han · Wei Huang · Zhanpeng Zhou · Gang Niu · Wuyang Chen · Junchi Yan · Akiko Takeda · Taiji Suzuki

LoRA Training Provably Converges to a Low-Rank Global Minimum Or It Fails Loudly (But it Probably Won't Fail)

Junsu Kim · Jaeyeon Kim · Ernest Ryu

Understanding Overadaptation in Supervised Fine-Tuning: The Role of Ensemble Methods

Yifan HAO · xingyuan pan · Hanning Zhang · Chenlu Ye · Rui Pan · Tong Zhang

Theoretical Performance Guarantees for Partial Domain Adaptation via Partial Optimal Transport

Jayadev Naram · Fredrik Hellström · Ziming Wang · Rebecka Jörnsten · Giuseppe Durisi

When can in-context learning generalize out of task distribution?

Chase Goddard · Lindsay Smith · Wave Ngampruetikorn · David Schwab

Transfer Learning for Nonparametric Contextual Dynamic Pricing

Fan Wang · Feiyu Jiang · Zifeng Zhao · Yi Yu

Prices, Bids, Values: One ML-Powered Combinatorial Auction to Rule Them All

Ermis Soumalias · Jakob Heiss · Jakob Weissteiner · Sven Seuken

Generative Social Choice: The Next Generation

Niclas Boehmer · Sara Fish · Ariel Procaccia

Safely Learning Optimal Auctions: A Testable Learning Framework for Mechanism Design

Vikram Kher · Manolis Zampetakis

Procurement Auctions via Approximately Optimal Submodular Optimization

Yuan Deng · Amin Karbasi · Vahab Mirrokni · Renato Leme · Grigorios Velegkas · Song Zuo

Observation Interference in Partially Observable Assistance Games

Scott Emmons · Caspar Oesterheld · Vincent Conitzer · Stuart Russell

Implicit Regularization for Tubal Tensor Factorizations via Gradient Descent

Santhosh Karnik · Anna Veselovska · Mark Iwen · Felix Krahmer

LASER: Attention with Exponential Transformation

Sai Surya Duvvuri · Inderjit Dhillon

A New Concentration Inequality for Sampling Without Replacement and Its Application for Transductive Learning

Yingzhen Yang

Refined generalization analysis of the Deep Ritz Method and Physics-Informed Neural Networks

Xianliang Xu · Ye Li · Zhongyi Huang

Generalization in Federated Learning: A Conditional Mutual Information Framework

Ziqiao Wang · Cheng Long · Yongyi Mao

Exactly Tight Information-theoretic Generalization Bounds via Binary Jensen-Shannon Divergence

Yuxin Dong · Haoran Guo · Tieliang Gong · Wen Wen · Chen Li

Models of Heavy-Tailed Mechanistic Universality

Liam Hodgkinson · Zhichao Wang · Michael Mahoney

Tight and Fast Bounds for Multi-Label Learning

Yi-Fan Zhang · Min-Ling Zhang

Go to Event Page

Poster

Poster Session 6 East

4:30 PM - 7:00 PM

320 Events in this session

Understanding the difficulties of posterior predictive estimation

Abhinav Agrawal · Justin Domke

Deep Bayesian Filter for Bayes-Faithful Data Assimilation

Yuta Tarumi · Keisuke Fukuda · Shin-ichi Maeda

Splitting & Integrating: Out-of-Distribution Detection via Adversarial Gradient Attribution

Jiayu Zhang · Xinyi Wang · Zhibo Jin · Zhiyu Zhu · Jianlong Zhou · Fang Chen · Huaming Chen

Low-Rank Adapting Models for Sparse Autoencoders

Matthew Chen · Josh Engels · Max Tegmark

B-score: Detecting biases in large language models using response history

An Vo · Mohammad Reza Taesiri · Daeyoung Kim · Anh Nguyen

How Do Transformers Learn Variable Binding in Symbolic Programs?

Yiwei Wu · Atticus Geiger · Raphaël Millière

Towards flexible perception with visual memory

Robert Geirhos · Priyank Jaini · Austin Stone · Sourabh Medapati · Xi Yi · George Toderici · Abhijit Ogale · Jonathon Shlens

InfoCons: Identifying Interpretable Critical Concepts in Point Clouds via Information Theory

Feifei Li · Mi Zhang · Zhaoxiang Wang · Min Yang

SAE-V: Interpreting Multimodal Models for Enhanced Alignment

Hantao Lou · Changye Li · Jiaming Ji · Yaodong Yang

CoDy: Counterfactual Explainers for Dynamic Graphs

Zhan Qu · Daniel Gomm · Michael Färber

Weight matrices compression based on PDB model in deep neural networks

Xiaoling Wu · Junpeng Zhu · Zeng Li

Solving Linear-Gaussian Bayesian Inverse Problems with Decoupled Diffusion Sequential Monte Carlo

Filip Ekström Kelvinius · Zheng Zhao · Fredrik Lindsten

Learning Gaussian DAG Models without Condition Number Bounds

Constantinos Daskalakis · Vardis Kandiros · Rui Yao

Parallel Simulation for Log-concave Sampling and Score-based Diffusion Models

Huanjian Zhou · Masashi Sugiyama

Sampling from Binary Quadratic Distributions via Stochastic Localization

Chenguang Wang · Kaiyuan Cui · Weichen Zhao · Tianshu Yu

Enabling Optimal Decisions in Rehearsal Learning under CARE Condition

Wen-Bo Du · Hao-Yi Lei · Lue Tao · Tian-Zuo Wang · Zhi-Hua Zhou

Trajectory Inference with Smooth Schrödinger Bridges

Wanli Hong · Yuliang Shi · Jonathan Niles-Weed

Neighbour-Driven Gaussian Process Variational Autoencoders for Scalable Structured Latent Modelling

Xinxing Shi · Xiaoyu Jiang · Mauricio Álvarez

Optimal Sensor Scheduling and Selection for Continuous-Discrete Kalman Filtering with Auxiliary Dynamics

Mohamad Al Ahdab · john leth · Zheng-Hua Tan

Posterior Inference with Diffusion Models for High-dimensional Black-box Optimization

Taeyoung Yun · Kiyoung Om · Jaewoo Lee · Sujin Yun · Jinkyoo Park

Generalized Category Discovery via Reciprocal Learning and Class-Wise Distribution Regularization

Duo Liu · Zhiquan Tan · Linglan Zhao · Zhongqiang Zhang · Xiangzhong Fang · Weiran Huang

Unsupervised Learning for Class Distribution Mismatch

Pan Du · Zhao · Xinai Lu · Nian Liu · Zhikai Li · Chaoyu Gong · Suyun Zhao · Hong Chen · Cuiping Li · Kai Wang · Yang You

Learning Dynamics under Environmental Constraints via Measurement-Induced Bundle Structures

Dongzhe Zheng · Wenjie Mei

Online Differentially Private Conformal Prediction for Uncertainty Quantification

Qiangqiang Zhang · Ting Li · Xinwei Feng · Xiaodong Yan · Jinhan Xie

Large Continual Instruction Assistant

Jingyang Qiao · zhizhong zhang · Xin Tan · Yanyun Qu · Shouhong Ding · Yuan Xie

On the Diversity of Adversarial Ensemble Learning

Jun-Qi Guo · Meng-Zhang Qian · Wei Gao · Zhi-Hua Zhou

Efficient Bisection Projection to Ensure Neural-Network Solution Feasibility for Optimization over General Set

Enming Liang · Minghua Chen

Probabilistic Group Mask Guided Discrete Optimization for Incremental Learning

Fengqiang Wan · Yang Yang

Learning from True-False Labels via Multi-modal Prompt Retrieving

Zhongnian Li · Jinghao Xu · Peng Ying · Meng Wei · Xinzheng Xu

Random Policy Evaluation Uncovers Policies of Generative Flow Networks

Haoran He · Emmanuel Bengio · Qingpeng Cai · Ling Pan

Towards the Efficient Inference by Incorporating Automated Computational Phenotypes under Covariate Shift

chao ying · Jun Jin · Yi Guo · Xiudi Li · Muxuan Liang · Jiwei Zhao

Socialized Coevolution: Advancing a Better World through Cross-Task Collaboration

Xinjie Yao · Yu Wang · Pengfei Zhu · Wanyu LIN · Ruipu Zhao · Zhoupeng Guo · Weihao Li · Qinghua Hu

Upweighting Easy Samples in Fine-Tuning Mitigates Forgetting

Sunny Sanyal · Hayden Prairie · Rudrajit Das · Ali Kavis · Sujay Sanghavi

Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments

Yun Qu · Cheems Wang · Yixiu Mao · Yiqin Lv · Xiangyang Ji

Modeling Multi-Task Model Merging as Adaptive Projective Gradient Descent

Yongxian Wei · Anke Tang · Li Shen · Zixuan Hu · Chun Yuan · Xiaochun Cao

BSLoRA: Enhancing the Parameter Efficiency of LoRA with Intra-Layer and Inter-Layer Sharing

Yuhua Zhou · Ruifeng Li · Changhai Zhou · Fei Yang · Aimin PAN

WeGeFT: Weight‑Generative Fine‑Tuning for Multi‑Faceted Efficient Adaptation of Large Models

Chinmay Savadikar · Xi Song · Tianfu Wu

Self-Bootstrapping for Versatile Test-Time Adaptation

Shuaicheng Niu · Guohao Chen · Peilin Zhao · Tianyi Wang · Pengcheng Wu · Zhiqi Shen

Learnable Spatial-Temporal Positional Encoding for Link Prediction

Katherine Tieu · Dongqi Fu · Zihao Li · Ross Maciejewski · Jingrui He

Sparse Causal Discovery with Generative Intervention for Unsupervised Graph Domain Adaptation

Junyu Luo · Yuhao Tang · Yiwei Fu · Xiao Luo · Zhizhuo KOU · Zhiping Xiao · Wei Ju · Wentao Zhang · Ming Zhang

Improving Multi-Class Calibration through Normalization-Aware Isotonic Techniques

Alon Arad · Saharon Rosset

TLLC: Transfer Learning-based Label Completion for Crowdsourcing

Wenjun Zhang · Liangxiao Jiang · Chaoqun Li

Cut out and Replay: A Simple yet Versatile Strategy for Multi-Label Online Continual Learning

Xinrui Wang · Shao-Yuan Li · Jiaqiang Zhang · Songcan Chen

Gradient Aligned Regression via Pairwise Losses

Dixian Zhu · Tianbao Yang · Livnat Jerby

Learnware Specification via Dual Alignment

Wei Chen · Jun-Xiang Mao · Xiaozheng Wang · Min-Ling Zhang

Scalable Model Merging with Progressive Layer-wise Distillation

Jing Xu · Jiazheng Li · Jingzhao Zhang

Zero-shot Meta-learning for Tabular Prediction Tasks with Adversarially Pre-trained Transformer

Yulun Wu · Doron Bergman

When Data-Free Knowledge Distillation Meets Non-Transferable Teacher: Escaping Out-of-Distribution Trap is All You Need

Ziming Hong · Runnan Chen · Zengmao Wang · Bo Han · Bo Du · Tongliang Liu

Representation Surgery in Model Merging with Probabilistic Modeling

Qi Wei · Shuo He · Enneng Yang · Tingcong Liu · Haobo Wang · Lei Feng · Bo An

CABS: Conflict-Aware and Balanced Sparsification for Enhancing Model Merging

Zongzhen Yang · Binhang Qi · Hailong Sun · Wenrui Long · Ruobing Zhao · Xiang Gao

Learning Compact Semantic Information for Incomplete Multi-View Missing Multi-Label Classification

Jie Wen · Yadong Liu · Zhanyan Tang · Yuting He · Yulong Chen · Mu Li · Chengliang Liu

Towards Escaping from Class Dependency Modeling for Multi-Dimensional Classification

Teng Huang · Bin-Bin Jia · Min-Ling Zhang

Preserving AUC Fairness in Learning with Noisy Protected Groups

Mingyang Wu · Li Lin · Wenbin Zhang · Xin Wang · Zhenhuan Yang · Shu Hu

KAN-AD: Time Series Anomaly Detection with Kolmogorov–Arnold Networks

Quan Zhou · Changhua Pei · Fei Sun · HanJing · Zhengwei Gao · haiming zhang · Gaogang Xie · Dan Pei · Jianhui LI

TreeLoRA: Efficient Continual Learning via Layer-Wise LoRAs Guided by a Hierarchical Gradient-Similarity Tree

Yu-Yang Qian · Yuan-Ze Xu · Zhen-Yu Zhang · Peng Zhao · Zhi-Hua Zhou

Slimming the Fat-Tail: Morphing-Flow for Adaptive Time Series Modeling

Tianyu Liu · kai sun · Fuchun Sun · Yu Luo · Yuanlong Zhang

TimeDART: A Diffusion Autoregressive Transformer for Self-Supervised Time Series Representation

Daoyu Wang · Mingyue Cheng · Zhiding Liu · Qi Liu

DTZO: Distributed Trilevel Zeroth Order Learning with Provable Non-Asymptotic Convergence

Yang Jiao · Kai Yang · Chengtao Jian

Efficient Network Automatic Relevance Determination

Hongwei Zhang · Ziqi Ye · Xinyuan Wang · Xin Guo · Zenglin Xu · Yuan Cheng · Zixin Hu · Yuan Qi

Balancing Model Efficiency and Performance: Adaptive Pruner for Long-tailed Data

Zhe Zhao · HaiBin Wen · Pengkun Wang · ShuangWang · Zhenkun Wang · Qingfu Zhang · Yang Wang

OrcaLoca: An LLM Agent Framework for Software Issue Localization

Zhongming Yu · Hejia Zhang · Yujie Zhao · Hanxian Huang · Matrix Yao · Ke Ding · Jishen Zhao

Nested Expectations with Kernel Quadrature

Zonghao Chen · Masha Naslidnyk · Francois-Xavier Briol

An Instrumental Value for Data Production and its Application to Data Pricing

Rui Ai · Boxiang Lyu · Zhaoran Wang · Zhuoran Yang · Haifeng Xu

On the Dynamic Regret of Following the Regularized Leader: Optimism with History Pruning

Naram Mhaisen · George Iosifidis

AutoAL: Automated Active Learning with Differentiable Query Strategy Search

Yifeng Wang · Xueying Zhan · Siyu Huang

Improved and Oracle-Efficient Online $\ell_1$-Multicalibration

Rohan Ghuge · Vidya Muthukumar · Sahil Singla

Online Clustering of Dueling Bandits

Zhiyong Wang · Jiahang Sun · Mingze Kong · Jize Xie · Qinghua Hu · John C. S. Lui · Zhongxiang Dai

SDMG: Smoothing Your Diffusion Models for Powerful Graph Representation Learning

Junyou Zhu · Langzhou He · Chao Gao · Dongpeng Hou · Zhen Su · Philip Yu · Juergen Kurths · Frank Hellmann

TraceGrad: a Framework Learning Expressive SO(3)-equivariant Non-linear Representations for Electronic-Structure Hamiltonian Prediction

Shi Yin · Xinyang Pan · fengyan wang · Lixin He

FEAT-KD: Learning Concise Representations for Single and Multi-Target Regression via TabNet Knowledge Distillation

Kei Sen Fong · Mehul Motani

AKRMap: Adaptive Kernel Regression for Trustworthy Visualization of Cross-Modal Embeddings

Yilin Ye · Junchao Huang · Xingchen ZENG · Jiazhi Xia · Wei Zeng

How Do Large Language Monkeys Get Their Power (Laws)?

Rylan Schaeffer · Joshua Kazdan · John Hughes · Jordan Juravsky · Sara Price · Aengus Lynch · Erik Jones · Robert Kirk · Azalia Mirhoseini · Sanmi Koyejo

AAAR-1.0: Assessing AI’s Potential to Assist Research

Renze Lou · Hanzi Xu · Sijia Wang · Jiangshu Du · Ryo Kamoi · Xiaoxin Lu · Jian Xie · Yuxuan Sun · Yusen Zhang · Jihyun Ahn · Hongchao Fang · Zhuoyang Zou · Wenchao Ma · Xi Li · Kai Zhang · Congying Xia · Lifu Huang · Wenpeng Yin

Do Vision-Language Models Really Understand Visual Language?

Yifan Hou · Buse Giledereli · Yilei Tu · Mrinmaya Sachan

Reflection-Bench: Evaluating Epistemic Agency in Large Language Models

Lingyu Li · Yixu Wang · Haiquan Zhao · Shuqi Kong · Yan Teng · Chunbo Li · Yingchun Wang

Minerva: A Programmable Memory Test Benchmark for Language Models

Menglin Xia · Victor Ruehle · Saravanakumar Rajmohan · Reza Shokri

High-Dimensional Tensor Regression With Oracle Properties

Wenbin Wang · Yu Shi · Ziping Zhao

SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?

Samuel Miserendino · Michele Wang · Tejal Patwardhan · Johannes Heidecke

Federated Node-Level Clustering Network with Cross-Subgraph Link Mending

Jingxin Liu · Renda Han · Wenxuan Tu · Haotian Wang · Junlong Wu · Jieren Cheng

A Peer-review Look on Multi-modal Clustering: An Information Bottleneck Realization Method

Zhengzheng Lou · Hang Xue · Chaoyang Zhang · Shizhe Hu

Generalizing Causal Effects from Randomized Controlled Trials to Target Populations across Diverse Environments

Baohong Li · Yingrong Wang · Anpeng Wu · ma ming · Ruoxuan Xiong · Kun Kuang

Unraveling the Interplay between Carryover Effects and Reward Autocorrelations in Switchback Experiments

Qianglin Wen · Chengchun Shi · Ying Yang · Niansheng Tang · Hongtu Zhu

Counterfactual Graphical Models: Constraints and Inference

Juan Correa · Elias Bareinboim

Latent Variable Causal Discovery under Selection Bias

Haoyue Dai · Yiwen Qiu · Ignavier Ng · Xinshuai Dong · Peter Spirtes · Kun Zhang

Bivariate Causal Discovery with Proxy Variables: Integral Solving and Beyond

Yong Wu · Yanwei Fu · Shouyan Wang · Xinwei Sun

Federated Causal Structure Learning with Non-identical Variable Sets

Yunxia Wang · Fuyuan CAO · Kui Yu · Jiye Liang

LLMScan: Causal Scan for LLM Misbehavior Detection

Mengdi Zhang · Goh Kiat · Peixin Zhang · Jun Sun · Lin Rose · Hongyu Zhang

Causal Abstraction Learning based on the Semantic Embedding Principle

Gabriele DAcunto · Fabio Massimo Zennaro · Yorgos Felekis · Paolo Di Lorenzo

Measuring Variable Importance in Heterogeneous Treatment Effects with Confidence

Joseph Paillard · Angel REYERO LOBO · Vitaliy Kolodyazhniy · Thirion Bertrand · Denis-Alexander Engemann

TANGO: Clustering with Typicality-Aware Nonlocal Mode-Seeking and Graph-Cut Optimization

Haowen Ma · Zhiguo Long · Hua Meng

Learning from Sample Stability for Deep Clustering

Zhixin Li · Yuheng Jia · Hui LIU · Junhui Hou

Unified K-Means Clustering with Label-Guided Manifold Learning

Qianqian Wang · Mengping Jiang · Zhengming Ding · Quanxue Gao

PROTOCOL: Partial Optimal Transport-enhanced Contrastive Learning for Imbalanced Multi-view Clustering

Xuqian Xue · Yiming Lei · Qi Cai · Hongming Shan · Junping Zhang

Variational Counterfactual Intervention Planning to Achieve Target Outcomes

Xin Wang · Shengfei Lyu · Luo Chi · Xiren Zhou · Huanhuan Chen

Bayesian Active Learning for Bivariate Causal Discovery

Yuxuan Wang · Mingzhou Liu · Xinwei Sun · Wei Wang · Yizhou Wang

FedClean: A General Robust Label Noise Correction for Federated Learning

Xiaoqian Jiang · Jing Zhang

OpenworldAUC: Towards Unified Evaluation and Optimization for Open-world Prompt Tuning

Cong Hua · Qianqian Xu · Zhiyong Yang · Zitai Wang · Shilong Bao · Qingming Huang

Understanding Model Reprogramming for CLIP via Decoupling Visual Prompts

Chengyi Cai · Zesheng Ye · Lei Feng · Jianzhong Qi · Feng Liu

Testing Conditional Mean Independence Using Generative Neural Networks

Yi Zhang · Linjun Huang · Yun Yang · Xiaofeng Shao

Autoencoder-Based Hybrid Replay for Class-Incremental Learning

Milad Khademi Nori · Il-Min Kim · Guanghui Wang

Parametric Scaling Law of Tuning Bias in Conformal Prediction

Hao Zeng · Kangdao Liu · Bingyi Jing · Hongxin Wei

Conformal Prediction with Cellwise Outliers: A Detect-then-Impute Approach

Qian Peng · Yajie Bao · Haojie Ren · Zhaojun Wang · Changliang Zou

Supercharging Graph Transformers with Advective Diffusion

Qitian Wu · Chenxiao Yang · Kaipeng Zeng · Michael Bronstein

When Dynamic Data Selection Meets Data Augmentation: Achieving Enhanced Training Acceleration

Suorong Yang · Peng Ye · Furao Shen · Dongzhan Zhou

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Dongzhi Jiang · Renrui Zhang · Ziyu Guo · Yanwei Li · Yu Qi · Xinyan Chen · Liuhui Wang · Jianhan Jin · Claire Guo · Shen Yan · Bo Zhang · Chaoyou Fu · Peng Gao · Hongsheng Li

Efficient Logit-based Knowledge Distillation of Deep Spiking Neural Networks for Full-Range Timestep Deployment

Chengting Yu · Xiaochen Zhao · Lei Liu · Shu Yang · Gaoang Wang · Erping Li · Aili Wang

WAVE: Weighted Autoregressive Varying Gate for Time Series Forecasting

Jiecheng Lu · Xu Han · Yan Sun · Shihao Yang

TimeStacker: A Novel Framework with Multilevel Observation for Capturing Nonstationary Patterns in Time Series Forecasting

Qinglong Liu · Cong Xu · Wenhao Jiang · Kaixuan Wang · Lin Ma · Haifeng Li

TimeFilter: Patch-Specific Spatial-Temporal Graph Filtration for Time Series Forecasting

Yifan Hu · Guibin Zhang · Peiyuan Liu · Disen Lan · Naiqi Li · Dawei Cheng · Tao Dai · Shutao Xia · Shirui Pan

Implicit Bias of Gradient Descent for Non-Homogeneous Deep Networks

Yuhang Cai · Kangjie Zhou · Jingfeng Wu · Song Mei · Michael Lindsey · Peter Bartlett

Simplicity Bias and Optimization Threshold in Two-Layer ReLU Networks

Etienne Boursier · Nicolas Flammarion

Task Generalization with Autoregressive Compositional Structure: Can Learning from $D$ Tasks Generalize to $D^T$ Tasks?

Amirhesam Abedsoltan · Huaqing Zhang · Kaiyue Wen · Hongzhou Lin · Jingzhao Zhang · Misha Belkin

Sharp Generalization for Nonparametric Regression by Over-Parameterized Neural Networks: A Distribution-Free Analysis in Spherical Covariate

Yingzhen Yang

Understanding Sharpness Dynamics in NN Training with a Minimalist Example: The Effects of Dataset Difficulty, Depth, Stochasticity, and More

Geonhui Yoo · Minhak Song · Chulhee Yun

Tree-Sliced Wasserstein Distance with Nonlinear Projection

Thanh Tran · Viet Hoang Tran · Thanh Chu · Trang Pham · Laurent Ghaoui · Tam Le · Tan Nguyen

Widening the Network Mitigates the Impact of Data Heterogeneity on FedAvg

Like Jian · Dong Liu

Sketch to Adapt: Fine-Tunable Sketches for Efficient LLM Adaptation

Tianyi Zhang · Junda Su · Aditya Desai · Oscar Wu · Zhaozhuo Xu · Anshumali Shrivastava

LaCache: Ladder-Shaped KV Caching for Efficient Long-Context Modeling of Large Language Models

Dachuan Shi · Yonggan Fu · Xiangchi Yuan · Zhongzhi Yu · Haoran You · Sixu Li · Xin Dong · Jan Kautz · Pavlo Molchanov · Yingyan (Celine) Lin

Linear Mode Connectivity between Multiple Models modulo Permutation Symmetries

Akira Ito · Masanori Yamada · Atsutoshi Kumagai

Linear Transformers as VAR Models: Aligning Autoregressive Attention Mechanisms with Autoregressive Forecasting

Jiecheng Lu · Shihao Yang

Measuring In-Context Computation Complexity via Hidden State Prediction

Vincent Herrmann · Róbert Csordás · Jürgen Schmidhuber

Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting

Siru Zhong · Weilin Ruan · Ming Jin · Huan Li · Qingsong Wen · Yuxuan Liang

A Closer Look at Transformers for Time Series Forecasting: Understanding Why They Work and Where They Struggle

Yu Chen · Nathalia Céspedes · Payam Barnaghi

ML$^2$-GCL: Manifold Learning Inspired Lightweight Graph Contrastive Learning

Jianqing Liang · Zhiqiang Li · Xinkai Wei · Yuan Liu · Zhiqiang Wang

Clustering Properties of Self-Supervised Learning

Xi Weng · Jianing An · Xudong Ma · Binhang Qi · Jie Luo · Xi Yang · Jin Song Dong · Lei Huang

M3-JEPA: Multimodal Alignment via Multi-gate MoE based on the Joint-Embedding Predictive Architecture

Hongyang Lei · Xiaolong Cheng · Qi Qin · Dan Wang · Huazhen Huang · Qingqing Gu · Yetao Wu · Luo Ji

Structure-informed Risk Minimization for Robust Ensemble Learning

Fengchun Qiao · Yanlin Chen · Xi Peng

Adversarial Inputs for Linear Algebra Backends

Jonas Möller · Lukas Pirch · Felix Weissberg · Sebastian Baunsgaard · Thorsten Eisenhofer · Konrad Rieck

Improving Zero-Shot Adversarial Robustness in Vision-Language Models by Closed-form Alignment of Adversarial Path Simplices

Junhao Dong · Piotr Koniusz · Yifei Zhang · Hao Zhu · Weiming Liu · Xinghua Qu · Yew Soon ONG

ROME is Forged in Adversity: Robust Distilled Datasets via Information Bottleneck

Zheng Zhou · Wenquan Feng · Qiaosheng Zhang · Shuchang Lyu · Qi Zhao · Guangliang Cheng

You Always Recognize Me (YARM): Robust Texture Synthesis Against Multi-View Corruption

Weihang Ran · Wei Yuan · Yinqiang Zheng

Geometric Median (GM) Matching for Robust k-Subset Selection from Noisy Data

Anish Acharya · Sujay Sanghavi · Alex Dimakis · Inderjit Dhillon

HaploVL: A Single-Transformer Baseline for Multi-Modal Understanding

Rui Yang · Lin Song · Yicheng Xiao · Runhui Huang · Yixiao Ge · Ying Shan · Hengshuang Zhao

MAS-GPT: Training LLMs to Build LLM-based Multi-Agent Systems

Rui Ye · shuo tang · Rui Ge · Yaxin Du · Zhenfei Yin · Siheng Chen · Jing Shao

Reward Modeling with Ordinal Feedback: Wisdom of the Crowd

Shang Liu · Yu Pan · Guanting Chen · Xiaocheng Li

The Berkeley Function Calling Leaderboard (BFCL): From Tool Use to Agentic Evaluation of Large Language Models

Shishir G. Patil · Huanzhi Mao · Fanjia Yan · Charlie Ji · Vishnu Suresh · Ion Stoica · Joseph E Gonzalez

La RoSA: Enhancing LLM Efficiency via Layerwise Rotated Sparse Activation

Kai Liu · Bowen Xu · Shaoyu Wu · Xin Chen · Hao Zhou · Yongliang Tao · lulu hu

Data Mixing Optimization for Supervised Fine-Tuning of Large Language Models

Yuan Li · Zhengzhong Liu · Eric Xing

Gumiho: A Hybrid Architecture to Prioritize Early Tokens in Speculative Decoding

Jinze Li · Yixing Xu · Haiduo Huang · Xuanwu Yin · Dong Li · Edith Ngai · Emad Barsoum

unMORE: Unsupervised Multi-Object Segmentation via Center-Boundary Reasoning

Yafei YANG · Zihui Zhang · Bo Yang

Controllable Data Generation with Hierarchical Neural Representations

Sheyang Tang · xiaoyu xu · Jiayan Qiu · Zhou Wang

ActionPiece: Contextually Tokenizing Action Sequences for Generative Recommendation

Yupeng Hou · Jianmo Ni · Zhankui He · Noveen Sachdeva · Wang-Cheng Kang · Ed Chi · Julian McAuley · Derek Cheng

Reaction Graph: Towards Reaction-Level Modeling for Chemical Reactions with 3D Structures

Yingzhao Jian · Yue Zhang · Ying Wei · Hehe Fan · Yi Yang

TtBA: Two-third Bridge Approach for Decision-Based Adversarial Attack

Feiyang Wang · Xingquan Zuo · Hai Huang · Gang Chen

DiffAdvMAP: Flexible Diffusion-Based Framework for Generating Natural Unrestricted Adversarial Examples

Zhengzhao Pan · Hua Chen · Xiaogang Zhang

HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking

Runquan Gui · Zhihai Wang · Jie Wang · Chi Ma · Huiling Zhen · Mingxuan Yuan · Jianye Hao · Defu Lian · Enhong Chen · Feng Wu

Everything Everywhere All at Once: LLMs can In-Context Learn Multiple Tasks in Superposition

Zheyang Xiong · Jack Cai · John Cooper · Albert Ge · Vasilis Papageorgiou · Zack Sifakis · Angeliki Giannou · Ziqian Lin · Liu Yang · Saurabh Agarwal · Grigorios Chrysos · Samet Oymak · Kangwook Lee · Dimitris Papailiopoulos

Earley-Driven Dynamic Pruning for Efficient Structured Decoding

Xintong Sun · Chi Wei · Minghao Tian · Shiwen Ni

Imagine While Reasoning in Space: Multimodal Visualization-of-Thought

Chengzu Li · Wenshan Wu · Huanyu Zhang · Yan Xia · Shaoguang Mao · Li Dong · Ivan Vulić · Furu Wei

PENCIL: Long Thoughts with Short Memory

Chenxiao Yang · Nati Srebro · David McAllester · Zhiyuan Li

Mask-Enhanced Autoregressive Prediction: Pay Less Attention to Learn More

Xialie Zhuang · Zhikai Jia · Jianjin Li · Zhenyu Zhang · Li Shen · Zheng Cao · Shiwei Liu

TruthFlow: Truthful LLM Generation via Representation Flow Correction

Hanyu Wang · Bochuan Cao · Yuanpu Cao · Jinghui Chen

MPO: An Efficient Post-Processing Framework for Mixing Diverse Preference Alignment

Tianze Wang · Dongnan Gui · Yifan Hu · Shuhang Lin · Linjun Zhang

GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation

Jiashu HE · Mingyu Ma · Jinxuan Fan · Dan Roth · Wei Wang · Alejandro Ribeiro

Memory Layers at Scale

Vincent-Pierre Berges · Barlas Oğuz · Daniel HAZIZA · Scott Yih · Luke Zettlemoyer · Gargi Ghosh

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence

Shangbin Feng · Zifeng Wang · Yike Wang · Sayna Ebrahimi · Hamid Palangi · Lesly Miculicich · Achin Kulshrestha · Nathalie Rauschmayr · Yejin Choi · Yulia Tsvetkov · Chen-Yu Lee · Tomas Pfister

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

Yafu Li · Xuyang Hu · Xiaoye Qu · Linjie Li · Yu Cheng

GraphGPT: Generative Pre-trained Graph Eulerian Transformer

Qifang Zhao · Weidong Ren · Tianyu Li · Hong Liu · Xingsheng He · Xiaoxiao Xu

SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs

Shibo Jie · Yehui Tang · Kai Han · Zhi-Hong Deng · Jing Han

Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge

Swarnadeep Saha · Xian Li · Marjan Ghazvininejad · JASON WESTON · Tianlu Wang

Demystifying Long Chain-of-Thought Reasoning

Edward Yeo · Yuxuan Tong · Xinyao Niu · Graham Neubig · Xiang Yue

Compositional Causal Reasoning Evaluation in Language Models

Jacqueline Maasch · Alihan Hüyük · Xinnuo Xu · Aditya Nori · Javier Gonzalez

Policy Guided Tree Search for Enhanced LLM Reasoning

Yang Li

Do NOT Think That Much for 2+3=? On the Overthinking of Long Reasoning Models

Xingyu Chen · Jiahao Xu · Tian Liang · Zhiwei He · Jianhui Pang · Dian Yu · Linfeng Song · Qiuzhi Liu · Mengfei Zhou · Zhuosheng Zhang · Rui Wang · Zhaopeng Tu · Haitao Mi · Dong Yu

CoMemo: LVLMs Need Image Context with Image Memory

Shi Liu · Weijie Su · Xizhou Zhu · Wenhai Wang · Jifeng Dai

Mixture of Hidden-Dimensions: Not All Hidden-States’ Dimensions are Needed in Transformer

Yilong Chen · Junyuan Shang · Zhenyu Zhang · Jiawei Sheng · Tingwen Liu · Shuohuan Wang · Yu Sun · Hua Wu · Haifeng Wang

Benign Samples Matter! Fine-tuning On Outlier Benign Samples Severely Breaks Safety

Zihan Guan · Mengxuan Hu · Ronghang Zhu · Sheng Li · Anil Vullikanti

AlphaDPO: Adaptive Reward Margin for Direct Preference Optimization

Junkang Wu · xue wang · Zhengyi Yang · Jiancan Wu · Jinyang Gao · Bolin Ding · Xiang Wang · Xiangnan He

GRU: Mitigating the Trade-off between Unlearning and Retention for LLMs

Yue Wang · Qizhou Wang · Feng Liu · Wei Huang · Yali Du · Xiaojiang Du · Bo Han

EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents

Rui Yang · Hanyang(Jeremy) Chen · Junyu Zhang · Mark Zhao · Cheng Qian · Kangrui Wang · Qineng Wang · Teja Koripella · Marziyeh Movahedi · Manling Li · Heng Ji · Huan Zhang · Tong Zhang

Hypo3D: Exploring Hypothetical Reasoning in 3D

Ye Mao · Weixun Luo · Junpeng Jing · Anlan Qiu · Krystian Mikolajczyk

Robust Multimodal Large Language Models Against Modality Conflict

Zongmeng Zhang · Wengang Zhou · Jie Zhao · Houqiang Li

DocKS-RAG: Optimizing Document-Level Relation Extraction through LLM-Enhanced Hybrid Prompt Tuning

Xiaolong Xu · Yibo Zhou · Haolong Xiang · Xiaoyong Li · Xuyun Zhang · Lianyong Qi · Wanchun Dou

Teaching Language Models to Critique via Reinforcement Learning

Zhihui Xie · Jie chen · Liyu Chen · Weichao Mao · Jingjing Xu · Lingpeng Kong

Aligning with Logic: Measuring, Evaluating and Improving Logical Preference Consistency in Large Language Models

Yinhong Liu · Zhijiang Guo · Tianya Liang · Ehsan Shareghi · Ivan Vulić · Nigel Collier

Gravity-Bench-v1: A Benchmark on Gravitational Physics Discovery for Agents

Nolan Koblischke · Hyunseok Jang · Kristen Menou · Mohamad Ali-Dib

Interpreting the Repeated Token Phenomenon in Large Language Models

Itay Yona · Ilia Shumailov · Jamie Hayes · Yossi Gandelsman

Non-Asymptotic Length Generalization

Thomas Chen · Tengyu Ma · Zhiyuan Li

What Do Learning Dynamics Reveal About Generalization in LLM Mathematical Reasoning?

Katie Kang · Amrith Setlur · Dibya Ghosh · Jacob Steinhardt · Claire Tomlin · Sergey Levine · Aviral Kumar

Overtrained Language Models Are Harder to Fine-Tune

Jacob Mitchell Springer · Sachin Goyal · Kaiyue Wen · Tanishq Kumar · Xiang Yue · Sadhika Malladi · Graham Neubig · Aditi Raghunathan

Perception in Reflection

Yana Wei · Liang Zhao · Kangheng Lin · En Yu · Yuang Peng · Runpei Dong · Jianjian Sun · Haoran Wei · Zheng Ge · Xiangyu Zhang · Vishal Patel

CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularization

Nay Myat Min · Long H. Pham · Yige Li · Jun Sun

Resolving Lexical Bias in Model Editing

Hammad Rizwan · Domenic Rosati · Ga Wu · Hassan Sajjad

Programming Every Example: Lifting Pre-training Data Quality Like Experts at Scale

Fan Zhou · Zengzhi Wang · Qian Liu · Junlong Li · Pengfei Liu

Retraining-free Merging of Sparse MoE via Hierarchical Clustering

I-Chun Chen · Hsu-Shen Liu · Wei-Fang Sun · Chen-Hao Chao · Yen-Chang Hsu · Chun-Yi Lee

C-3PO: Compact Plug-and-Play Proxy Optimization to Achieve Human-like Retrieval-Augmented Generation

Guoxin Chen · Minpeng Liao · Peiying Yu · Dingmin Wang · Zile Qiao · Chao Yang · Xin Zhao · Kai Fan

CodeIO: Condensing Reasoning Patterns via Code Input-Output Prediction

Junlong Li · Daya Guo · Dejian Yang · Runxin Xu · Yu Wu · Junxian He

QLASS: Boosting Language Agent Inference via Q-Guided Stepwise Search

Zongyu Lin · Yao Tang · Xingcheng Yao · Da Yin · ziniu hu · Yizhou Sun · Kai-Wei Chang

CodeSteer: Symbolic-Augmented Language Models via Code/Text Guidance

Yongchao Chen · Yilun Hao · Yueying Liu · Yang Zhang · Chuchu Fan

Modularized Self-Reflected Video Reasoner for Multimodal LLM with Application to Video Question Answering

Zihan Song · Xin Wang · Zi Qian · Hong Chen · Longtao Huang · Hui Xue' · Wenwu Zhu

Product of Experts with LLMs: Boosting Performance on ARC Is a Matter of Perspective

Daniel Franzen · Jan Disselhoff · David Hartmann

Understanding Synthetic Context Extension via Retrieval Heads

Xinyu Zhao · Fangcong Yin · Greg Durrett

Streamline Without Sacrifice - Squeeze out Computation Redundancy in LMM

Penghao Wu · Lewei Lu · Ziwei Liu

Tuning LLM Judge Design Decisions for 1/1000 of the Cost

David Salinas · Omar Swelam · Frank Hutter

EVOLvE: Evaluating and Optimizing LLMs For In-Context Exploration

Allen Nie · Yi Su · Bo Chang · Jonathan Lee · Ed Chi · Quoc Le · Minmin Chen

Controlling Large Language Model with Latent Action

Chengxing Jia · Ziniu Li · Pengyuan Wang · Yi-Chen Li · Zhenyu Hou · Yuxiao Dong · Yang Yu

Language Models as Implicit Tree Search

Ziliang Chen · Zhao-Rong Lai · Yufeng Yang · Liangda Fang · ZHANFU YANG · Liang Lin

Automated Hypothesis Validation with Agentic Sequential Falsifications

Kexin Huang · Ying Jin · Ryan Li · Michael Li · Emmanuel J Candes · Jure Leskovec

What Limits Bidirectional Model's Generative Capabilities? A Uni-Bi-Directional Mixture-of-Expert Method For Bidirectional Fine-tuning

Zuchao Li · Yonghua Hei · Qiwei Li · Lefei Zhang · Ping Wang · hai zhao · qi baoyuan · Liu Guoming

Rethinking External Slow-Thinking: From Snowball Errors to Probability of Correct Reasoning

Zeyu Gan · Yun Liao · Yong Liu

Accelerating Large Language Model Reasoning via Speculative Search

Zhihai Wang · Jie Wang · Jilai Pan · Xilin Xia · Huiling Zhen · Mingxuan Yuan · Jianye Hao · Feng Wu

GANQ: GPU-Adaptive Non-Uniform Quantization for Large Language Models

Pengxiang Zhao · Xiaoming Yuan

Diverging Preferences: When do Annotators Disagree and do Models Know?

Michael Zhang · Zhilin Wang · Jena Hwang · Yi Dong · Olivier Delalleau · Yejin Choi · Eunsol Choi · Xiang Ren · Valentina Pyatkin

On Teacher Hacking in Language Model Distillation

Daniil Tiapkin · Daniele Calandriello · Johan Ferret · Sarah Perrin · Nino Vieillard · Alexandre Rame · Mathieu Blondel

MoRAgent: Parameter Efficient Agent Tuning with Mixture-of-Roles

Jing Han · Binwei Yan · Tianyu Guo · Zheyuan Bai · Mengyu Zheng · Hanting Chen · Ying Nie

Reward-Augmented Data Enhances Direct Preference Alignment of LLMs

Shenao Zhang · Zhihan Liu · Boyi Liu · Yufeng Zhang · Yingxiang Yang · Yongfei Liu · Liyu Chen · Tao Sun · Zhaoran Wang

T1: Advancing Language Model Reasoning through Reinforcement Learning and Inference Scaling

Zhenyu Hou · Xin Lv · Rui Lu · Jiajie Zhang · Yujiang Li · Zijun Yao · Juanzi Li · Jie Tang · Yuxiao Dong

LLMs Can Reason Faster Only If We Let Them

Bilgehan Sel · Lifu Huang · Naren Ramakrishnan · Ruoxi Jia · Ming Jin

SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning

Tianjian Li · Daniel Khashabi

RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning

Jason Chan · Robert Gaizauskas · Zhixue Zhao

Statistical Hypothesis Testing for Auditing Robustness in Language Models

Paulius Rauba · Qiyao Wei · Mihaela van der Schaar

Thickness-aware E(3)-Equivariant 3D Mesh Neural Networks

Sungwon Kim · Namkyeong Lee · Yunyoung Doh · Seungmin Shin · Guimok Cho · Seung-Won Jeon · Sangkook Kim · Chanyoung Park

Adaptive Message Passing: A General Framework to Mitigate Oversmoothing, Oversquashing, and Underreaching

Federico Errica · Henrik Christiansen · Viktor Zaverkin · Takashi Maruyama · Mathias Niepert · Francesco Alesiani

EAGLES: Towards Effective, Efficient, and Economical Federated Graph Learning via Unified Sparsification

Zitong Shi · Guancheng Wan · Wenke Huang · Guibin Zhang · He Li · Carl Yang · Mang Ye

GPEN: Global Position Encoding Network for Enhanced Subgraph Representation Learning

Nannan Wu · Yuming Huang · Yiming Zhao · Jie Chen · Wenjun Wang

Open Your Eyes: Vision Enhances Message Passing Neural Networks in Link Prediction

Yanbin Wei · Xuehao Wang · Zhan Zhuang · Yang Chen · Shuhao Chen · Yulong Zhang · James Kwok · Yu Zhang

Positional Encoding meets Persistent Homology on Graphs

Yogesh Verma · Amauri Souza · Vikas Garg

PROXSPARSE: REGULARIZED LEARNING OF SEMI-STRUCTURED SPARSITY MASKS FOR PRETRAINED LLMS

Hongyi Liu · Rajarshi Saha · Zhen Jia · Youngsuk Park · Jiaji Huang · Shoham Sabach · Yu-Xiang Wang · George Karypis

STP: Self-play LLM Theorem Provers with Iterative Conjecturing and Proving

Kefan Dong · Tengyu Ma

Let LLM Tell What to Prune and How Much to Prune

Mingzhe Yang · Sihao Lin · Changlin Li · Xiaojun Chang

Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks

Lutfi Erdogan · Hiroki Furuta · Sehoon Kim · Nicholas Lee · Suhong Moon · Gopala Anumanchipalli · Kurt Keutzer · Amir Gholaminejad

FedPHA: Federated Prompt Learning for Heterogeneous Client Adaptation

Chengying Fang · Wenke Huang · Guancheng Wan · Yihao Yang · Mang Ye

The Hidden Dimensions of LLM Alignment: A Multi-Dimensional Analysis of Orthogonal Safety Directions

Wenbo Pan · Zhichao Liu · Qiguang Chen · Xiangyang Zhou · Yu Haining · Xiaohua Jia

From Theory to Practice: Rethinking Green and Martin Kernels for Unleashing Graph Transformers

Yoon Hyeok Lee · Jaemin Park · Taejin Paik · Doyun Kim · Bosun Hwang

AutoGFM: Automated Graph Foundation Model with Adaptive Architecture Customization

Haibo Chen · Xin Wang · Zeyang Zhang · Haoyang Li · Ling Feng · Wenwu Zhu

Directed Graph Grammars for Sequence-based Learning

Michael Sun · Orion Foo · Gang Liu · Wojciech Matusik · Jie Chen

WILTing Trees: Interpreting the Distance Between MPNN Embeddings

Masahiro Negishi · Thomas Gärtner · Pascal Welke

Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model

Yuzhong Hong · Hanshan Zhang · Junwei Bao · Hongfei Jiang · yang song

Expressive Power of Graph Neural Networks for (Mixed-Integer) Quadratic Programs

Ziang Chen · Xiaohan Chen · Jialin Liu · Xinshang Wang · Wotao Yin

Delay-DSGN: A Dynamic Spiking Graph Neural Network with Delay Mechanisms for Evolving Graph

Zhiqiang Wang · Jianghao Wen · Jianqing Liang

PieClam: A Universal Graph Autoencoder Based on Overlapping Inclusive and Exclusive Communities

Daniel Zilberg · Ron Levie

Covered Forest: Fine-grained generalization analysis of graph neural networks

Antonis Vasileiou · Ben Finkelshtein · Floris Geerts · Ron Levie · Christopher Morris

MimicMotion: High-Quality Human Motion Video Generation with Confidence-aware Pose Guidance

Yuang Zhang · Jiaxi Gu · Li-Wen Wang · Han Wang · JunqiCheng · Yuefeng Zhu · FangYuan Zou

SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer

Enze Xie · Junsong Chen · Yuyang Zhao · Jincheng YU · Ligeng Zhu · Yujun Lin · Zhekai Zhang · Muyang Li · Junyu Chen · Han Cai · Bingchen Liu · Zhou Daquan · Song Han

Normalizing Flows are Capable Generative Models

Shuangfei Zhai · Ruixiang Zhang · Preetum Nakkiran · David Berthelot · Jiatao Gu · Huangjie Zheng · Tianrong Chen · Miguel Angel Bautista Martin · Navdeep Jaitly · Joshua M Susskind

Efficient Molecular Conformer Generation with SO(3)-Averaged Flow Matching and Reflow

Zhonglin Cao · Mario Geiger · Allan Costa · Danny Reidenbach · Karsten Kreis · Tomas Geffner · Franco Pellegrini · Guoqing Zhou · Emine Kucukbenli

SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation

Zihan Liu · Shuangrui Ding · Zhixiong Zhang · Xiaoyi Dong · Pan Zhang · Yuhang Zang · Yuhang Cao · Dahua Lin · Jiaqi Wang

Introducing 3D Representation for Dense Volume-to-Volume Translation via Score Fusion

Xiyue Zhu · Dou Kwark · Ruike Zhu · Kaiwen Hong · Yiqi Tao · Shirui Luo · Yudu Li · Zhi-Pei Liang · Volodymyr Kindratenko

ZipAR: Parallel Autoregressive Image Generation through Spatial Locality

Yefei He · Feng Chen · Yuanyu He · Shaoxuan He · Hong Zhou · Kaipeng Zhang · Bohan Zhuang

MissScore: High-Order Score Estimation in the Presence of Missing Data

Wenqin Liu · Haoze Hou · Erdun Gao · Biwei Huang · Qiuhong Ke · Howard Bondell · Mingming Gong

Training Diffusion-based Generative Models with Limited Data

Zhaoyu Zhang · Yang Hua · Guanxiong Sun · Hui Wang · Seán McLoone

AdvI2I: Adversarial Image Attack on Image-to-Image Diffusion Models

Yaopei Zeng · Yuanpu Cao · Bochuan Cao · Yurui Chang · Jinghui Chen · Lu Lin

Graph Generative Pre-trained Transformer

Xiaohui Chen · Yinkai Wang · JIAXING HE · Yuanqi Du · Soha Hassoun · Xiaolin Xu · Liping Liu

Inverse Flow and Consistency Models

Yuchen Zhang · Jian Zhou

CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation

Minghao Fu · Guo-Hua Wang · Liangfu Cao · Qing-Guo Chen · Zhao Xu · Weihua Luo · Kaifu Zhang

Gaussian Mixture Flow Matching Models

Hansheng Chen · Kai Zhang · Hao Tan · Zexiang Xu · Fujun Luan · Leonidas Guibas · Gordon Wetzstein · Sai Bi

OmiAD: One-Step Adaptive Masked Diffusion Model for Multi-class Anomaly Detection via Adversarial Distillation

Yaoxuan Feng · Wenchao Chen · yuxin li · Bo Chen · Yubiao Wang · Zixuan Zhao · Hongwei Liu · Mingyuan Zhou

Continuous Visual Autoregressive Generation via Score Maximization

Chenze Shao · Fandong Meng · Jie Zhou

FrameBridge: Improving Image-to-Video Generation with Bridge Models

Yuji Wang · Zehua Chen · Chen Xiaoyu · Yixiang Wei · Jun Zhu · Jianfei Chen

Distillation of Discrete Diffusion through Dimensional Correlations

Satoshi Hayakawa · Yuhta Takida · Masaaki Imaizumi · Hiromi Wakaki · Yuki Mitsufuji

Simple and Critical Iterative Denoising: A Recasting of Discrete Diffusion in Graph Generation

Yoann Boget

Scalable Non-Equivariant 3D Molecule Generation via Rotational Alignment

Yuhui Ding · Thomas Hofmann

Differentiable Solver Search for Fast Diffusion Sampling

shuai wang · Zexian Li · Qipeng zhang · Tianhui Song · Xubin Li · Tiezheng Ge · Bo Zheng · Limin Wang

On the Guidance of Flow Matching

Ruiqi Feng · Chenglei Yu · Wenhao Deng · Peiyan Hu · Tailin Wu

Effective and Efficient Masked Image Generation Models

Zebin You · Jingyang Ou · Xiaolu Zhang · Jun Hu · JUN ZHOU · Chongxuan Li

Is Noise Conditioning Necessary for Denoising Generative Models?

Qiao Sun · Zhicheng Jiang · Hanhong Zhao · Kaiming He

Towards Rationale-Answer Alignment of LVLMs via Self-Rationale Calibration

Yuanchen Wu · Ke Yan · Shouhong Ding · Ziyin Zhou · Xiaoqiang Li

ExLM: Rethinking the Impact of $\texttt{[MASK]}$ Tokens in Masked Language Models

Kangjie Zheng · Junwei Yang · Siyue Liang · Bin Feng · Zequn Liu · Wei Ju · Zhiping Xiao · Ming Zhang

Physics-informed Temporal Alignment for Auto-regressive PDE Foundation Models

Congcong Zhu · Xiaoyan Xu · Jiayue Han · Jingrun Chen

M+: Extending MemoryLLM with Scalable Long-Term Memory

Yu Wang · Dmitry Krotov · Yuanzhe Hu · Yifan Gao · Wangchunshu Zhou · Julian McAuley · Dan Gutfreund · Rogerio Feris · Zexue He

Fundamental Limits of Visual Autoregressive Transformers: Universal Approximation Abilities

Yifang Chen · Xiaoyu Li · Yingyu Liang · Zhenmei Shi · Zhao Song

Sparse Spectral Training and Inference on Euclidean and Hyperbolic Neural Networks

Jialin Zhao · Yingtao Zhang · Xinghang Li · Huaping Liu · Carlo Cannistraci

Oscillation-Reduced MXFP4 Training for Vision Transformers

Yuxiang Chen · Haocheng Xi · Jun Zhu · Jianfei Chen

Sorbet: A Neuromorphic Hardware-Compatible Transformer-Based Spiking Language Model

Kaiwen Tang · Zhanglu Yan · Weng-Fai Wong

SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization

Jintao Zhang · Haofeng Huang · Pengle Zhang · Jia wei · Jun Zhu · Jianfei Chen

Hgformer: Hyperbolic Graph Transformer for Collaborative Filtering

Yang Xin · Xingrun Li · Heng Chang · Yang jinze · xihong yang · Shengyu Tao · Maiko Shigeno · Ningkang Chang · Junfeng Wang · Dawei Yin · Erxue Min

RePaViT: Scalable Vision Transformer Acceleration via Structural Reparameterization on Feedforward Network Layers

Xuwei Xu · Yang Li · Yudong Chen · Jiajun LIU · Sen Wang

In-Context Denoising with One-Layer Transformers: Connections between Attention and Associative Memory Retrieval

Matthew Smart · Alberto Bietti · Anirvan Sengupta

In-Context Linear Regression Demystified: Training Dynamics and Mechanistic Interpretability of Multi-Head Softmax Attention

Jianliang He · Xintian Pan · Siyu Chen · Zhuoran Yang

Contrastive Localized Language-Image Pre-Training

Hong-You Chen · Zhengfeng Lai · Haotian Zhang · Xinze Wang · Marcin Eichner · Keen You · Meng Cao · Bowen Zhang · Yinfei Yang · Zhe Gan

FG-CLIP: Fine-Grained Visual and Textual Alignment

Chunyu Xie · Bin Wang · Fanjing Kong · Jincheng Li · Dawei Liang · Gengshen Zhang · Dawei Leng · Yuhui Yin

QMamba: On First Exploration of Vision Mamba for Image Quality Assessment

Fengbin Guan · Xin Li · Zihao Yu · Yiting Lu · Zhibo Chen

Stream-level Flow Matching with Gaussian Processes

Ganchao Wei · Li Ma

TabPFN Unleashed: A Scalable and Effective Solution to Tabular Classification Problems

Si-Yang Liu · Han-Jia Ye

GRADEO: Towards Human-Like Evaluation for Text-to-Video Generation via Multi-Step Reasoning

Zhun Mou · Bin Xia · Zhengchao Huang · Wenming Yang · Jiaya Jia

One-dimensional Path Convolution

Xuanshu Luo · Martin Werner

Understanding Mode Connectivity via Parameter Space Symmetry

Bo Zhao · Nima Dehmamy · Robin Walters · Rose Yu

Multiobjective distribution matching

Xiaoyuan Zhang · Peijie Li · Ying Ying YU · Yichi Zhang · Han Zhao · Qingfu Zhang

Compositional Scene Understanding through Inverse Generative Modeling

Yanbo Wang · Justin Dauwels · Yilun Du

Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization

Yang Shen · Xiu-Shen Wei · Yifan Sun · YuXin Song · Tao Yuan · Jian Jin · He-Yang Xu · Yazhou Yao · Errui Ding

Activation by Interval-wise Dropout: A Simple Way to Prevent Neural Networks from Plasticity Loss

Sangyeon Park · Isaac Han · Seungwon Oh · KyungJoong Kim

Where is the Truth? The Risk of Getting Confounded in a Continual World

Florian Peter Busch · Roshni Ramanna Kamath · Rupert Mitchell · Wolfgang Stammer · Kristian Kersting · Martin Mundt

How Effective Can Dropout Be in Multiple Instance Learning ?

Wenhui Zhu · Peijie Qiu · Xiwen Chen · Zhangsihao Yang · Aristeidis Sotiras · Abolfazl Razi · Yalin Wang

Larger or Smaller Reward Margins to Select Preferences for LLM Alignment?

Kexin Huang · Junkang Wu · Ziqian Chen · xue wang · Jinyang Gao · Bolin Ding · Jiancan Wu · Xiangnan He · Xiang Wang

Learning Bayesian Nash Equilibrium in Auction Games via Approximate Best Response

Kexin Huang · Ziqian Chen · xue wang · Chongming Gao · Jinyang Gao · Bolin Ding · Xiang Wang

Position: LLMs Need a Bayesian Meta-Reasoning Framework for More Robust and Generalizable Reasoning

Hanqi Yan · Linhai Zhang · Jiazheng Li · Zhenyi Shen · Yulan He

Position: Don't Use the CLT in LLM Evals With Fewer Than a Few Hundred Datapoints

Sam Bowyer · Laurence Aitchison · Desi Ivanova

Position: You Can't Manufacture a NeRF

Marta An Kimmel · Mueed Rehman · Yonatan Bisk · Gary Fedder

Position: Solve Layerwise Linear Models First to Understand Neural Dynamical Phenomena (Neural Collapse, Emergence, Lazy/Rich Regime, and Grokking)

Yoonsoo Nam · Seok Hyeong Lee · Clémentine Dominé · Yeachan Park · Charles London · Wonyl Choi · Niclas Göring · Seungjai Lee

Suitability Filter: A Statistical Framework for Classifier Evaluation in Real-World Deployment Settings

Angéline Pouget · Mohammad Yaghini · Stephan Rabanser · Nicolas Papernot

De-AntiFake: Rethinking the Protective Perturbations Against Voice Cloning Attacks

Wei Fan · Kejiang Chen · Chang Liu · Weiming Zhang · Nenghai Yu

Circumventing Backdoor Space via Weight Symmetry

Jie Peng · Hongwei Yang · Jing Zhao · Hengji Dong · Hui He · Weizhe Zhang · Haoyu He

Assessing Safety Risks and Quantization-aware Safety Patching for Quantized Large Language Models

Kejia Chen · Jiawen Zhang · Jiacong Hu · Yu Wang · Jian Lou · Zunlei Feng · Mingli Song

TRUST-VLM: Thorough Red-Teaming for Uncovering Safety Threats in Vision-Language Models

Kangjie Chen · Muyang Li · Guanlin Li · Shudong Zhang · Shangwei Guo · Tianwei Zhang

Efficient and Privacy-Preserving Soft Prompt Transfer for LLMs

Xun Wang · Jing Xu · Franziska Boenisch · Michael Backes · Christopher A. Choquette Choo · Adam Dziedzic

Improving Out-of-Distribution Detection via Dynamic Covariance Calibration

Kaiyu Guo · Zijian Wang · Tan Pan · Brian Lovell · Mahsa Baktashmotlagh

An End-to-End Model for Logits-Based Large Language Models Watermarking

KA HIM WONG · Jicheng Zhou · Jiantao Zhou · Yain-Whar Si

Stealix: Model Stealing via Prompt Evolution

Zhixiong Zhuang · Hui-Po Wang · Irina Nicolae · Mario Fritz

AdvPrompter: Fast Adaptive Adversarial Prompting for LLMs

Anselm Paulus · Arman Zharmagambetov · Chuan Guo · Brandon Amos · Yuandong Tian

Statistical Collusion by Collectives on Learning Platforms

Etienne Gauthier · Francis Bach · Michael Jordan

Provably Cost-Sensitive Adversarial Defense via Randomized Smoothing

Yuan Xin · Dingfan Chen · Michael Backes · Xiao Zhang

Understanding and Mitigating Miscalibration in Prompt Tuning for Vision-Language Models

Shuoyuan Wang · Sharon Li · Hongxin Wei

Understanding Model Ensemble in Transferable Adversarial Attack

Wei Yao · Zeliang Zhang · Huayi Tang · Yong Liu

Scaling Laws for Differentially Private Language Models

Ryan McKenna · Yangsibo Huang · Amer Sinha · Borja de Balle Pigem · Zachary Charles · Christopher A. Choquette Choo · Badih Ghazi · Georgios Kaissis · Ravi Kumar · Ruibo Liu · Da Yu · Chiyuan Zhang

Variance as a Catalyst: Efficient and Transferable Semantic Erasure Adversarial Attack for Customized Diffusion Models

Jiachen Yang · Yusong Wang · Yanmei Fang · Yunshu Dai · Fangjun Huang

Janus: Dual-Server Multi-Round Secure Aggregation with Verifiability for Federated Learning

Lang Pu · Jingjing Gu · Chao Lin · Xinyi Huang

The Value of Prediction in Identifying the Worst-Off

Unai Fischer Abaigar · Christoph Kern · Juan Perdomo

Noisy SIGNSGD Is More Differentially Private Than You (Might) Think

Richeng Jin · Huaiyu (David) Dai

SecEmb: Sparsity-Aware Secure Federated Learning of On-Device Recommender System with Large Embedding

Peihua Mai · Youlong Ding · Ziyan Lyu · Minxin Du · Yan (James) Pang

FOCoOp: Enhancing Out-of-Distribution Robustness in Federated Prompt Learning for Vision-Language Models

Xinting Liao · Weiming Liu · Jiaming Qian · Pengyang Zhou · Jiahe Xu · Wenjie Wang · Chaochao Chen · Xiaolin Zheng · Tat-Seng Chua

Fast Exact Unlearning for In-Context Learning Data for LLMs

Andrei Muresanu · Anvith Thudi · Michael Zhang · Nicolas Papernot

Adapting to Linear Separable Subsets with Large-Margin in Differentially Private Learning

Erchi Wang · Yuqing Zhu · Yu-Xiang Wang

Towards Trustworthy Federated Learning with Untrusted Participants

Youssef Allouah · Rachid Guerraoui · John Stephan

Kandinsky Conformal Prediction: Beyond Class- and Covariate-Conditional Coverage

Konstantina Bairaktari · Jiayun Wu · Steven Wu

Self-Consuming Generative Models with Adversarially Curated Data

Xiukun Wei · Xueru Zhang

MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking

Sebastian Farquhar · Vikrant Varma · David Lindner · David Elson · Caleb Biddulph · Ian Goodfellow · Rohin Shah

A New Approach to Backtracking Counterfactual Explanations: A Unified Causal Framework for Efficient Model Interpretability

Pouria Fatemi · Ehsan Sharifian · Mohammad Hossein Yassaee

A Lens into Interpretable Transformer Mistakes via Semantic Dependency

Ruo-Jing Dong · Yu Yao · Bo Han · Tongliang Liu

Archetypal SAE: Adaptive and Stable Dictionary Learning for Concept Extraction in Large Vision Models

Thomas Fel · Ekdeep Singh Lubana · Jacob Prince · Matthew Kowal · Victor Boutin · Isabel Papadimitriou · Binxu Wang · Martin Wattenberg · Demba Ba · Talia Konkle

The Illusion of Role Separation: Hidden Shortcuts in LLM Role Learning (and How to Fix Them)

Zihao Wang · Yibo Jiang · Jiahao Yu · Heqing Huang

Go to Event Page

Social

Building ML Systems: From Research to Real-World Production with MLOps

Jothsna Praveena Pendyala

7:00 PM - 9:00 PM

Building machine learning systems that work in production is significantly more complex than training high-accuracy models in research. This social aims to bring together researchers, engineers, and practitioners interested in MLOps—the set of practices that enables scalable, reproducible, and reliable ML deployment. We will explore the challenges of operationalizing ML, from data drift and CI/CD to model monitoring and governance. The session will include lightning talks, informal discussion circles, and networking opportunities. It is targeted at attendees who want to bridge the gap between cutting-edge ML research and real-world system deployment.

... more

Social

AI Safety Social

7:00 PM - 9:00 PM

We will begin with a panel on the impacts of reasoning models and goal-directed behavior on AI safety, followed by Q&A and free discussions. Our panelists are Aditi Raghunathan, Anca Dragan, David Duvenaud, and Siva Reddy. Come connect over snacks & drinks!

This event is hosted by the Center for AI Safety.

... more

Social

Building Inclusive Communities at ICML by LatinX in AI, WiML and RBC Borealis

Ana Maria Quintero-Ossa · Eirene Seiradaki · Tatjana Chavdarova

7:00 PM - 9:00 PM

Event page: https://rbcborealis.com/icml-2025-event-building-inclusive-communities-at-icml/
Register here: https://lu.ma/vhu2byhd

... more

Social

Speed Mentoring across the Community in Academia and Industry

Evan Shelhamer

7:00 PM - 9:00 PM

Join our mentoring sessions for students, postdocs, and early career industry researchers and engineers. The format is speed mentoring: a group of mentees join a mentor at a table, chat for 15-20 minutes, and then the mentors rotate across the tables and keep the conversation going. This is a great way to discuss a lot of topics in a little time and hear from different perspectives.

While the social is 7-9pm, do feel free to come and go, and join for just the first or second hour if that is what fits your schedule.

- Sign up as a mentor!
- Sign up as a mentee!

Our mentors include

- Margo Seltzer: UBC
- Peter McElroy: EarthDaily
- Yu Sun: Stanford University
- Motasem Alfarra: Qualcomm AI Research (was: KAUST)
- Tahniat Khan: Vector Institute
- Claas Voelcker: University of Toronto
- Abeer Badawi: York University
- Mahdi Haghifam: Northeastern University
- Yani Ioannou: University of Calgary
- Anthony Fuller: Carleton University + Vector
- Danica Sutherland: UBC + Amii
- Evan Shelhamer: UBC + Vector (was: Google DeepMind, Adobe Research, UC Berkeley)

... more

Main Navigation

ICML Lounge Area

Registration West

Registration East

What to optimize for – from robot arms to frontier AI - Anca Dragan

Exhibits

Oral 5A Safety and Security

Oral 5E Learning Theory

Oral 5B Deep Learning Algorithms

Oral 5C Probablistic Models

Oral 5D Applications in Math and Physics

Science Communication 101: How to write an elevator pitch for your research

Poster Session 5 West

Poster Session 5 East

Town Hall

Closing the Loop: Machine Learning for Optimization and Discovery

Oral 6B Deep Learning Architectures

Oral 6D Evaluation

Oral 6E Social and Economic Perspectives

Oral 6A Applications in Agents and Coding

Oral 6C Learning Dynamics 2

Poster Session 6 West

Poster Session 6 East

Building ML Systems: From Research to Real-World Production with MLOps

AI Safety Social

Building Inclusive Communities at ICML by LatinX in AI, WiML and RBC Borealis

Speed Mentoring across the Community in Academia and Industry