ICML 2025 Wednesday 07/16

Timezone: America/Vancouver

Full Schedule Sun 7/13 Mon 7/14 Tue 7/15 Wed 7/16 Thu 7/17 Fri 7/18 Sat 7/19

Meetup

ICML Lounge Area

7:30 AM - 7:00 PM

This meeting room is for ICML delegates to relax and recharge in a comfortable environment.

... more

Registration Desk

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

Sergey Ioffe · Christian Szegedy

8:30 AM - 9:30 AM

Training Deep Neural Networks is complicated by the fact that the distribution of each layer's inputs changes during training, as the parameters of the previous layers change. This slows down the training by requiring lower learning rates and careful parameter initialization, and makes it notoriously hard to train models with saturating nonlinearities. We refer to this phenomenon as internal covariate shift, and address the problem by normalizing layer inputs. Our method draws its strength from making normalization a part of the model architecture and performing the normalization for each training mini-batch. Batch Normalization allows us to use much higher learning rates and be less careful about initialization. It also acts as a regularizer, in some cases eliminating the need for Dropout. Applied to a state-of-the-art image classification model, Batch Normalization achieves the same accuracy with 14 times fewer training steps, and beats the original model by a significant margin. Using an ensemble of batch-normalized networks, we improve upon the best published result on ImageNet classification: reaching 4.9% top-5 validation error (and 4.8% test error), exceeding the accuracy of human raters.

... more

Exhibit Hall

Exhibits

9:30 AM - 6:00 PM

Affinity Workshop

WiML

Tatjana Chavdarova · Giulia Clerici · Mariya Hendriksen · Sophia Abraham · Ninon Lizé Masclef · Meriem Mehri · Christianah Titilope Oyewale · Mandana Samiei

10:00 AM - 9:00 PM

The Women in Machine Learning (WiML) Symposium @ ICML 2025 is an inclusive, community-centered in‑person event held on Wednesday, July 16, 2025, in Vancouver, Canada, as part of the ICML conference. The full‑day program (9:30 AM–3:35 PM) features a blend of invited talks, panel discussions, poster sessions, mentoring round tables, breakout Q&A sessions, and networking opportunities—all designed to foster mentorship, highlight cutting‑edge research, encourage idea exchange, and support the growth of women in the machine learning community.

WiML—founded in 2006—connects women working in machine learning to promote mentorship, collaboration, and visibility through academic and industry‑based events and initiatives.

... more

Oral

Oral 3D Optimization

10:00 AM - 11:00 AM

4 Events in this session

Nonlinearly Preconditioned Gradient Methods under Generalized Smoothness

Konstantinos Oikonomidis · Jan Quan · Emanuel Laude · Panagiotis Patrinos

An Online Adaptive Sampling Algorithm for Stochastic Difference-of-convex Optimization with Time-varying Distributions

Yuhan Ye · Ying Cui · Jingyi Wang

Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton

Chengmei Niu · Zhenyu Liao · Zenan Ling · Michael Mahoney

General framework for online-to-nonconvex conversion: Schedule-free SGD is also effective for nonconvex optimization

Kwangjun Ahn · Gagik Magakyan · Ashok Cutkosky

Go to Event Page

Oral

Oral 3B Representations 1

10:00 AM - 11:00 AM

4 Events in this session

A Generalization Theory for Zero-Shot Prediction

Ronak Mehta · Zaid Harchaoui

Statistical Test for Feature Selection Pipelines by Selective Inference

Tomohiro Shiraishi · Tatsuya Matsukawa · Shuichi Nishino · Ichiro Takeuchi

Learning with Expected Signatures: Theory and Applications

Lorenzo Lucchese · Mikko S. Pakkanen · Almut E. D. Veraart

Blink of an eye: a simple theory for feature localization in generative models

Marvin Li · Aayush Karan · Sitan Chen

Go to Event Page

Oral

Oral 3E Causality and Domain Generalization

10:00 AM - 11:00 AM

4 Events in this session

One-Step Generalization Ratio Guided Optimization for Domain Generalization

Sumin Cho · Dongwon Kim · Kwangsu Kim

An Improved Clique-Picking Algorithm for Counting Markov Equivalent DAGs via Super Cliques Transfer

Lifu Liu · Shiyuan He · Jianhua Guo

Polynomial-Delay MAG Listing with Novel Locally Complete Orientation Rules

Tian-Zuo Wang · Wen-Bo Du · Zhi-Hua Zhou

Sanity Checking Causal Representation Learning on a Simple Real-World System

Juan L. Gamella · Simon Bing · Jakob Runge

Go to Event Page

Oral

Oral 3A Reasoning

10:00 AM - 11:00 AM

4 Events in this session

Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction

Vaishnavh Nagarajan · Chen Wu · Charles Ding · Aditi Raghunathan

Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark

Yunzhuo Hao · Jiawei Gu · Huichen Wang · Linjie Li · Zhengyuan Yang · Lijuan Wang · Yu Cheng

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Xinyu Guan · Li Lyna Zhang · Yifei Liu · Ning Shang · Youran Sun · Yi Zhu · Fan Yang · Mao Yang

VersaPRM: Multi-Domain Process Reward Model via Synthetic Reasoning Data

Thomas Zeng · Shuibai Zhang · Shutong Wu · Christian Classen · Daewon Chae · Ethan Ewer · Minjae Lee · Heeju Kim · Wonjun Kang · Jackson Kunde · Ying Fan · Jungtaek Kim · HYUNG IL KOO · Kannan Ramchandran · Dimitris Papailiopoulos · Kangwook Lee

Go to Event Page

Oral

Oral 3C Data-Centric ML

10:00 AM - 11:00 AM

4 Events in this session

Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models

Anshuman Chhabra · Bo Li · Jian Chen · Prasant Mohapatra · Hongfu Liu

Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection

Zhijing Wan · Zhixiang Wang · Zheng Wang · Xin Xu · Shin'ichi Satoh

SK-VQA: Synthetic Knowledge Generation at Scale for Training Context-Augmented Multimodal LLMs

Xin Su · Man Luo · Kris Pan · Tien Pei Chou · Vasudev Lal · Phillip Howard

Improving the Scaling Laws of Synthetic Data with Deliberate Practice

Reyhane Askari Hemmat · Mohammad Pezeshki · Elvis Dohmatob · Florian Bordes · Pietro Astolfi · Melissa Hall · Jakob Verbeek · Michal Drozdzal · Adriana Romero-Soriano

Go to Event Page

Poster

Poster Session 3 West

11:00 AM - 1:30 PM

232 Events in this session

MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-text Decoding

Weikang Qiu · Zheng Huang · Haoyu Hu · Aosong Feng · Yujun Yan · ZHITAO YING

Tackling View-Dependent Semantics in 3D Language Gaussian Splatting

Jiazhong Cen · Xudong Zhou · Jiemin Fang · Changsong Wen · Lingxi Xie · xiaopeng zhang · Wei Shen · Qi Tian

Polynomial Time Learning Augmented Algorithms for NP-hard Permutation Problems

Evripidis Bampis · Bruno Escoffier · Dimitris Fotakis · Panagiotis Patsilinakos · Michalis Xefteris

QuEst: Enhancing Estimates of Quantile-Based Distributional Measures Using Model Predictions

Xinyu Yang · Tom Zollo · Benjamin Eyre · Amogh Inamdar · David Madras · Richard Zemel

Fragments to Facts: Partial-Information Fragment Inference from LLMs

Lucas Rosenblatt · Bin Han · Robert Wolfe · Bill Howe

Combinatorial Reinforcement Learning with Preference Feedback

Joongkyu Lee · Min-hwan Oh

Partially Observable Reinforcement Learning with Memory Traces

Onno Eberhard · Michael Muehlebach · Claire Vernade

Multi-objective Linear Reinforcement Learning with Lexicographic Rewards

Bo Xue · Dake Bu · Ji Cheng · Yuanyu Wan · Qingfu Zhang

Near-optimal Regret Using Policy Optimization in Online MDPs with Aggregate Bandit Feedback

Tal Lancewicki · Yishay Mansour

A Theoretical Justification for Asymmetric Actor-Critic Algorithms

Gaspard Lambrechts · Damien Ernst · Aditya Mahajan

Universal Approximation Theorem of Deep Q-Networks

Qian Qi

AdaWorld: Learning Adaptable World Models with Latent Actions

Shenyuan Gao · Siyuan Zhou · Yilun Du · Jun Zhang · Chuang Gan

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

Hongyi Zhou · Josiah Hanna · Jin Zhu · Ying Yang · Chengchun Shi

Multiple-policy Evaluation via Density Estimation

Yilei Chen · Aldo Pacchiano · Ioannis Paschalidis

Provable Zero-Shot Generalization in Offline Reinforcement Learning

Zhiyong Wang · Chen Yang · John C. S. Lui · Dongruo Zhou

Learning with Expected Signatures: Theory and Applications

Lorenzo Lucchese · Mikko S. Pakkanen · Almut E. D. Veraart

Efficient Diffusion Models for Symmetric Manifolds

Oren Mangoubi · Neil He · Nisheeth K. Vishnoi

Diffusion Models are Secretly Exchangeable: Parallelizing DDPMs via Auto Speculation

Hengyuan Hu · Aniket Das · Dorsa Sadigh · Nima Anari

The Limits of Tractable Marginalization

Oliver Broadrick · Sanyam Agarwal · Guy Van den Broeck · Markus Bläser

Exact Upper and Lower Bounds for the Output Distribution of Neural Networks with Random Inputs

Andrey Kofnov · Daniel Kapla · Ezio Bartocci · Efstathia Bura

Distributed Conformal Prediction via Message Passing

Haifeng Wen · Hong XING · Osvaldo Simeone

Blink of an eye: a simple theory for feature localization in generative models

Marvin Li · Aayush Karan · Sitan Chen

Federated Oriented Learning: A Practical One-Shot Personalized Federated Learning Framework

Guan Huang · Tao Shu

Statistical Test for Feature Selection Pipelines by Selective Inference

Tomohiro Shiraishi · Tatsuya Matsukawa · Shuichi Nishino · Ichiro Takeuchi

Making Hard Problems Easier with Custom Data Distributions and Loss Regularization: A Case Study in Modular Arithmetic

Eshika Saxena · Alberto Alfarano · Emily Wenger · Kristin Lauter

NMA-tune: Generating Highly Designable and Dynamics Aware Protein Backbones

Urszula Julia Komorowska · Francisco Vargas · Alessandro Rondina · Pietro Lió · Mateja Jamnik

WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction

Fanmeng Wang · Minjie Cheng · Hongteng Xu

MF-LAL: Drug Compound Generation Using Multi-Fidelity Latent Space Active Learning

Peter Eckmann · Dongxia Wu · Germano Heinzelmann · Michael Gilson · Rose Yu

DISCO: learning to DISCover an evolution Operator for multi-physics-agnostic prediction

Rudy Morel · Jiequn Han · Edouard Oyallon

PolyConf: Unlocking Polymer Conformation Generation through Hierarchical Generative Models

Fanmeng Wang · Wentao Guo · Qi Ou · Hongshuai Wang · Haitao Lin · Hongteng Xu · Zhifeng Gao

Empower Structure-Based Molecule Optimization with Gradient Guided Bayesian Flow Networks

Keyue Qiu · Yuxuan Song · Jie Yu · Hongbo Ma · Ziyao Cao · Zhilong Zhang · Yushuai Wu · Mingyue Zheng · Hao Zhou · Wei-Ying Ma

DUNIA: Pixel-Sized Embeddings via Cross-Modal Alignment for Earth Observation Applications

Ibrahim Fayad · Max Zimmer · Martin Schwartz · Fabian Gieseke · Philippe CIAIS · Gabriel Belouze · Sarah Brood · Aurélien de Truchis · Alexandre d'Aspremont

Learning Adversarial MDPs with Stochastic Hard Constraints

Francesco Emanuele Stradi · Matteo Castiglioni · Alberto Marchesi · Nicola Gatti

Scaling Laws in Patchification: An Image Is Worth 50,176 Tokens And More

Feng Wang · Yaodong Yu · Wei Shao · Yuyin Zhou · Alan Yuille · Cihang Xie

SPEX: Scaling Feature Interaction Explanations for LLMs

Justin S. Kang · Landon Butler · Abhineet Agarwal · Yigit Efe Erginbas · Ramtin Pedarsani · Bin Yu · Kannan Ramchandran

DS-VLM: Diffusion Supervision Vision Language Model

Zhen Sun · Yunhang Shen · Jie Li · Xing Sun · Pingyang Dai · Liujuan Cao · Rongrong Ji

Multi-Modal Object Re-identification via Sparse Mixture-of-Experts

Yingying Feng · Jie Li · Chi Xie · Lei Tan · Jiayi Ji

Guided Structural Inference: Leveraging Priors with Soft Gating Mechanisms

Aoran Wang · Xinnan Dai · Jun Pang

What Has a Foundation Model Found? Inductive Bias Reveals World Models

Keyon Vafa · Peter Chang · Ashesh Rambachan · Sendhil Mullainathan

Relating Misfit to Gain in Weak-to-Strong Generalization Beyond the Squared Loss

Abhijeet Mulgund · Chirag Pabbaraju

Enhancing Spectral GNNs: From Topology and Perturbation Perspectives

Taoyang Qin · Ke-Jia CHEN · Zheng Liu

Finding Wasserstein Ball Center: Efficient Algorithm and The Applications in Fairness

Yuntao Wang · Yuxuan Li · Qingyuan Yang · Hu Ding

Neural Interpretable PDEs: Harmonizing Fourier Insights with Attention for Scalable and Interpretable Physics Discovery

Ning Liu · Yue Yu

QEM-Bench: Benchmarking Learning-based Quantum Error Mitigation and QEMFormer as a Multi-ranged Context Learning Baseline

Tianyi Bao · Ruizhe Zhong · Xinyu Ye · Yehui Tang · Junchi Yan

Action-Minimization Meets Generative Modeling: Efficient Transition Path Sampling with the Onsager-Machlup Functional

Sanjeev Raja · Martin Šípka · Michael Psenka · Tobias Kreiman · Michal Pavelka · Aditi Krishnapriyan

Chaos Meets Attention: Transformers for Large-Scale Dynamical Prediction

Yi He · Yiming Yang · Xiaoyuan Cheng · Hai Wang · Xiao Xue · Boli Chen · Yukun Hu

Scalable Equilibrium Sampling with Sequential Boltzmann Generators

Charlie Tan · Joey Bose · Chen Lin · Leon Klein · Michael Bronstein · Alexander Tong

Symmetry-Driven Discovery of Dynamical Variables in Molecular Simulations

Jeet Mohapatra · Nima Dehmamy · Csaba Both · Subhro Das · Tommi Jaakkola

Learning the Electronic Hamiltonian of Large Atomic Structures

Chen Hao Xia · Manasa Kaniselvan · Alexandros Nikolaos Ziogas · Marko Mladenovic · Rayen Mahjoub · Alexander Maeder · Mathieu Luisier

Beyond Atoms: Enhancing Molecular Pretrained Representations with 3D Space Modeling

Shuqi Lu · Xiaohong Ji · Bohang Zhang · Lin Yao · Siyuan Liu · Zhifeng Gao · Linfeng Zhang · Guolin Ke

Broadband Ground Motion Synthesis by Diffusion Model with Minimal Condition

Jaeheun Jung · Jaehyuk Lee · ChangHae Jung · Hanyoung Kim · Bosung Jung · Donghun Lee

EcoMapper: Generative Modeling for Climate-Aware Satellite Imagery

Muhammed Göktepe · Amir Hossein Shamseddin · Erencan Uysal · Javier Monteagudo · Lukas Drees · Aysim Toker · Senthold Asseng · Malte von Bloh

Offline Model-based Optimization for Real-World Molecular Discovery

Dong-Hee Shin · Young-Han Son · Hyun Jung Lee · Deok-Joong Lee · Tae-Eui Kam

HEAP: Hyper Extended A-PDHG Operator for Constrained High-dim PDEs

Mingquan Feng · Weixin Liao · Yixin Huang · Yifan Fu · Qifu Zheng · Junchi Yan

QuanONet: Quantum Neural Operator with Application to Differential Equation

Ruocheng Wang · Zhuo Xia · Ge Yan · Junchi Yan

Enhancing Ligand Validity and Affinity in Structure-Based Drug Design with Multi-Reward Optimization

Seungbeom Lee · Munsun Jo · Jungseul Ok · Dongwoo Kim

From Thousands to Billions: 3D Visual Language Grounding via Render-Supervised Distillation from 2D VLMs

Ang Cao · Sergio Arnaud · Oleksandr Maksymets · Jianing Yang · Ayush Jain · Ada Martin · Vincent-Pierre Berges · Paul McVay · Ruslan Partsey · Aravind Rajeswaran · Franziska Meier · Justin Johnson · Jeong Joon Park · Alexander Sax

FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining

Dong Li · Yidi Liu · Xueyang Fu · Jie Huang · Senyan Xu · Qi Zhu · Zheng-Jun Zha

FlexiReID: Adaptive Mixture of Expert for Multi-Modal Person Re-Identification

Zhen Sun · Lei Tan · Yunhang Shen · Chengmao Cai · Xing Sun · Pingyang Dai · Liujuan Cao · Rongrong Ji

Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation

Fanqing Meng · Jiaqi Liao · Xinyu Tan · Quanfeng Lu · WENQI SHAO · Kaipeng Zhang · Yu Cheng · Dianqi Li · Ping Luo

Efficient Noise Calculation in Deep Learning-based MRI Reconstructions

Onat Dalmaz · Arjun Desai · Reinhard Heckel · Tolga Cukur · Akshay Chaudhari · Brian Hargreaves

Probing Visual Language Priors in VLMs

Tiange Luo · Ang Cao · Gunhee Lee · Justin Johnson · Honglak Lee

SECOND: Mitigating Perceptual Hallucination in Vision-Language Models via Selective and Contrastive Decoding

Woohyeon Park · Woojin Kim · Jaeik Kim · Jaeyoung Do

Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage

Saehyung Lee · Seunghyun Yoon · Trung Bui · Jing Shi · Sungroh Yoon

Beyond Entropy: Region Confidence Proxy for Wild Test-Time Adaptation

Zixuan Hu · Yichun Hu · Xiaotong Li · SHIXIANG TANG · LINGYU DUAN

Demystifying Catastrophic Forgetting in Two-Stage Incremental Object Detector

Qirui Wu · Shizhou Zhang · De Cheng · Yinghui Xing · di xu · Peng Wang · Yanning Zhang

Boosting Virtual Agent Learning and Reasoning: A Step-Wise, Multi-Dimensional, and Generalist Reward Model with Benchmark

Bingchen Miao · Yang Wu · Minghe Gao · Qifan Yu · Wendong Bu · Wenqiao Zhang · liyunfei · Siliang Tang · Tat-Seng Chua · Juncheng Li

Impossible Videos

Zechen Bai · Hai Ci · Mike Zheng Shou

FreeMesh: Boosting Mesh Generation with Coordinates Merging

Jian Liu · Haohan Weng · Biwen Lei · Xianghui Yang · Zibo Zhao · Zhuo Chen · Song Guo · Tao Han · Chunchao Guo

Temporal Misalignment in ANN-SNN Conversion and its Mitigation via Probabilistic Spiking Neurons

Velibor Bojkovic · Xiaofeng Wu · Bin Gu

Adaptive Multi-prompt Contrastive Network for Few-shot Out-of-distribution Detection

Xiang Fang · Arvind Easwaran · Blaise Genest

LOCATE 3D: Real-World Object Localization via Self-Supervised Learning in 3D

Paul McVay · Sergio Arnaud · Ada Martin · Arjun Majumdar · Krishna Murthy Jatavallabhula · Phillip Thomas · Ruslan Partsey · Daniel Dugas · Abha Gejji · Alexander Sax · Vincent-Pierre Berges · Mikael Henaff · Ayush Jain · Ang Cao · Ishita Prasad · Mrinal Kalakrishnan · Michael Rabbat · Nicolas Ballas · Mahmoud Assran · Oleksandr Maksymets · Aravind Rajeswaran · Franziska Meier

How Do Images Align and Complement LiDAR? Towards a Harmonized Multi-modal 3D Panoptic Segmentation

Yining Pan · Qiongjie Cui · Xulei Yang · Na Zhao

Geometric Feature Embedding for Effective 3D Few-Shot Class Incremental Learning

Xiangqi Li · Libo Huang · Zhulin An · Weilun Feng · Chuanguang Yang · Boyu Diao · Fei Wang · Yongjun Xu

3D-LMVIC: Learning-based Multi-View Image Compression with 3D Gaussian Geometric Priors

Yujun Huang · Bin Chen · Niu Lian · Xin Wang · Baoyi An · Tao Dai · Shutao Xia

Enhancing Foundation Models with Federated Domain Knowledge Infusion

Jiaqi Wang · Jingtao Li · Weiming Zhuang · Chen Chen · Lingjuan Lyu · Fenglong Ma

Capturing Temporal Dynamics in Large-Scale Canopy Tree Height Estimation

Jan Pauls · Max Zimmer · Berkant Turan · Sassan Saatchi · Philippe CIAIS · Sebastian Pokutta · Fabian Gieseke

Code-Generated Graph Representations Using Multiple LLM Agents for Material Properties Prediction

Jiao Huang · Qianli Xing · Jinglong Ji · Bo Yang

Context Matters: Query-aware Dynamic Long Sequence Modeling of Gigapixel Images

Zhengrui Guo · Qichen Sun · Jiabo MA · Lishuang Feng · Jinzhuo Wang · Hao Chen

Enforcing Latent Euclidean Geometry in Single-Cell VAEs for Manifold Interpolation

Alessandro Palma · Sergei Rybakov · Leon Hetzel · Stephan Günnemann · Fabian Theis

Beyond Sensor Data: Foundation Models of Behavioral Data from Wearables Improve Health Predictions

Eray Erturk · Fahad Kamran · Salar Abbaspourazad · Sean Jewell · Harsh Sharma · Yujie Li · Sinead Williamson · Nicholas Foti · Joseph Futoma

Position: Supervised Classifiers Answer the Wrong Questions for OOD Detection

Yucen Li · Daohan Lu · Polina Kirichenko · Shikai Qiu · Tim G. J. Rudner · C. Bayan Bruss · Andrew Wilson

AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling

Alexander Capstick · Rahul G. Krishnan · Payam Barnaghi

MedRAX: Medical Reasoning Agent for Chest X-ray

Adibvafa Fallahpour · Jun Ma · Alif Munim · Hongwei Lyu · BO WANG

Scalable Generation of Spatial Transcriptomics from Histology Images via Whole-Slide Flow Matching

Tinglin Huang · Tianyu Liu · Mehrtash Babadi · Wengong Jin · ZHITAO YING

MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization

Kangyu Zhu · Peng Xia · Yun Li · Hongtu Zhu · Sheng Wang · Huaxiu Yao

Active Learning for Efficient Discovery of Optimal Combinatorial Perturbations

Jason Qin · Hans-Hermann Wessels · Carlos Fernandez-Granda · Yuhan Hao

A Model of Place Field Reorganization During Reward Maximization

M Ganesh Kumar · Blake Bordelon · Jacob A Zavatone-Veth · Cengiz Pehlevan

Differential Coding for Training-Free ANN-to-SNN Conversion

Zihan Huang · Wei Fang · Tong Bu · Peng Xue · Zecheng Hao · Wenxuan Liu · Yuanhong Tang · Zhaofei Yu · Tiejun Huang

Generating Hypotheses of Dynamic Causal Graphs in Neuroscience: Leveraging Generative Factor Models of Observed Time Series

Zachary Brown · David Carlson

Flow-field inference from neural data using deep recurrent networks

Timothy Doyeon Kim · Thomas Luo · Tankut Can · Kamesh Krishnamurthy · Jonathan Pillow · Carlos Brody

NeuroTree: Hierarchical Functional Brain Pathway Decoding for Mental Health Disorders

Jun-En Ding · Dongsheng Luo · Chenwei Wu · Feng Liu

TTFSFormer: A TTFS-based Lossless Conversion of Spiking Transformer

Lusen Zhao · Zihan Huang · Ding Jianhao · Zhaofei Yu

Can Biologically Plausible Temporal Credit Assignment Rules Match BPTT for Neural Similarity? E-prop as an Example

Yuhan Helena Liu · Guangyu Robert Yang · Christopher Cueva

SE(3)-Equivariant Diffusion Policy in Spherical Fourier Space

Xupeng Zhu · Fan Wang · Robin Walters · Jane Shi

Three-Dimensional Trajectory Prediction with 3DMoTraj Dataset

Hao Zhou · Xu Yang · Mingyu Fan · Lu Qi · Xiangtai Li · Ming-Hsuan Yang · Fei Luo

WOMD-Reasoning: A Large-Scale Dataset for Interaction Reasoning in Driving

Yiheng Li · Cunxin Fan · Chongjian GE · Seth Zhao · Chenran Li · Chenfeng Xu · Huaxiu Yao · Masayoshi Tomizuka · Bolei Zhou · Chen Tang · Mingyu Ding · Wei Zhan

Hierarchical Planning for Complex Tasks with Knowledge Graph-RAG and Symbolic Verification

Flavio Petruzzellis · Cristina Cornelio · Pietro Lió

Latent Diffusion Planning for Imitation Learning

Amber Xie · Oleh Rybkin · Dorsa Sadigh · Chelsea Finn

ABNet: Adaptive explicit-Barrier Net for Safe and Scalable Robot Learning

Wei Xiao · Johnson Tsun-Hsuan Wang · Chuang Gan · Daniela Rus

SeedLoRA: A Fusion Approach to Efficient LLM Fine-Tuning

Yong Liu · Di Fu · Shenggan Cheng · Zirui Zhu · Yang Luo · Minhao Cheng · Cho-Jui Hsieh · Yang You

Subspace Optimization for Large Language Models with Convergence Guarantees

Yutong He · Pengrui Li · Yipeng Hu · Chuyan Chen · Kun Yuan

Alberta Wells Dataset: Pinpointing Oil and Gas Wells from Satellite Imagery

Pratinav Seth · Michelle Lin · BREFO YAW · Jade Boutot · Mary Kang · David Rolnick

HyperIV: Real-time Implied Volatility Smoothing

Yongxin Yang · Wenqi Chen · Chao Shu · Timothy Hospedales

Dataflow-Guided Neuro-Symbolic Language Models for Type Inference

gen li · Yao Wan · Hongyu Zhang · Zhou Zhao · Wenbin Jiang · Xuanhua Shi · Hai Jin · Zheng Wang

Voronoi-grid-based Pareto Front Learning and Its Application to Collaborative Federated Learning

Mengmeng Chen · Xiaohu Wu · QIQI LIU · Tiantian He · Yew Soon ONG · Yaochu Jin · Qicheng Lao · Han Yu

Machines and Mathematical Mutations: Using GNNs to Characterize Quiver Mutation Classes

Jesse He · Helen Jenne · Herman Chau · Davis Brown · Mark Raugas · Sara Billey · Henry Kvinge

Physics Aware Neural Networks for Unsupervised Binding Energy Prediction

Ke Liu · Hao Chen · Chunhua Shen

ETTA: Elucidating the Design Space of Text-to-Audio Models

Sang-gil Lee · Zhifeng Kong · ARUSHI GOEL · Sungwon Kim · Rafael Valle · Bryan Catanzaro

Learning Initial Basis Selection for Linear Programming via Duality-Inspired Tripartite Graph Representation and Comprehensive Supervision

Anqi Lu · Junchi Yan

AUTOCIRCUIT-RL: Reinforcement Learning-Driven LLM for Automated Circuit Topology Generation

Prashanth Vijayaraghavan · Luyao Shi · Ehsan Degan · Vandana Mukherjee · Xin Zhang

SK-VQA: Synthetic Knowledge Generation at Scale for Training Context-Augmented Multimodal LLMs

Xin Su · Man Luo · Kris Pan · Tien Pei Chou · Vasudev Lal · Phillip Howard

EditLord: Learning Code Transformation Rules for Code Editing

Weichen Li · Albert Jan · Baishakhi Ray · Junfeng Yang · Chengzhi Mao · Kexin Pei

Pairwise Maximum Likelihood For Multi-Class Logistic Regression Model With Multiple Rare Classes

Xuetong Li · Danyang Huang · Hansheng Wang

Optimal Auction Design in the Joint Advertising

Yang Li · Yuchao Ma · Qi Qi

TIMING: Temporality-Aware Integrated Gradients for Time Series Explanation

Hyeongwon Jang · Changhun Kim · Eunho Yang

Temporal Query Network for Efficient Multivariate Time Series Forecasting

Shengsheng Lin · Haojun Chen · Haijie Wu · Chunyun Qiu · Weiwei Lin

VerbalTS: Generating Time Series from Texts

Shuqi Gu · Chuyue Li · Baoyu Jing · Kan Ren

Breaking the Curse of Multiagency in Robust Multi-Agent Reinforcement Learning

Laixi Shi · Jingchu Gai · Eric Mazumdar · Yuejie Chi · Adam Wierman

LIVS: A Pluralistic Alignment Dataset for Inclusive Public Spaces

Rashid Mushkani · Perampalli Shravan Nayak · Hugo Berard · Allison Cohen · Shin Koseki · Hadrien Bertrand

AI for Global Climate Cooperation: Modeling Global Climate Negotiations, Agreements, and Long-Term Cooperation in RICE-N

Tianyu Zhang · Andrew Williams · Phillip Wozny · Kai-Hendrik Cohrs · Koen Ponse · Marco Jiralerspong · Soham Phade · Sunil Srinivasa · Lu Li · Yang Zhang · Prateek Gupta · Erman Acar · Irina Rish · Yoshua Bengio · Stephan Zheng

Sparse Autoencoders for Hypothesis Generation

Rajiv Movva · Kenny Peng · Nikhil Garg · Jon Kleinberg · Emma Pierson

Structured Preconditioners in Adaptive Optimization: A Unified Analysis

Shuo Xie · Tianhao Wang · Sashank J. Reddi · Sanjiv Kumar · Zhiyuan Li

Armijo Line-search Can Make (Stochastic) Gradient Descent Provably Faster

Sharan Vaswani · Reza Babanezhad

MERIT: Maximum-normalized Element-wise Ratio for Language Model Large-batch Training

Yang Luo · Zangwei Zheng · Ziheng Qin · Zirui Zhu · Yong Liu · Yang You

Tilted Sharpness-Aware Minimization

Tian Li · Tianyi Zhou · Jeff Bilmes

Enforcing Idempotency in Neural Networks

Nikolaj Jensen · Jamie Vicary

Nonlinearly Preconditioned Gradient Methods under Generalized Smoothness

Konstantinos Oikonomidis · Jan Quan · Emanuel Laude · Panagiotis Patrinos

Linear convergence of Sinkhorn's algorithm for generalized static Schrödinger bridge

Rahul Choudhary · Hanbaek Lyu

Provable and Practical Online Learning Rate Adaptation with Hypergradient Descent

Ya-Chi Chu · Wenzhi Gao · Yinyu Ye · Madeleine Udell

On Linear Convergence in Smooth Convex-Concave Bilinearly-Coupled Saddle-Point Optimization: Lower Bounds and Optimal Algorithms

Ekaterina Borodich · Alexander Gasnikov · Dmitry Kovalev

CaDA: Cross-Problem Routing Solver with Constraint-Aware Dual-Attention

Han Li · Fei Liu · Zhi Zheng · Yu Zhang · Zhenkun Wang

Discrete and Continuous Difference of Submodular Minimization

George Orfanides · Tim Hoheisel · Marwa El Halabi

Self-Supervised Transformers as Iterative Solution Improvers for Constraint Satisfaction

Yudong W Xu · Wenhao Li · Scott Sanner · Elias Khalil

GPTAQ: Efficient Finetuning-Free Quantization for Asymmetric Calibration

Yuhang Li · Ruokai Yin · Donghyun Lee · Shiting Xiao · Priyadarshini Panda

DSBRouter: End-to-end Global Routing via Diffusion Schr\"{o}dinger Bridge

Liangliang Shi · Shenhui Zhang · Xingbo Du · Nianzu Yang · Junchi Yan

Regularized Langevin Dynamics for Combinatorial Optimization

Shengyu Feng · Yiming Yang

EquivaMap: Leveraging LLMs for Automatic Equivalence Checking of Optimization Formulations

Haotian Zhai · Connor Lawless · Ellen Vitercik · Liu Leqi

Scalable First-order Method for Certifying Optimal k-Sparse GLMs

Jiachang Liu · Soroosh Shafiee · Andrea Lodi

FSL-SAGE: Accelerating Federated Split Learning via Smashed Activation Gradient Estimation

Srijith Nair · Michael Lin · Peizhong Ju · Amirreza Talebi · Elizabeth Bentley · Jia (Kevin) Liu

HALoS: Hierarchical Asynchronous Local SGD over Slow Networks for Geo-Distributed Large Language Model Training

Geon-Woo Kim · Junbo Li · Shashidhar Gandham · Omar Baldonado · Adithya Gangidi · Pavan Balaji · Zhangyang “Atlas” Wang · Aditya Akella

Achieving Linear Speedup and Near-Optimal Complexity for Decentralized Optimization over Row-stochastic Networks

Liyuan Liang · Xinyi Chen · Gan Luo · Kun Yuan

Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification

Eric Zhao · Pranjal Awasthi · Sreenivas Gollapudi

Efficiently Serving Large Multimodal Models Using EPD Disaggregation

Gursimran Singh · Xinglu Wang · Yifan Hu · Timothy Yu · Linzi Xing · Wei Jiang · Zhefeng Wang · Bai Xiaolong · Yi Li · Ying Xiong · Yong Zhang · Zhenan Fan

Behavior-Regularized Diffusion Policy Optimization for Offline Reinforcement Learning

Chen-Xiao Gao · Chenyang Wu · Mingjun Cao · Chenjun Xiao · Yang Yu · Zongzhang Zhang

Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL

Qin-Wen Luo · Ming-Kun Xie · Ye-Wen Wang · Sheng-Jun Huang

Stable Offline Value Function Learning with Bisimulation-based Representations

Brahma Pavse · Yudong Chen · Qiaomin Xie · Josiah Hanna

Decision Mixer: Integrating Long-term and Local Dependencies via Dynamic Token Selection for Decision-Making

Hongling Zheng · Li Shen · Yong Luo · Deheng Ye · Bo Du · Jialie SHEN · Dacheng Tao

Latent Action Learning Requires Supervision in the Presence of Distractors

Alexander Nikulin · Ilya Zisman · Denis Tarasov · Nikita Lyubaykin · Andrei Polubarov · Igor Kiselev · Vladislav Kurenkov

Accurate and Efficient World Modeling with Masked Latent Transformers

Maxime Burchi · Radu Timofte

Safety-Polarized and Prioritized Reinforcement Learning

Ke Fan · Jinpeng Zhang · Xuefeng Zhang · Yunze Wu · Jingyu Cao · Yuan Zhou · Jianzhu Ma

MENTOR: Mixture-of-Experts Network with Task-Oriented Perturbation for Visual Reinforcement Learning

Suning Huang · Zheyu Zhang · Tianhai Liang · Yihan Xu · Zhehao Kou · Chenhao Lu · Guowei Xu · Zhengrong Xue · Huazhe Xu

Continual Reinforcement Learning by Planning with Online World Models

Zichen Liu · Guoji Fu · Chao Du · Wee Sun Lee · Min Lin

Active Fine-Tuning of Multi-Task Policies

Marco Bagatella · Jonas Hübotter · Georg Martius · Andreas Krause

Gradient Boosting Reinforcement Learning

Benjamin Fuhrer · Chen Tessler · Gal Dalal

Robust Offline Reinforcement Learning with Linearly Structured $f$-Divergence Regularization

Cheng Tang · Zhishuai Liu · Pan Xu

When Maximum Entropy Misleads Policy Optimization

Ruipeng Zhang · Ya-Chien Chang · Sicun Gao

NBDI: A Simple and Effective Termination Condition for Skill Extraction from Task-Agnostic Demonstrations

Myunsoo Kim · Hayeong Lee · Seong-Woong Shim · JunHo Seo · Byung-Jun Lee

Inverse Optimization via Learning Feasible Regions

Ke Ren · Peyman Mohajerin Esfahani · Angelos Georghiou

Fast, Accurate Manifold Denoising by Tunneling Riemannian Optimization

Shiyu Wang · Mariam Avagyan · Yihan Shen · Arnaud Lamy · Tingran Wang · Szabolcs Marka · Zsuzsanna Marka · John Wright

Variance-Reduced Forward-Reflected-Backward Splitting Methods for Nonmonotone Generalized Equations

Quoc Tran-Dinh

Non-Asymptotic and Non-Lipschitzian Bounds on Optimal Values in Stochastic Optimization Under Heavy Tails

Jindong Tong · Hongcheng Liu · Johannes Royset

Stacey: Promoting Stochastic Steepest Descent via Accelerated $\ell_p$-Smooth Nonconvex Optimization

Xinyu Luo · Cedar Site Bai · Bolian Li · Petros Drineas · Ruqi Zhang · Brian Bullins

Quantum Optimization via Gradient-Based Hamiltonian Descent

Jiaqi Leng · Bin Shi

Contextual Optimization Under Model Misspecification: A Tractable and Generalizable Approach

Omar Bennouna · Jiawei Zhang · Saurabh Amin · Asuman Ozdaglar

Enhancing Parallelism in Decentralized Stochastic Convex Optimization

Ofri Eisen · Ron Dorfman · Kfir Levy

RobustZero: Enhancing MuZero Reinforcement Learning Robustness to State Perturbations

Yushuai Li · Hengyu Liu · Torben Pedersen · Yuqiang He · Kim Larsen · Lu Chen · Christian Jensen · Jiachen Xu · TIANYI LI

Knowledge Retention in Continual Model-Based Reinforcement Learning

Haotian Fu · Yixiang Sun · Michael L. Littman · George Konidaris

Mitigating Plasticity Loss in Continual Reinforcement Learning by Reducing Churn

Hongyao Tang · Johan Obando-Ceron · Pablo Samuel Castro · Aaron Courville · Glen Berseth

Value-Based Deep RL Scales Predictably

Oleh Rybkin · Michal Nauman · Preston Fu · Charlie Snell · Pieter Abbeel · Sergey Levine · Aviral Kumar

LipsNet++: Unifying Filter and Controller into a Policy Network

Xujie Song · Liangfa Chen · Tong Liu · Wenxuan Wang · Yinuo Wang · Shentao Qin · Yinsong Ma · Jingliang Duan · Shengbo Li

ARS: Adaptive Reward Scaling for Multi-Task Reinforcement Learning

MYUNG-SIK CHO · Jong Eui Park · Jeonghye Kim · Youngchul Sung

SOLD: Slot Object-Centric Latent Dynamics Models for Relational Manipulation Learning from Pixels

Malte Mosbach · Jan Ewertz · Angel Villar-Corrales · Sven Behnke

SENSEI: Semantic Exploration Guided by Foundation Models to Learn Versatile World Models

Cansu Sancaktar · Christian Gumbsch · Andrii Zadaianchuk · Pavel Kolev · Georg Martius

Return Capping: Sample Efficient CVaR Policy Gradient Optimisation

Harry Mead · Clarissa Costen · Bruno Lacerda · Nick Hawes

Imitation Learning from a Single Temporally Misaligned Video

William Huey · Yuki (Huaxiaoyue) Wang · Anne Wu · Yoav Artzi · Sanjiban Choudhury

Explicit Exploration for High-Welfare Equilibria in Game-Theoretic Multiagent Reinforcement Learning

Austin Nguyen · Anri Gu · Michael Wellman

Risk-Sensitive Theory of Mind: Coordinating with Agents of Unknown Bias using Cumulative Prospect Theory

Mason O. Smith · Wenlong Zhang

Finite-Sample Convergence Bounds for Trust Region Policy Optimization in Mean Field Games

Antonio Ocello · Daniil Tiapkin · Lorenzo Mancini · Mathieu Lauriere · Eric Moulines

Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration

Max Wilcoxson · Qiyang Li · Kevin Frans · Sergey Levine

Novelty Detection in Reinforcement Learning with World Models

Geigh Zollicoffer · Kenneth Eaton · Jonathan Balloch · Julia Kim · Wei Zhou · Robert Wright · Mark Riedl

Local Manifold Approximation and Projection for Manifold-Aware Diffusion Planning

Kyowoon Lee · Jaesik Choi

Monte Carlo Tree Diffusion for System 2 Planning

Jaesik Yoon · Hyeonseo Cho · Doojin Baek · Yoshua Bengio · Sungjin Ahn

Provable Policy Gradient for Robust Average-Reward MDPs Beyond Rectangularity

Qiuhao Wang · Yuqi Zha · Chin Pang Ho · Marek Petrik

Offline Opponent Modeling with Truncated Q-driven Instant Policy Refinement

Yuheng Jing · Kai Li · Bingyun Liu · Ziwen Zhang · Haobo Fu · Qiang Fu · Junliang Xing · Jian Cheng

Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton

Chengmei Niu · Zhenyu Liao · Zenan Ling · Michael Mahoney

Theoretical guarantees on the best-of-n alignment policy

Ahmad Beirami · Alekh Agarwal · Jonathan Berant · Alexander D'Amour · Jacob Eisenstein · Chirag Nagpal · Ananda Suresh

Convergence of Consistency Model with Multistep Sampling under General Data Assumptions

Yiding Chen · Yiyi Zhang · Owen Oertell · Wen Sun

Revisiting the Predictability of Performative, Social Events

Juan Perdomo

Fundamental limits of learning in sequence multi-index models and deep attention networks: high-dimensional asymptotics and sharp thresholds

Emanuele Troiani · Hugo Cui · Yatin Dandi · FLORENT KRZAKALA · Lenka Zdeborová

PDUDT: Provable Decentralized Unlearning under Dynamic Topologies

Jing Qiao · Yu Liu · Zengzhe Chen · Mingyi Li · YUAN YUAN · Xiao Zhang · Dongxiao Yu

Laplace Transform Based Low-Complexity Learning of Continuous Markov Semigroups

Vladimir Kostic · Karim Lounici · Hélène Halconruy · Timothée Devergne · Pietro Novelli · Massimiliano Pontil

Learning Parametric Distributions from Samples and Preferences

Marc Jourdan · Gizem Yüce · Nicolas Flammarion

PAC Learning with Improvements

Idan Attias · Avrim Blum · Keziah Naggita · Donya Saless · Dravyansh Sharma · Matthew Walter

Distributed Nonparametric Estimation: from Sparse to Dense Samples per Terminal

Deheng Yuan · Tao Guo · Zhongyi Huang

Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation

Juno Kim · Denny Wu · Jason Lee · Taiji Suzuki

An Entropy-Based Model for Hierarchical Learning

Amir R. Asadi

Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources

Renzhe Xu · Kang Wang · Bo Li

Provably Efficient Algorithm for Best Scoring Rule Identification in Online Principal-Agent Information Acquisition

Zichen Wang · Chuanhao Li · Huazheng Wang

Learning to Steer Learners in Games

Yizhou Zhang · Yian Ma · Eric Mazumdar

Maintaining Proportional Committees with Dynamic Candidate Sets

Chris Dong · Jannik Peters

Selective Response Strategies for GenAI

Boaz Taitler · Omer Ben-Porat

A Market for Accuracy: Classification Under Competition

Ohad Einav · Nir Rosenfeld

Collaborative Mean Estimation Among Heterogeneous Strategic Agents: Individual Rationality, Fairness, and Truthful Contribution

Alex Clinton · Yiding Chen · Jerry Zhu · Kirthevasan Kandasamy

Heterogeneous Label Shift: Theory and Algorithm

Chao Xu · Xijia Tang · Chenping Hou

Towards a Formal Theory of Representational Compositionality

Eric Elmoznino · Thomas Jiralerspong · Yoshua Bengio · Guillaume Lajoie

Test-Time Training Provably Improves Transformers as In-context Learners

Halil Alperen Gozeten · Muhammed Emrullah Ildiz · Xuechen Zhang · Mahdi Soltanolkotabi · Marco Mondelli · Samet Oymak

Can Diffusion Models Learn Hidden Inter-Feature Rules Behind Images?

Yujin Han · Andi Han · Wei Huang · Chaochao Lu · Difan Zou

Can Transformers Reason Logically? A Study in SAT Solving

Leyan Pan · Vijay Ganesh · Jacob Abernethy · Chris Esposo · Wenke Lee

Probabilistic Factorial Experimental Design for Combinatorial Interventions

Divya Shyamal · Jiaqi Zhang · Caroline Uhler

Nonconvex Theory of $M$-estimators with Decomposable Regularizers

Weiwei Liu

Improved Learning via k-DTW: A Novel Dissimilarity Measure for Curves

Amer Krivosija · Alexander Munteanu · André Nusser · Chris Schwiegelshohn

Training Dynamics of In-Context Learning in Linear Attention

Yedi Zhang · Aaditya Singh · Peter Latham · Andrew Saxe

Certifiably Robust Model Evaluation in Federated Learning under Meta-Distributional Shifts

Amir Najafi · Samin Mahdizadeh Sani · Farzan Farnia

Unified Analysis of Continuous Weak Features Learning with Applications to Learning from Missing Data

Kosuke Sugiyama · Masato Uchida

A Generalization Theory for Zero-Shot Prediction

Ronak Mehta · Zaid Harchaoui

Limitations of measure-first protocols in quantum machine learning

Casper Gyurik · Riccardo Molteni · Vedran Dunjko

Dimension-Independent Rates for Structured Neural Density Estimation

Vandermeulen · Wai Ming Tai · Bryon Aragam

The Power of Random Features and the Limits of Distribution-Free Gradient Descent

Ari Karchmer · Eran Malach

ATA: Adaptive Task Allocation for Efficient Resource Management in Distributed Machine Learning

Artavazd Maranjyan · El Mehdi Saad · Peter Richtarik · Francesco Orabona

Learning to Incentivize in Repeated Principal-Agent Problems with Adversarial Agent Arrivals

Junyan Liu · ARNAB MAITI · Artin Tajdini · Kevin Jamieson · Lillian Ratliff

Beyond Minimax Rates in Group Distributionally Robust Optimization via a Novel Notion of Sparsity

Quan Nguyen · Nishant Mehta · Cristóbal Guzmán

Fixing the Loose Brake: Exponential-Tailed Stopping Time in Best Arm Identification

Kapilan Balagopalan · Tuan Nguyen · Yao Zhao · Kwang-Sung Jun

Zero-Inflated Bandits

Haoyu Wei · Runzhe Wan · Lei Shi · Rui Song

Avoiding Catastrophe in Online Learning by Asking for Help

Benjamin Plaut · Hanlin Zhu · Stuart Russell

Implicit Riemannian Optimism with Applications to Min-Max Problems

Christophe Roux · David Martinez-Rubio · Sebastian Pokutta

Online Learning with Unknown Constraints

Karthik Sridharan · Seung Won Wilson Yoo

Unlocking the Power of Rehearsal in Continual Learning: A Theoretical Perspective

Junze Deng · Qinhang Wu · Peizhong Ju · Sen Lin · Yingbin LIANG · Ness Shroff

A Near Linear Query Lower Bound for Submodular Maximization

Binghui Peng · Aviad Rubinstein

Exploiting Similarity for Computation and Communication-Efficient Decentralized Optimization

Yuki Takezawa · Xiaowen Jiang · Anton Rodomanov · Sebastian Stich

Faster Stochastic Optimization with Arbitrary Delays via Adaptive Asynchronous Mini-Batching

Amit Attia · Ofir Gaash · Tomer Koren

General framework for online-to-nonconvex conversion: Schedule-free SGD is also effective for nonconvex optimization

Kwangjun Ahn · Gagik Magakyan · Ashok Cutkosky

Go to Event Page

Poster

Poster Session 3 East

11:00 AM - 1:30 PM

358 Events in this session

Extractive Structures Learned in Pretraining Enable Generalization on Finetuned Facts

Jiahai Feng · Stuart Russell · Jacob Steinhardt

Internal Causal Mechanisms Robustly Predict Language Model Out-of-Distribution Behaviors

Jing Huang · Junyi Tao · Thomas Icard · Diyi Yang · Christopher Potts

Confidential Guardian: Cryptographically Prohibiting the Abuse of Model Abstention

Stephan Rabanser · Ali Shahin Shamsabadi · Olive Franzese · Xiao Wang · Adrian Weller · Nicolas Papernot

Pointwise Information Measures as Confidence Estimators in Deep Neural Networks: A Comparative Study

Shelvia Wongso · Rohan Ghosh · Mehul Motani

Leveraging Predictive Equivalence in Decision Trees

Hayden McTavish · Zachery Boner · Jon Donnelly · Margo Seltzer · Cynthia Rudin

From Black Boxes to Transparent Minds: Evaluating and Enhancing the Theory of Mind in Multimodal Large Language Models

Xinyang Li · Siqi Liu · Bochao Zou · Jiansheng Chen · Huimin Ma

The Elicitation Game: Evaluating Capability Elicitation Techniques

Felix Hofstätter · Teun van der Weij · Jayden Teoh · Rada Djoneva · Henning Bartsch · Francis Rhys Ward

Safety Alignment Can Be Not Superficial With Explicit Safety Signals

Jianwei Li · Jung-Eun Kim

Policy Design for Two-sided Platforms with Participation Dynamics

Haruka Kiyohara · Fan Yao · Sarah Dean

Fair Clustering via Alignment

Kunwoong Kim · Jihu Lee · Sangchul Park · Yongdai Kim

Concept-Based Unsupervised Domain Adaptation

Xinyue Xu · Yueying Hu · Hui Tang · Yi Qin · Lu Mi · Hao Wang · Xiaomeng Li

On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents

Jen-Tse Huang · Jiaxu Zhou · Tailin Jin · Xuhui Zhou · Zixi Chen · Wenxuan Wang · Youliang Yuan · Michael Lyu · Maarten Sap

Correlated Errors in Large Language Models

Elliot Myunghoon Kim · Avi Garg · Kenny Peng · Nikhil Garg

STAMP Your Content: Proving Dataset Membership via Watermarked Rephrasings

Saksham Rastogi · Pratyush Maini · Danish Pruthi

Variational Learning of Fractional Posteriors

Kian Ming Chai · Edwin V. Bonilla

Censor Dependent Variational Inference

Chuanhui Liu · Xiao Wang

Identification of Latent Confounders via Investigating the Tensor Ranks of the Nonlinear Observations

Zhengming Chen · Yewei Xia · Feng Xie · Jie Qiao · Zhifeng Hao · Ruichu Cai · Kun Zhang

Efficiently Vectorized MCMC on Modern Accelerators

Hugh Dance · Pierre Glaser · Peter Orbanz · Ryan P. Adams

NETS: A Non-equilibrium Transport Sampler

Michael Albergo · Eric Vanden-Eijnden

Progressive Tempering Sampler with Diffusion

Severi Rissanen · RuiKang OuYang · Jiajun He · Wenlin Chen · Markus Heinonen · Arno Solin · Jose Miguel Hernandez-Lobato

The Noisy Laplacian: a Threshold Phenomenon for Non-Linear Dimension Reduction

Alex Kokot · Octavian-Vlad Murad · Marina Meila

Demeaned Sparse: Efficient Anomaly Detection by Residual Estimate

Yifan Fang · Yifei Fang · Ruizhe Chen · Haote Xu · Xinghao Ding · Yue Huang

Interaction-Aware Gaussian Weighting for Clustered Federated Learning

Alessandro Licciardi · Davide Leo · Eros Fanì · Barbara Caputo · Marco Ciccone

Robust Conformal Outlier Detection under Contaminated Reference Data

Meshi Bashari · Matteo Sesia · Yaniv Romano

Adjusting Model Size in Continual Gaussian Processes: How Big is Big Enough?

Guiomar Pescador-Barrios · Sarah Filippi · Mark van der Wilk

Can Transformers Learn Full Bayesian Inference in Context?

Arik Reuter · Tim G. J. Rudner · Vincent Fortuin · David Rügamer

FAB-PPI: Frequentist, Assisted by Bayes, Prediction-Powered Inference

Stefano Cortinovis · Francois Caron

Linearization Turns Neural Operators into Function-Valued Gaussian Processes

Emilia Magnani · Marvin Pförtner · Tobias Weber · Philipp Hennig

Polynomial-Delay MAG Listing with Novel Locally Complete Orientation Rules

Tian-Zuo Wang · Wen-Bo Du · Zhi-Hua Zhou

Non-asymptotic Error Bounds in $\mathcal{W}_2$-Distance with Sqrt(d) Dimension Dependence and First Order Convergence for Langevin Monte Carlo beyond Log-Concavity

Bin Yang · Xiaojie Wang

CACTI: Leveraging Copy Masking and Contextual Information to Improve Tabular Data Imputation

Aditya Gorla · Ryan Wang · Zhengtong Liu · Ulzee An · Sriram Sankararaman

Towards Understanding Parametric Generalized Category Discovery on Graphs

Bowen Deng · Lele Fu · Jialong Chen · Sheng Huang · Tianchi Liao · Zhang Tao · Chuan Chen

Diversified Flow Matching with Translation Identifiability

Sagar Shrestha · Xiao Fu

Self-Discriminative Modeling for Anomalous Graph Detection

Jinyu Cai · Yunhe Zhang · Jicong Fan

Rethinking Confidence Scores and Thresholds in Pseudolabeling-based SSL

Harit Vishwakarma · Yi Chen · Satya Sai Srinath Namburi GNVV · Sui Jiet Tay · Ramya Vinayak · Frederic Sala

Point-Level Topological Representation Learning on Point Clouds

Vincent P. Grande · Michael Schaub

A Selective Learning Method for Temporal Graph Continual Learning

Hanmo Liu · Shimin Di · Haoyang LI · Xun Jian · Yue Wang · Lei Chen

Positive-unlabeled AUC Maximization under Covariate Shift

Atsutoshi Kumagai · Tomoharu Iwata · Hiroshi Takahashi · Taishi Nishiyama · Kazuki Adachi · Yasuhiro Fujiwara

No Task Left Behind: Isotropic Model Merging with Common and Task-Specific Subspaces

Daniel Marczak · Simone Magistri · Sebastian Cygert · Bartłomiej Twardowski · Andrew Bagdanov · Joost van de Weijer

Proxy-FDA: Proxy-based Feature Distribution Alignment for Fine-tuning Vision Foundation Models without Forgetting

Chen Huang · Skyler Seto · Hadi Pouransari · Mehrdad Farajtabar · Raviteja Vemulapalli · Fartash Faghri · Oncel Tuzel · Barry-John Theobald · Joshua M Susskind

Interchangeable Token Embeddings for Extendable Vocabulary and Alpha-Equivalence

İlker Işık · Ramazan Gokberk Cinbis · Ebru Gol

EnsLoss: Stochastic Calibrated Loss Ensembles for Preventing Overfitting in Classification

Ben Dai

Understanding the Unfairness in Network Quantization

Bing Liu · wenjun Miao · Boyu Zhang · Qiankun Zhang · Bin Yuan · Wang · Shenghao Liu · Xianjun Deng

Enhancing Logits Distillation with Plug&Play Kendall's $\tau$ Ranking Loss

Yuchen Guan · Runxi Cheng · Kang Liu · Chun Yuan

Principled Algorithms for Optimizing Generalized Metrics in Binary Classification

Anqi Mao · Mehryar Mohri · Yutao Zhong

Generative Modeling Reinvents Supervised Learning: Label Repurposing with Predictive Consistency Learning

Yang Li · Jiale Ma · Yebin Yang · Qitian Wu · Hongyuan Zha · Junchi Yan

Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty

Yeseul Cho · Baekrok Shin · Changmin Kang · Chulhee Yun

CAT Merging: A Training-Free Approach for Resolving Conflicts in Model Merging

Wenju Sun · Qingyong Li · Yangliao Geng · Boyang Li

Test-time Adaptation on Graphs via Adaptive Subgraph-based Selection and Regularized Prototypes

Ming Zhang · Qixin Zhang · Xiao Luo · Junyu Luo · Wei Ju · Zhiping Xiao · Ming Zhang

Low-Rank Tensor Transitions (LoRT) for Transferable Tensor Regression

Andong Wang · Yuning Qiu · Zhong Jin · Guoxu Zhou · Qibin Zhao

Dual Feature Reduction for the Sparse-group Lasso and its Adaptive Variant

Fabio Feser · Marina Evangelou

Computing Optimal Transport Maps and Wasserstein Barycenters Using Conditional Normalizing Flows

Gabriele Visentin · Patrick Cheridito

Near-optimal Sketchy Natural Gradients for Physics-Informed Neural Networks

Maricela Best Mckay · Avleen Kaur · Chen Greif · Brian Wetton

ELMO : Efficiency via Low-precision and Peak Memory Optimization in Large Output Spaces

Jinbin Zhang · Nasib Ullah · Erik Schultheis · Rohit Babbar

Permutation-Free High-Order Interaction Tests

Zhaolu Liu · Robert Peach · Mauricio Barahona

Spherical Rotation Dimension Reduction with Geometric Loss Functions

Hengrui Luo · Jeremy E. Purvis · Didong Li

Emergence in non-neural models: grokking modular arithmetic via average gradient outer product

Neil Mallinar · Daniel Beaglehole · Libin Zhu · Adityanarayanan Radhakrishnan · Parthe Pandit · Misha Belkin

Towards the Causal Complete Cause of Multi-Modal Representation Learning

Jingyao Wang · Siyu Zhao · Wenwen Qiang · Jiangmeng Li · Changwen Zheng · Fuchun Sun · Hui Xiong

SHE: Streaming-media Hashing Retrieval

Ruitao Pu · Yang Qin · Xiaomin Song · Dezhong Peng · Zhenwen Ren · Yuan Sun

Does Data Scaling Lead to Visual Compositional Generalization?

Arnas Uselis · Andrea Dittadi · Seong Joon Oh

Active Learning with Selective Time-Step Acquisition for PDEs

Yegon Kim · Hyunsu Kim · Gyeonghoon Ko · Juho Lee

FisherSFT: Data-Efficient Supervised Fine-Tuning of Language Models Using Information Gain

Rohan Deb · Kiran Thekumparampil · Kousha Kalantari · Gaurush Hiranandani · Shoham Sabach · Branislav Kveton

The Relationship Between No-Regret Learning and Online Conformal Prediction

Ramya Ramalingam · Shayan Kiyani · Aaron Roth

SEAD: Unsupervised Ensemble of Streaming Anomaly Detectors

Saumya Gaurang Shah · Abishek Sankararaman · Balakrishnan Narayanaswamy · Vikramank Singh

Learning Vision and Language Concepts for Controllable Image Generation

Shaoan Xie · Lingjing Kong · Yujia Zheng · Zeyu Tang · Eric Xing · Guangyi Chen · Kun Zhang

Revisiting Neural Networks for Few-Shot Learning: A Zero-Cost NAS Perspective

Haidong Kang

Sanity Checking Causal Representation Learning on a Simple Real-World System

Juan L. Gamella · Simon Bing · Jakob Runge

Deep Fuzzy Multi-view Learning for Reliable Classification

Siyuan Duan · Yuan Sun · Dezhong Peng · Guiduo Duan · Xi Peng · Peng Hu

DANCE: Dual Unbiased Expansion with Group-acquired Alignment for Out-of-distribution Graph Fairness Learning

Yifan Wang · Hourun Li · Ling Yue · Zhiping Xiao · Jia Yang · Changling Zhou · Wei Ju · Ming Zhang · Xiao Luo

PlaySlot: Learning Inverse Latent Dynamics for Controllable Object-Centric Video Prediction and Planning

Angel Villar-Corrales · Sven Behnke

Tensor Decomposition Based Memory-Efficient Incremental Learning

Yuhang Li · Guoxu Zhou · Zhenhao Huang · Xinqi Chen · Yuning Qiu · Qibin Zhao

Adaptive Data Collection for Robust Learning Across Multiple Distributions

Chengbo Zang · Mehmet Turkcan · Gil Zussman · Zoran Kostic · Javad Ghaderi

Unconstrained Robust Online Convex Optimization

Jiujia Zhang · Ashok Cutkosky

QUTE: Quantifying Uncertainty in TinyML models with Early-exit-assisted ensembles for model-monitoring

Nikhil Pratap Ghanathe · Steve Wilton

Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity

Alessandro Pierro · Steven Abreu · Jonathan Timcheck · Philipp Stratmann · Andreas Wild · Sumit Shrestha

Compute or Load KV Cache? Why Not Both?

Shuowei Jin · Xueshen Liu · Qingzhao Zhang · Zhuoqing Morley Mao

KoopSTD: Reliable Similarity Analysis between Dynamical Systems via Approximating Koopman Spectrum with Timescale Decoupling

Shimin Zhang · Ziyuan Ye · Yinsong Yan · Zeyang Song · Yujie Wu · Jibin Wu

RAGGED: Towards Informed Design of Scalable and Stable RAG Systems

Jennifer Hsia · Afreen Shaikh · Zhiruo Wang · Graham Neubig

Prompt-to-Leaderboard: Prompt-Adaptive LLM Evaluations

Evan Frick · Connor Chen · Joseph Tennyson · Tianle Li · Wei-Lin Chiang · Anastasios Angelopoulos · Ion Stoica

am-ELO: A Stable Framework for Arena-based LLM Evaluation

Zirui Liu · Jiatong Li · Yan Zhuang · Qi Liu · Shuanghong Shen · Jie Ouyang · Mingyue Cheng · Shijin Wang

Tightening Causal Bounds via Covariate-Aware Optimal Transport

Sirui Lin · Zijun Gao · Jose Blanchet · Peter Glynn

Integer Programming for Generalized Causal Bootstrap Designs

Jennifer Brennan · Sébastien Lahaie · Adel Javanmard · Nick Doudchenko · Jean Pouget-Abadie

Automatic Reward Shaping from Confounded Offline Data

Mingxuan Li · Junzhe Zhang · Elias Bareinboim

Identifying Causal Direction via Variational Bayesian Compression

Quang-Duy Tran · Bao Duong · Phuoc Nguyen · Thin Nguyen

Doubly Robust Fusion of Many Treatments for Policy Learning

Ke Zhu · Jianing Chu · Ilya Lipkovich · Wenyu Ye · Shu Yang

From Logits to Hierarchies: Hierarchical Clustering made Simple

Emanuele Palumbo · Moritz Vandenhirtz · Alain Ryser · Imant Daunhawer · Julia Vogt

MCU: An Evaluation Framework for Open-Ended Game Agents

Xinyue Zheng · Haowei Lin · Kaichen He · Zihao Wang · Qiang Fu · Haobo Fu · Zilong Zheng · Yitao Liang

From Jack of All Trades to Master of One: Specializing LLM-based Autoraters to a Test Set

Mara Finkelstein · Daniel Deutsch · Parker Riley · Juraj Juraska · Geza Kovacs · Markus Freitag

David and Goliath: Small One-step Model Beats Large Diffusion with Score Post-training

Weijian Luo · colin zhang · Debing Zhang · Zhengyang Geng

AutoEval Done Right: Using Synthetic Data for Model Evaluation

Pierre Boyeau · Anastasios Angelopoulos · Tianle Li · Nir Yosef · Jitendra Malik · Michael Jordan

RE-IMAGINE: Symbolic Benchmark Synthesis for Reasoning Evaluation

Xinnuo Xu · Rachel Lawrence · Kshitij Dubey · Atharva Pandey · Risa Ueno · Fabian Falck · Aditya Nori · Rahul Sharma · Amit Sharma · Javier Gonzalez

Bridging Fairness and Efficiency in Conformal Inference: A Surrogate-Assisted Group-Clustered Approach

Chenyin Gao · Peter Gilbert · Larry Han

Overestimation in LLM Evaluation: A Controlled Large-Scale Study on Data Contamination’s Impact on Machine Translation

Muhammed Yusuf Kocyigit · Eleftheria Briakou · Daniel Deutsch · Jiaming Luo · Colin Cherry · Markus Freitag

Permutation-based Rank Test in the Presence of Discretization and Application in Causal Discovery with Mixed Data

Xinshuai Dong · Ignavier Ng · Boyang Sun · Haoyue Dai · Guangyuan Hao · Shunxing Fan · Peter Spirtes · Yumou Qiu · Kun Zhang

Double Machine Learning for Causal Inference under Shared-State Interference

Chris Hays · Manish Raghavan

Stronger Neyman Regret Guarantees for Adaptive Experimental Design

Georgy Noarov · Riccardo Fogliato · Martin A Bertran · Aaron Roth

On Efficient Estimation of Distributional Treatment Effects under Covariate-Adaptive Randomization

Undral Byambadalai · Tomu Hirata · Tatsushi Oka · Shota Yasui

An Improved Clique-Picking Algorithm for Counting Markov Equivalent DAGs via Super Cliques Transfer

Lifu Liu · Shiyuan He · Jianhua Guo

Multi-Objective Causal Bayesian Optimization

Shriya Bhatija · Paul-David Zuercher · Jakob Thumm · Thomas Bohné

MetricEmbedding: Accelerate Metric Nearness by Tropical Inner Product

Muyang Cao · Jiajun Yu · Xin Du · Gang Pan · Wei Wang

Best Subset Selection: Optimal Pursuit for Feature Selection and Elimination

Zhihan Zhu · Yanhao Zhang · Yong Xia

Direct Prediction Set Minimization via Bilevel Conformal Classifier Training

Yuanjie Shi · Hooman Shahrokhi · Xuesong Jia · Xiongzhi Chen · Jana Doppa · Yan Yan

COExpander: Adaptive Solution Expansion for Combinatorial Optimization

Jiale Ma · Wenzheng Pan · Yang Li · Junchi Yan

Distributional Diffusion Models with Scoring Rules

Valentin De Bortoli · Alexandre Galashov · J Swaroop Guntupalli · Guangyao Zhou · Kevin Murphy · Arthur Gretton · Arnaud Doucet

One-Step Generalization Ratio Guided Optimization for Domain Generalization

Sumin Cho · Dongwon Kim · Kwangsu Kim

Foundation Model Insights and a Multi-Model Approach for Superior Fine-Grained One-shot Subset Selection

Zhijing Wan · Zhixiang Wang · Zheng Wang · Xin Xu · Shin'ichi Satoh

Learning In-context $n$-grams with Transformers: Sub-$n$-grams Are Near-Stationary Points

Aditya Vardhan Varre · Gizem Yüce · Nicolas Flammarion

Hide & Seek: Transformer Symmetries Obscure Sharpness & Riemannian Geometry Finds It

Marvin F, da Silva · Felix Dangel · Sageev Oore

A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models

Shivam Kumar · Yun Yang · Lizhen Lin

On the Impact of Hard Adversarial Instances on Overfitting in Adversarial Training

Chen Liu · Zhichao Huang · Mathieu Salzmann · Tong Zhang · Sabine Süsstrunk

Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models

Anshuman Chhabra · Bo Li · Jian Chen · Prasant Mohapatra · Hongfu Liu

Function-Space Learning Rates

Edward Milsom · Ben Anson · Laurence Aitchison

Towards Memorization Estimation: Fast, Formal and Free

Deepak Ravikumar · Efstathia Soufleri · Abolfazl Hashemi · Kaushik Roy

Lego Sketch: A Scalable Memory-augmented Neural Network for Sketching Data Streams

Yuan Feng · Yukun Cao · Hairu Wang · Xike Xie · S Kevin Zhou

Knowledge Swapping via Learning and Unlearning

Mingyu Xing · Lechao Cheng · Shengeng Tang · Yaxiong Wang · Zhun Zhong · Meng Wang

On the Power of Learning-Augmented Search Trees

Jingbang Chen · Xinyuan Cao · Alicia Stepin · Li Chen

Efficient Heterogeneity-Aware Federated Active Data Selection

Yingpeng Tang · Chao Ren · Xiaoli Tang · Sheng-Jun Huang · Lizhen Cui · Han Yu

Optimal transport-based conformal prediction

Gauthier Thurin · Kimia Nadjahi · Claire Boyer

Multi-Session Budget Optimization for Forward Auction-based Federated Learning

Xiaoli Tang · Han Yu · Zengxiang Li · Xiaoxiao Li

BCE vs. CE in Deep Feature Learning

Qiufu Li · Huibin Xiao · Linlin Shen

Compositional Risk Minimization

Divyat Mahajan · Mohammad Pezeshki · Charles Arnal · Ioannis Mitliagkas · Kartik Ahuja · Pascal Vincent

On the Provable Separation of Scales in Maximal Update Parameterization

Letong Hong · Zhangyang “Atlas” Wang

Modular Duality in Deep Learning

Jeremy Bernstein · Laker Newhouse

On the Clean Generalization and Robust Overfitting in Adversarial Training from Two Theoretical Views: Representation Complexity and Training Dynamics

Binghui Li · Yuanzhi Li

TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation

Jaeho Kim · Seulki Lee

Understanding and Improving Length Generalization in Recurrent Models

Ricardo Buitrago Ruiz · Albert Gu

LETS Forecast: Learning Embedology for Time Series Forecasting

Abrar Majeedi · Viswanatha Reddy Gajjala · Satya Sai Srinath Namburi GNVV · Nada Elkordi · Yin Li

LAST SToP for Modeling Asynchronous Time Series

Shubham Gupta · Thibaut Durand · Graham Taylor · Lilian Bialokozowicz

LangTime: A Language-Guided Unified Model for Time Series Forecasting with Proximal Policy Optimization

Wenzhe Niu · Zongxia Xie · Yanru Sun · Wei He · Man Xu · Chao Hao

LightGTS: A Lightweight General Time Series Forecasting Model

Yihang Wang · Yuying Qiu · Peng Chen · Yang Shu · Zhongwen Rao · Lujia Pan · Bin Yang · Chenjuan Guo

No Soundness in the Real World: On the Challenges of the Verification of Deployed Neural Networks

Attila Szász · Balázs Bánhelyi · Mark Jelasity

Pixel2Feature Attack (P2FA): Rethinking the Perturbed Space to Enhance Adversarial Transferability

Renpu Liu · Hao Wu · Jiawei Zhang · Xin Cheng · Xiangyang Luo · Bin Ma · Jinwei Wang

Backdoor Attacks in Token Selection of Attention Mechanism

Yunjuan Wang · Raman Arora

ERICT: Enhancing Robustness by Identifying Concept Tokens in Zero-Shot Vision Language Models

Xinpeng Dong · Min Zhang · Didi Zhu · Ye Jian · zhang keli · Aimin Zhou · Fei Wu · Kun Kuang

LEVIS: Large Exact Verifiable Input Spaces for Neural Networks

Mohamad Chehade · Wenting Li · Brian Bell · Russell Bent · Saif Kazi · Hao Zhu

Learning State-Based Node Representations from a Class Hierarchy for Fine-Grained Open-Set Detection

Spandan Pyakurel · Qi Yu

IT$^3$: Idempotent Test-Time Training

Nikita Durasov · Assaf Shocher · Doruk Oner · Gal Chechik · Alexei Efros · EPFL Pascal Fua

Sample-specific Noise Injection for Diffusion-based Adversarial Purification

Yuhao Sun · Jiacheng Zhang · Zesheng Ye · Chaowei Xiao · Feng Liu

SDP-CROWN: Efficient Bound Propagation for Neural Network Verification with Tightness of Semidefinite Programming

Hong-Ming Chiu · Hao Chen · Huan Zhang · Richard Zhang

One Leaf Reveals the Season: Occlusion-Based Contrastive Learning with Semantic-Aware Views for Efficient Visual Representation

Xiaoyu Yang · Lijian Xu · Hongsheng Li · Shaoting Zhang

GraphCL: Graph-based Clustering for Semi-Supervised Medical Image Segmentation

Mengzhu Wang · houcheng su · Jiao Li · Chuan Li · Nan Yin · Li Shen · Jingcai Guo

ExPLoRA: Parameter-Efficient Extended Pre-Training to Adapt Vision Transformers under Domain Shifts

Samar Khanna · Medhanie Irgau · David Lobell · Stefano Ermon

Training High Performance Spiking Neural Network by Temporal Model Calibration

Jiaqi Yan · Changping Wang · De Ma · Huajin Tang · Qian Zheng · Gang Pan

ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks

Zhiyao Ren · Siyuan Liang · Aishan Liu · Dacheng Tao

NeuronTune: Towards Self-Guided Spurious Bias Mitigation

Guangtao Zheng · Wenqian Ye · Aidong Zhang

CoPINN: Cognitive Physics-Informed Neural Networks

Siyuan Duan · Wenyuan Wu · Peng Hu · Zhenwen Ren · Dezhong Peng · Yuan Sun

Approximating Latent Manifolds in Neural Networks via Vanishing Ideals

Nico Pelleriti · Max Zimmer · Elias Wirth · Sebastian Pokutta

GTR: A General, Multi-View, and Dynamic Framework for Trajectory Representation Learning

Xiangheng Wang · Ziquan Fang · Chenglong Huang · Danlei Hu · Lu Chen · Yunjun Gao

A Chaotic Dynamics Framework Inspired by Dorsal Stream for Event Signal Processing

yu chen · Jing Lian · Zhaofei Yu · Jizhao Liu · Jisheng Dang · Gang Wang

MoEQuant: Enhancing Quantization for Mixture-of-Experts Large Language Models via Expert-Balanced Sampling and Affinity Guidance

Zhixuan Chen · Xing Hu · Dawei Yang · Zukang Xu · XUCHEN · Zhihang Yuan · Sifan Zhou · JiangyongYu

DLP: Dynamic Layerwise Pruning in Large Language Models

Yuli Chen · Bo Cheng · Jiale Han · Yingying Zhang · Yingting Li · Shuhao Zhang

Liger: Linearizing Large Language Models to Gated Recurrent Structures

Disen Lan · Weigao Sun · Jiaxi Hu · Jusen Du · Yu Cheng

Discriminative Finetuning of Generative Large Language Models without Reward Models and Human Preference Data

Siqi Guo · Ilgee Hong · Vicente Balmaseda · Changlong Yu · Liang Qiu · Xin Liu · Haoming Jiang · Tuo Zhao · Tianbao Yang

Distillation Scaling Laws

Dan Busbridge · Amitis Shidani · Floris Weers · Jason Ramapuram · Etai Littwin · Russell Webb

GuardAgent: Safeguard LLM Agents via Knowledge-Enabled Reasoning

Zhen Xiang · Linzhi Zheng · Yanjie Li · Junyuan Hong · Qinbin Li · Han Xie · Jiawei Zhang · Zidi Xiong · Chulin Xie · Carl Yang · Dawn Song · Bo Li

NICE Data Selection for Instruction Tuning in LLMs with Non-differentiable Evaluation Metric

Jingtan Wang · Xiaoqiang Lin · Rui Qiao · Pang Wei Koh · Chuan-Sheng Foo · Bryan Kian Hsiang Low

Emergent Response Planning in LLMs

Zhichen Dong · Zhanhui Zhou · Zhixuan Liu · Chao Yang · Chaochao Lu

Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning

Zhenni Bi · Kai Han · Chuanjian Liu · Yehui Tang · Yunhe Wang

Reward-Guided Speculative Decoding for Efficient LLM Reasoning

Baohao Liao · Yuhui Xu · Hanze Dong · Junnan Li · Christof Monz · Silvio Savarese · Doyen Sahoo · Caiming Xiong

A Unified Approach to Routing and Cascading for LLMs

Jasper Dekoninck · Maximilian Baader · Martin Vechev

Self-Consistency Preference Optimization

Archiki Prasad · Weizhe Yuan · Richard Yuanzhe Pang · Jing Xu · Maryam Fazel-Zarandi · Mohit Bansal · Sainbayar Sukhbaatar · JASON WESTON · Jane Dwivedi-Yu

Free Process Rewards without Process Labels

Lifan Yuan · Wendi Li · Huayu Chen · Ganqu Cui · Ning Ding · Kaiyan Zhang · Bowen Zhou · Zhiyuan Liu · Hao Peng

Determining Layer-wise Sparsity for Large Language Models Through a Theoretical Perspective

Weizhong Huang · Yuxin Zhang · Xiawu Zheng · Fei Chao · Rongrong Ji

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Xinyu Guan · Li Lyna Zhang · Yifei Liu · Ning Shang · Youran Sun · Yi Zhu · Fan Yang · Mao Yang

De-mark: Watermark Removal in Large Language Models

Ruibo Chen · Yihan Wu · Junfeng Guo · Heng Huang

ResQ: Mixed-Precision Quantization of Large Language Models with Low-Rank Residuals

Utkarsh Saxena · Sayeh Sharify · Kaushik Roy · Xin Wang

Inference-Time Decomposition of Activations (ITDA): A Scalable Approach to Interpreting Large Language Models

Patrick Leask · Neel Nanda · Noura Al Moubayed

DyCodeEval: Dynamic Benchmarking of Reasoning Capabilities in Code Large Language Models Under Data Contamination

Simin Chen · Pranav Pusarla · Baishakhi Ray

Fast Video Generation with Sliding Tile Attention

Peiyuan Zhang · Yongqi Chen · Runlong Su · Hangliang Ding · Ion Stoica · Zhengzhong Liu · Hao Zhang

Evaluating Judges as Evaluators: The JETTS Benchmark of LLM-as-Judges as Test-Time Scaling Evaluators

Yilun Zhou · Austin Xu · PeiFeng Wang · Caiming Xiong · Shafiq Joty

Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options

Lakshmi Nair · Ian Trase · J. Kim

Learning Safety Constraints for Large Language Models

Xin Chen · Yarden As · Andreas Krause

Graph-constrained Reasoning: Faithful Reasoning on Knowledge Graphs with Large Language Models

Linhao Luo · Zicheng Zhao · Reza Haffari · Yuan-Fang Li · Chen Gong · Shirui Pan

CoreMatching: A Co-adaptive Sparse Inference Framework with Token and Neuron Pruning for Comprehensive Acceleration of Vision-Language Models

Qinsi Wang · Hancheng Ye · Ming-Yu Chung · Yudong Liu · Yueqian Lin · Martin Kuo · Mingyuan Ma · Jianyi Zhang · Yiran Chen

Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction

Vaishnavh Nagarajan · Chen Wu · Charles Ding · Aditi Raghunathan

Why Has Predicting Downstream Capabilities of Frontier AI Models with Scale Remained Elusive?

Rylan Schaeffer · Hailey Schoelkopf · Brando Miranda · Gabriel Mukobi · Varun Madan · Adam Ibrahim · Herbie Bradley · Stella Biderman · Sanmi Koyejo

FlipAttack: Jailbreak LLMs via Flipping

Yue Liu · Xiaoxin He · Miao Xiong · Jinlan Fu · Shumin Deng · YINGWEI MA · Jiaheng Zhang · Bryan Hooi

Mastering Board Games by External and Internal Planning with Language Models

John Schultz · Jakub Adamek · Matej Jusup · Marc Lanctot · Michael Kaisers · Sarah Perrin · Daniel Hennes · Jeremy Shar · Cannada Lewis · Anian Ruoss · Tom Zahavy · Petar Veličković · Laurel Prince · Satinder Singh · Eric Malmi · Nenad Tomasev

AlphaPO: Reward Shape Matters for LLM Alignment

Aman Gupta · Shao Tang · Qingquan Song · Sirou Zhu · Jiwoo Hong · Ankan Saha · Viral Gupta · Noah Lee · Eunki Kim · Siyu Zhu · Parag Agrawal · Natesh Pillai · Sathiya Keerthi

MAPLE: Many-Shot Adaptive Pseudo-Labeling for In-Context Learning

Zihan Chen · Song Wang · Zhen Tan · Jundong Li · Cong Shen

Guided Search Strategies in Non-Serializable Environments with Applications to Software Engineering Agents

Karina Zainullina · Aleksandr Golubev · Maria Trofimova · Sergei Polezhaev · Ibragim Badertdinov · Daria Litvintseva · Simon Karasik · Filipp Fisin · Sergei Skvortsov · Maksim Nekrashevich · Anton Shevtsov · Boris Yangel

MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities against Hard Perturbations

Kaixuan Huang · Jiacheng Guo · Zihao Li · Xiang Ji · Jiawei Ge · Wenzhe Li · Yingqing Guo · Tianle Cai · Hui Yuan · Runzhe Wang · Yue Wu · Ming Yin · Shange Tang · Yangsibo Huang · Chi Jin · Xinyun Chen · Chiyuan Zhang · Mengdi Wang

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

Alexander Wettig · Kyle Lo · Sewon Min · Hannaneh Hajishirzi · Danqi Chen · Luca Soldaini

MARGE: Improving Math Reasoning with Guided Exploration

Jingyue Gao · Runji Lin · Keming Lu · Bowen Yu · Junyang Lin · Jianyu Chen

ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Preference Optimization

Hee Suk Yoon · Eunseop Yoon · Mark Hasegawa-Johnson · Sungwoong Kim · Chang Yoo

BlockDialect: Block-wise Fine-grained Mixed Format Quantization for Energy-Efficient LLM Inference

Wonsuk Jang · Thierry Tambe

Communicating Activations Between Language Model Agents

Vignav Ramesh · Kenneth Li

AdaDecode: Accelerating LLM Decoding with Adaptive Layer Parallelism

Zhepei Wei · Wei-Lin Chen · Xinyu Zhu · Yu Meng

RWKVQuant: Quantizing the RWKV Family with Proxy Guided Hybrid of Scalar and Vector Quantization

XUCHEN · Yuxuan Yue · Zukang Xu · Xing Hu · JiangyongYu · Zhixuan Chen · Sifan Zhou · Zhihang Yuan · Dawei Yang

The Emperor's New Clothes in Benchmarking? A Rigorous Examination of Mitigation Strategies for LLM Benchmark Data Contamination

Yifan Sun · Han Wang · Dongbai Li · Gang Wang · Huan Zhang

On the Robustness of Reward Models for Language Model Alignment

Jiwoo Hong · Noah Lee · Eunki Kim · Guijin Son · Woojin Chung · Aman Gupta · Shao Tang · James Thorne

Federated In-Context Learning: Iterative Refinement for Improved Answer Quality

Ruhan Wang · Zhiyong Wang · Chengkai Huang · Rui Wang · Tong Yu · Lina Yao · John C. S. Lui · Dongruo Zhou

Improving Diversity in Language Models: When Temperature Fails, Change the Loss

Alexandre Verine · Florian Le Bronnec · Kunhao Zheng · Alexandre Allauzen · yann CHEVALEYRE · benjamin negrevergne

NExtLong: Toward Effective Long-Context Training without Long Documents

Chaochen Gao · Xing W · Zijia Lin · Debing Zhang · Songlin Hu

SliM-LLM: Salience-Driven Mixed-Precision Quantization for Large Language Models

Wei Huang · Haotong Qin · Yangdong Liu · Yawei Li · Qinshuo Liu · Xianglong Liu · Luca Benini · Michele Magno · Shiming Zhang · XIAOJUAN QI

Right Now, Wrong Then: Non-Stationary Direct Preference Optimization under Preference Drift

Seongho Son · William Bankes · Sayak Ray Chowdhury · Brooks Paige · Ilija Bogunovic

Bounded Rationality for LLMs: Satisficing Alignment at Inference-Time

Mohamad Chehade · Soumya Suvra Ghosal · Souradip Chakraborty · Avinash Reddy · Dinesh Manocha · Hao Zhu · Amrit Singh Bedi

LLMs can see and hear without any training

Kumar Ashutosh · Yossi Gandelsman · Xinlei Chen · Ishan Misra · Rohit Girdhar

Investigating Non-Transitivity in LLM-as-a-Judge

Yi Xu · Laura Ruis · Tim Rocktäschel · Robert Kirk

Aligning LLMs by Predicting Preferences from User Writing Samples

Stéphane Aroca-Ouellette · Natalie Mackraz · Barry-John Theobald · Katherine Metcalf

Look Twice Before You Answer: Memory-Space Visual Retracing for Hallucination Mitigation in Multimodal Large Language Models

Xin Zou · Yizhou WANG · Yibo Yan · Yuanhuiyi Lyu · Kening Zheng · Sirui Huang · Junkai Chen · Peijie Jiang · Jia Liu · Chang Tang · Xuming Hu

RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models

Quan Wei · Chung-Yiu Yau · Hoi To Wai · Yang Zhao · Dongyeop Kang · Youngsuk Park · Mingyi Hong

Understanding Multimodal LLMs Under Distribution Shifts: An Information-Theoretic Approach

Changdae Oh · zhen fang · Shawn Im · Xuefeng Du · Sharon Li

Scaling Laws for Forgetting during Finetuning with Pretraining Data Injection

Louis Béthune · David Grangier · Dan Busbridge · Eleonora Gualdoni · Marco Cuturi · Pierre Ablin

Explicit Preference Optimization: No Need for an Implicit Reward Model

Xiangkun Hu · Lemin Kong · Tong He · David Wipf

Radio: Rate–Distortion Optimization for Large Language Model Compression

Sean I. Young

Instruction-Following Pruning for Large Language Models

Bairu Hou · Qibin Chen · Jianyu Wang · Guoli Yin · Chong Wang · Nan Du · Ruoming Pang · Shiyu Chang · Tao Lei

Why Is Spatial Reasoning Hard for VLMs? An Attention Mechanism Perspective on Focus Areas

Shiqi Chen · Tongyao Zhu · Ruochen Zhou · Jinghan Zhang · Siyang Gao · Juan Carlos Niebles · Mor Geva · Junxian He · Jiajun Wu · Manling Li

Automated Benchmark Generation for Repository-Level Coding Tasks

Konstantinos Vergopoulos · Mark Müller · Martin Vechev

µnit Scaling: Simple and Scalable FP8 LLM Training

Saaketh Narayan · Abhay Gupta · Mansheej Paul · Davis Blalock

Divide and Conquer: Grounding LLMs as Efficient Decision-Making Agents via Offline Hierarchical Reinforcement Learning

Zican Hu · Wei Liu · Xiaoye Qu · Xiangyu Yue · Chunlin Chen · Zhi Wang · Yu Cheng

UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning

Jiawei Zhang · Shuang Yang · Bo Li

DataDecide: How to Predict Best Pretraining Data with Small Experiments

Ian Magnusson · Tai Nguyen · Ben Bogin · David Heineman · Jena Hwang · Luca Soldaini · Akshita Bhagia · Jiacheng Liu · Dirk Groeneveld · Oyvind Tafjord · Noah Smith · Pang Wei Koh · Jesse Dodge

LensLLM: Unveiling Fine-Tuning Dynamics for LLM Selection

Xinyue Zeng · Haohui Wang · Junhong Lin · Jun Wu · Tyler Cody · Dawei Zhou

SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models

Jiawei Zhang · Xuan Yang · Taiqi Wang · Yu Yao · Aleksandr Petiushko · Bo Li

Chameleon: A Flexible Data-mixing Framework for Language Model Pretraining and Finetuning

Wanyun Xie · Francesco Tonin · Volkan Cevher

TokenSwift: Lossless Acceleration of Ultra Long Sequence Generation

Tong Wu · Junzhe Shen · Zixia Jia · Yuxuan Wang · Zilong Zheng

Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers

Roman Abramov · Felix Steinbauer · Gjergji Kasneci

Parameters vs FLOPs: Scaling Laws for Optimal Sparsity for Mixture-of-Experts Language Models

Samira Abnar · Harshay Shah · Dan Busbridge · Alaaeldin Ali · Joshua M Susskind · Vimal Thilak

EvoPress: Accurate Dynamic Model Compression via Evolutionary Search

Oliver Sieberling · Denis Kuznedelev · Eldar Kurtic · Dan Alistarh

VersaPRM: Multi-Domain Process Reward Model via Synthetic Reasoning Data

Principled Data Selection for Alignment: The Hidden Risks of Difficult Examples

chengqian gao · Haonan Li · Liu Liu · Zeke Xie · Peilin Zhao · Zhiqiang Xu

Flow of Reasoning: Training LLMs for Divergent Reasoning with Minimal Examples

Fangxu Yu · Lai Jiang · Haoqiang Kang · Shibo Hao · Lianhui Qin

RATE: Causal Explainability of Reward Models with Imperfect Counterfactuals

David Reber · Sean Richardson · Todd Nief · Cristina Garbacea · Victor Veitch

ZebraLogic: On the Scaling Limits of LLMs for Logical Reasoning

Yuchen Lin · Ronan Le Bras · Kyle Richardson · Ashish Sabharwal · Radha Poovendran · Peter Clark · Yejin Choi

BEST-Route: Adaptive LLM Routing with Test-Time Optimal Compute

Dujian Ding · Ankur Mallick · Shaokun Zhang · Chi Wang · Daniel Madrigal · Mirian Hipolito Garcia · Menglin Xia · Laks Lakshmanan · Qingyun Wu · Victor Ruehle

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Jinlong Pang · Na Di · Zhaowei Zhu · Jiaheng Wei · Hao Cheng · Chen Qian · Yang Liu

FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees

Fan Nie · Xiaotian Hou · Shuhang Lin · James Zou · Huaxiu Yao · Linjun Zhang

Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark

Yunzhuo Hao · Jiawei Gu · Huichen Wang · Linjie Li · Zhengyuan Yang · Lijuan Wang · Yu Cheng

Are LLMs Prescient? A Continuous Evaluation using Daily News as the Oracle

Hui Dai · Ryan Teehan · Mengye Ren

MetaAgent: Automatically Constructing Multi-Agent Systems Based on Finite State Machines

Yaolun Zhang · Xiaogeng Liu · Chaowei Xiao

Occult: Optimizing Collaborative Communications across Experts for Accelerated Parallel MoE Training and Inference

Shuqing Luo · Pingzhi Li · Jie Peng · Yang Zhao · Yu Cao · Yu Cheng · Tianlong Chen

Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance

Linxi Zhao · Yihe Deng · Weitong Zhang · Quanquan Gu

When Do LLMs Help With Node Classification? A Comprehensive Analysis

Xixi Wu · Yifei Shen · Fangzhou Ge · Caihua Shan · Yizhu Jiao · Xiangguo Sun · Hong Cheng

Mitigating Over-Squashing in Graph Neural Networks by Spectrum-Preserving Sparsification

Langzhang Liang · Fanchen Bu · Zixing Song · Zenglin Xu · Shirui Pan · Kijung Shin

Discrete Neural Algorithmic Reasoning

Gleb Rodionov · Liudmila Prokhorenkova

CEGA: A Cost-Effective Approach for Graph-Based Model Extraction and Acquisition

Zebin Wang · Menghan Lin · Bolin Shen · Ken Anderson · Molei Liu · Tianxi Cai · Yushun Dong

Uncertainty Estimation for Heterophilic Graphs Through the Lens of Information Theory

Dominik Fuchsgruber · Tom Wollschläger · Johannes Bordne · Stephan Günnemann

Multi-Domain Graph Foundation Models: Robust Knowledge Transfer via Topology Alignment

Shuo Wang · Bokui Wang · Zhixiang Shen · Boyan Deng · zhao kang

SHARP-Distill: A 68× Faster Recommender System with Hypergraph Neural Networks and Language Models

Saman Forouzandeh · Parham Moradi · Mahdi Jalili

Commute Graph Neural Networks

Wei Zhuo · Han Yu · Guang Tan · Xiaoxiao Li

Dynamic Mixture of Curriculum LoRA Experts for Continual Multimodal Instruction Tuning

Chendi Ge · Xin Wang · Zeyang Zhang · Hong Chen · Jiapei Fan · Longtao Huang · Hui Xue' · Wenwu Zhu

Can Large Language Models Understand Intermediate Representations in Compilers?

Hailong Jiang · Jianfeng Zhu · Yao Wan · Bo Fang · Hongyu Zhang · Ruoming Jin · Qiang Guan

Thinking LLMs: General Instruction Following with Thought Generation

Tianhao Wu · Janice Lan · Weizhe Yuan · Jiantao Jiao · JASON WESTON · Sainbayar Sukhbaatar

video-SALMONN-o1: Reasoning-enhanced Audio-visual Large Language Model

Guangzhi Sun · Yudong Yang · Jimin Zhuang · Changli Tang · Yixuan Li · Wei Li · Zejun MA · Chao Zhang

How Contaminated Is Your Benchmark? Measuring Dataset Leakage in Large Language Models with Kernel Divergence

Hyeong Kyu Choi · Maxim Khanov · Hongxin Wei · Sharon Li

Improving the Effective Receptive Field of Message-Passing Neural Networks

Shahaf E. Finder · Ron Shapira Weber · Moshe Eliasof · Oren Freifeld · Eran Treister

TopoTune: A Framework for Generalized Combinatorial Complex Neural Networks

Mathilde Papillon · Guillermo Bernardez · Claudio Battiloro · Nina Miolane

Can Classic GNNs Be Strong Baselines for Graph-level Tasks? Simple Architectures Meet Excellence

Yuankai Luo · Lei Shi · Xiao-Ming Wu

Geometric Hyena Networks for Large-scale Equivariant Learning

Artem Moskalev · Mangal Prakash · Junjie Xu · Tianyu Cui · Rui Liao · Tommaso Mansi

Cooperation of Experts: Fusing Heterogeneous Information with Large Margin

Shuo Wang · Shunyang Huang · Jinghui Yuan · Zhixiang Shen · zhao kang

COMRECGC: Global Graph Counterfactual Explainer through Common Recourse

Gregoire Fournier · Sourav Medya

Outlier-Aware Post-Training Quantization for Discrete Graph Diffusion Models

Zheng Gong · Ying Sun

What Makes a Good Feedforward Computational Graph?

Alex Vitvitskyi · João Madeira Araujo · Marc Lackenby · Petar Veličković

GCAL: Adapting Graph Models to Evolving Domain Shifts

Ziyue Qiao · Qianyi Cai · Hao Dong · Jiawei Gu · Pengyang Wang · Meng Xiao · Xiao Luo · Hui Xiong

Improving the Scaling Laws of Synthetic Data with Deliberate Practice

Reyhane Askari Hemmat · Mohammad Pezeshki · Elvis Dohmatob · Florian Bordes · Pietro Astolfi · Melissa Hall · Jakob Verbeek · Michal Drozdzal · Adriana Romero-Soriano

Geometric Generative Modeling with Noise-Conditioned Graph Networks

Peter Pao-Huang · Mitchell Black · Xiaojie Qiu

AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration

Wenhao SUN · Rong-Cheng Tu · Jingyi Liao · Zhao Jin · Dacheng Tao

Learning Extrapolative Sequence Transformations from Markov Chains

Sophia Hager · Aleem Khan · Andrew Wang · Nicholas Andrews

Improving Consistency Models with Generator-Augmented Flows

Thibaut Issenhuth · Sangchul Lee · Ludovic Dos Santos · Jean-Yves Franceschi · Chansoo Kim · alain rakotomamonjy

Ergodic Generative Flows

Leo Brunswic · Mateo Clémente · Rui Heng Yang · Adam Sigal · Amir Rasouli · Yinchuan Li

Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion

Kulin Shah · Alkis Kalavasis · Adam Klivans · Giannis Daras

Robust Multi-bit Text Watermark with LLM-based Paraphrasers

Xiaojun Xu · jinghan jia · Yuanshun Yao · Yang Liu · Hang Li

Improved Discretization Complexity Analysis of Consistency Models: Variance Exploding Forward Process and Decay Discretization Scheme

Ruofeng Yang · Bo Jiang · Cheng Chen · Shuai Li

Generative Data Mining with Longtail-Guided Diffusion

David Hayden · Mao Ye · Timur Garipov · Gregory Meyer · Carl Vondrick · Zhao Chen · Yuning Chai · Eric M. Wolff · Siddhartha Srinivasa

Diffusion Adversarial Post-Training for One-Step Video Generation

Shanchuan Lin · Xin Xia · Yuxi Ren · Ceyuan Yang · Xuefeng Xiao · Lu Jiang

Harmonizing Geometry and Uncertainty: Diffusion with Hyperspheres

Muskan Dosi · Chiranjeev Chiranjeev · Kartik Thakral · Mayank Vatsa · Richa Singh

IMPACT: Iterative Mask-based Parallel Decoding for Text-to-Audio Generation with Diffusion Modeling

Kuan Po Huang · Shu-wen Yang · Huy Phan · Bo-Ru Lu · Byeonggeun Kim · Sashank Macha · Qingming Tang · Shalini Ghosh · Hung-yi Lee · Chieh-Chi Kao · Chao Wang

Field Matching: an Electrostatic Paradigm to Generate and Transfer Data

Alexander Kolesov · S. Manukhov · Vladimir Palyulin · Aleksandr Korotin

S4S: Solving for a Fast Diffusion Model Solver

Eric Frankel · Sitan Chen · Jerry Li · Pang Wei Koh · Lillian Ratliff · Sewoong Oh

DiTAR: Diffusion Transformer Autoregressive Modeling for Speech Generation

Dongya Jia · Zhuo Chen · Jiawei Chen · Chenpeng Du · Jian Wu · Jian Cong · Xiaobin Zhuang · Chumin Li · Zhen Wei · Yuping Wang · Yuxuan Wang

Geometric Representation Condition Improves Equivariant Molecule Generation

Zian Li · Cai Zhou · Xiyuan Wang · Xingang Peng · Muhan Zhang

EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM

Zhuofan Zong · Dongzhi Jiang · Bingqi Ma · Guanglu Song · Hao Shao · Dazhong Shen · Yu Liu · Hongsheng Li

Morse: Dual-Sampling for Lossless Acceleration of Diffusion Models

Chao Li · Jiawei Fan · Anbang Yao

Symmetry-Aware GFlowNets

Hohyun Kim · Seunggeun Lee · Min-hwan Oh

Q-VDiT: Towards Accurate Quantization and Distillation of Video-Generation Diffusion Transformers

Weilun Feng · Chuanguang Yang · Haotong Qin · Xiangqi Li · Yu Wang · Zhulin An · Libo Huang · Boyu Diao · Zixiang Zhao · Yongjun Xu · Michele Magno

FlexControl: Computation-Aware Conditional Control with Differentiable Router for Text-to-Image Generation

Zheng Fang · Lichuan Xiang · Xu Cai · Kaicheng Zhou · Hongkai Wen

Categorical Schrödinger Bridge Matching

Grigoriy Ksenofontov · Aleksandr Korotin

Variational Rectified Flow Matching

Pengsheng Guo · Alex Schwing

TabSDS: a Lightweight, Fully Non-Parametric, and Model Free Approach for Generating Synthetic Tabular Data

Elias Chaibub Neto

Stochastic Forward–Backward Deconvolution: Training Diffusion Models with Finite Noisy Datasets

Haoye Lu · Qifan Wu · Yaoliang Yu

Controlled Generation with Equivariant Variational Flow Matching

Floor Eijkelboom · Heiko Zimmermann · Sharvaree Vadgama · Erik Bekkers · Max Welling · Christian Andersson Naesseth · Jan-Willem van de Meent

Target Concrete Score Matching: A Holistic Framework for Discrete Diffusion

Ruixiang Zhang · Shuangfei Zhai · Yizhe Zhang · James Thornton · Zijing Ou · Joshua M Susskind · Navdeep Jaitly

Be a Goldfish: Forgetting Bad Conditioning in Sparse Linear Regression via Variational Autoencoders

Kuheli Pratihar · Debdeep Mukhopadhyay

Discrete Markov Probabilistic Models: An Improved Discrete Score-Based Framework with sharp convergence bounds under minimal assumptions

Le Tuyet Nhi PHAM · Dario Shariatian · Antonio Ocello · Giovanni Conforti · Alain Oliviero Durmus

Bayesian Neural Scaling Law Extrapolation with Prior-Data Fitted Networks

Dongwoo Lee · Dong Bok Lee · Steven Adriaensen · Juho Lee · Sung Ju Hwang · Frank Hutter · Seon Joo Kim · Hae Beom Lee

Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment

Chenghao Fan · zhenyi lu · Sichen Liu · Chengfeng Gu · Xiaoye Qu · Wei Wei · Yu Cheng

Diffusion Instruction Tuning

Chen Jin · Ryutaro Tanno · Amrutha Saseendran · Tom Diethe · Philip Teare

Modulated Diffusion: Accelerating Generative Modeling with Modulated Quantization

Weizhi Gao · Zhichao Hou · Junqi Yin · Feiyi Wang · Linyu Peng · Xiaorui Liu

Continuous Semi-Implicit Models

Longlin Yu · Jiajun Zha · Tong Yang · Tianyu Xie · Xiangyu Zhang · Gary Chan · Cheng Zhang

WMAdapter: Adding WaterMark Control to Latent Diffusion Models

Hai Ci · Yiren Song · Pei Yang · Jinheng Xie · Mike Zheng Shou

INRFlow: Flow Matching for INRs in Ambient Space

Yuyang Wang · Anurag Ranjan · Joshua M Susskind · Miguel Angel Bautista Martin

Efficient Fine-Grained Guidance for Diffusion Model Based Symbolic Music Generation

Tingyu Zhu · Haoyu Liu · Ziyu Wang · Zhimin Jiang · Zeyu Zheng

EasyInv: Toward Fast and Better DDIM Inversion

Ziyue Zhang · Mingbao Lin · Shuicheng YAN · Rongrong Ji

Inverse Problem Sampling in Latent Space Using Sequential Monte Carlo

Idan Achituve · Hai Victor Habi · Amir Rosenfeld · Arnon Netzer · Idit Diamant · Ethan Fetaya

Visual Generation Without Guidance

Huayu Chen · Kai Jiang · Kaiwen Zheng · Jianfei Chen · Hang Su · Jun Zhu

Spatial Reasoning with Denoising Models

Christopher Wewer · Bartlomiej Pogodzinski · Bernt Schiele · Jan Eric Lenssen

Peri-LN: Revisiting Normalization Layer in the Transformer Architecture

Jeonghoon Kim · Byeongchan Lee · Cheonbok Park · Yeontaek Oh · Beomjun Kim · Taehwan Yoo · Seongjin Shin · Dongyoon Han · Jinwoo Shin · Kang Min Yoo

From Low Rank Gradient Subspace Stabilization to Low-Rank Weights: Observations, Theories, and Applications

Ajay Jaiswal · Yifan Wang · Lu Yin · Shiwei Liu · Runjin Chen · Jiawei Zhao · Ananth Grama · Yuandong Tian · Zhangyang “Atlas” Wang

Primitive Vision: Improving Diagram Understanding in MLLMs

Shan Zhang · Aotian Chen · Yanpeng Sun · Jindong Gu · Yi-Yu Zheng · Piotr Koniusz · Kai Zou · Anton Hengel · Yuan Xue

Attention-Level Speculation

Jack Cai · Ammar Vora · Randolph Zhang · Mark O'Connor · Mark Jeffrey

Robust Noise Attenuation via Adaptive Pooling of Transformer Outputs

Greyson Brothers

Primphormer: Efficient Graph Transformers with Primal Representations

Mingzhen He · Ruikai Yang · Hanling Tian · Youmei Qiu · Xiaolin Huang

DeepCrossAttention: Supercharging Transformer Residual Connections

Mike Heddes · Adel Javanmard · Kyriakos Axiotis · Thomas Fu · MohammadHossein Bateni · Vahab Mirrokni

Curvature-aware Graph Attention for PDEs on Manifolds

Yunfeng Liao · Jiawen Guan · Xiucheng Li

Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models

Mingi Jung · Saehyung Lee · Eunji Kim · Sungroh Yoon

SAFE: Finding Sparse and Flat Minima to Improve Pruning

Dongyeop Lee · Kwanhee Lee · Jinseok Chung · Namhoon Lee

Transolver++: An Accurate Neural Solver for PDEs on Million-Scale Geometries

HUAKUN LUO · Haixu Wu · Hang Zhou · Lanxiang Xing · Yichen Di · Jianmin Wang · Mingsheng Long

SWAN: SGD with Normalization and Whitening Enables Stateless LLM Training

Chao Ma · Wenbo Gong · Meyer Scetbon · Edward Meeds

Learning-Augmented Hierarchical Clustering

Vladimir Braverman · Jon C. Ergun · Chen Wang · Samson Zhou

On Fine-Grained Distinct Element Estimation

Ilias Diakonikolas · Daniel Kane · Jasper Lee · Thanasis Pittas · David Woodruff · Samson Zhou

Safety Certificate against Latent Variables with Partially Unidentifiable Dynamics

Haoming Jing · Yorie Nakahira

Learning curves theory for hierarchically compositional data with power-law distributed features

Francesco Cagnetta · Hyunmo Kang · Matthieu Wyart

Harnessing Heterogeneous Statistical Strength for Personalized Federated Learning via Hierarchical Bayesian Inference

Mahendra Singh Thapa · Rui Li

SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning

Jinpeng Chen · Runmin Cong · Yuzhi Zhao · Hongzheng Yang · Guangneng Hu · Horace Ip · Sam Kwong

Matryoshka Quantization

Pranav Nair · Puranjay Datta · Jeff Dean · Prateek Jain · Aditya Kusupati

Prompt-based Depth Pruning of Large Language Models

Juyun Wee · Minjae Park · Jaeho Lee

Addressing Imbalanced Domain-Incremental Learning through Dual-Balance Collaborative Experts

Lan Li · Da-Wei Zhou · Han-Jia Ye · De-Chuan Zhan

Merge-Friendly Post-Training Quantization for Multi-Target Domain Adaptation

Juncheol Shin · Minsang Seok · Seonggon Kim · Eunhyeok Park

Learning to Stop: Deep Learning for Mean Field Optimal Stopping

Lorenzo Magnino · Yuchen Zhu · Mathieu Lauriere

Provably Improving Generalization of Few-shot models with Synthetic Data

Lan-Cuong Nguyen · Quan Nguyen-Tri · Bang Khanh · Dung D. Le · Long Tran-Thanh · Khoat Than

QuEST: Stable Training of LLMs with 1-Bit Weights and Activations

Andrei Panferov · Jiale Chen · Rush Tabesh · Mahdi Nikdan · Dan Alistarh

The Sharpness Disparity Principle in Transformers for Accelerating Language Model Pre-Training

Jinbo Wang · Mingze Wang · Zhanpeng Zhou · Junchi Yan · Weinan E · Lei Wu

Position: Societal Impacts Research Requires Benchmarks for Creative Composition Tasks

Judy Hanwen Shen

Position: Retrieval-augmented systems can be dangerous medical communicators

Lionel Wong · Ayman Ali · Raymond M Xiong · Shannon Shen · Yoon Kim · Monica Agrawal

Position: Contextual Integrity is Inadequately Applied to Language Models

Yan Shvartzshnaider · Vasisht Duddu

Position: Evaluating Generative AI Systems Is a Social Science Measurement Challenge

Hanna Wallach · Meera Desai · A. Feder Cooper · Angelina Wang · Chad Atalla · Solon Barocas · Su Lin Blodgett · Alexandra Chouldechova · Emily Corvi · P. Alex Dow · Jean Garcia-Gathright · Alexandra Olteanu · Nicholas Pangakis · Stefanie Reed · Emily Sheng · Dan Vann · Jennifer Wortman Vaughan · Matthew Vogel · Hannah Washington · Abigail Z. Jacobs

Position: It Is Time We Test Neural Computation In Vitro

Frithjof Gressmann · Ashley Chen · Lily Xie · Nancy Amato · Lawrence Rauchwerger

Position: Uncertainty Quantification Needs Reassessment for Large Language Model Agents

Michael Kirchhof · Gjergji Kasneci · Enkelejda Kasneci

Position: AI Evaluation Should Learn from How We Test Humans

Yan Zhuang · Qi Liu · Zachary Pardos · Patrick Kyllonen · Jiyun Zu · Zhenya Huang · Shijin Wang · Enhong Chen

Do Not Mimic My Voice : Speaker Identity Unlearning for Zero-Shot Text-to-Speech

Taesoo Kim · Jinju Kim · Dongchan Kim · Jong Hwan Ko · Gyeong-Moon Park

Adversarial Inception Backdoor Attacks against Reinforcement Learning

Ethan Rathbun · Alina Oprea · Christopher Amato

Decision Making under the Exponential Family: Distributionally Robust Optimisation with Bayesian Ambiguity Sets

Charita Dellaporta · Patrick O'Hara · Theodoros Damoulas

Optimal Survey Design for Private Mean Estimation

Yu-Wei Chen · Raghu Pasupathy · Jordan A Awan

Position: When Incentives Backfire, Data Stops Being Human

Sebastin Santy · Prasanta Bhattacharya · Manoel Ribeiro · Kelsey Allen · Sewoong Oh

Position: Rethinking LLM Bias Probing Using Lessons from the Social Sciences

Kirsten Morehouse · Siddharth Swaroop · Weiwei Pan

Position: General Intelligence Requires Reward-based Pretraining

Seungwook Han · Jyothish Pari · Samuel Gershman · Pulkit Agrawal

Weak-to-Strong Jailbreaking on Large Language Models

Xuandong Zhao · Xianjun Yang · Tianyu Pang · Chao Du · Lei Li · Yu-Xiang Wang · William Wang

SafeArena: Evaluating the Safety of Autonomous Web Agents

Ada Tur · Nicholas Meade · Xing Han Lù · Alejandra Zambrano · Arkil Patel · Esin Durmus · Spandana Gella · Karolina Stanczak · Siva Reddy

X-Transfer Attacks: Towards Super Transferable Adversarial Attacks on CLIP

Hanxun Huang · Sarah Erfani · Yige Li · Xingjun Ma · James Bailey

Emoji Attack: Enhancing Jailbreak Attacks Against Judge LLM Detection

Zhipeng Wei · Yuqi Liu · N. Benjamin Erichson

Mind the Gap: A Practical Attack on GGUF Quantization

Kazuki Egashira · Robin Staab · Mark Vero · Jingxuan He · Martin Vechev

Just Enough Shifts: Mitigating Over-Refusal in Aligned Language Models with Targeted Representation Fine-Tuning

Mahavir Dabas · Si Chen · Charles Fleming · Ming Jin · Ruoxi Jia

SafetyAnalyst: Interpretable, Transparent, and Steerable Safety Moderation for AI Behavior

Jing-Jing Li · Valentina Pyatkin · Max Kleiman-Weiner · Liwei Jiang · Nouha Dziri · Anne Collins · Jana Schaich Borg · Maarten Sap · Yejin Choi · Sydney Levine

LEMoN: Label Error Detection using Multimodal Neighbors

Haoran Zhang · Aparna Balagopalan · Nassim Oufattole · Hyewon Jeong · Yan Wu · Jiacheng Zhu · Marzyeh Ghassemi

EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers

Daiheng Gao · Shilin Lu · Wenbo Zhou · Jiaming Chu · Jie Zhang · Mengxi Jia · Bang Zhang · Zhaoxin Fan · Weiming Zhang

POROver: Improving Safety and Reducing Overrefusal in Large Language Models with Overgeneration and Preference Optimization

Batuhan K. Karaman · ishmam zabir · Alon Benhaim · Vishrav Chaudhary · Mert Sabuncu · Xia Song

$S^2$FGL: Spatial Spectral Federated Graph Learning

Zihan Tan · Suyuan Huang · Guancheng Wan · Wenke Huang · He Li · Mang Ye

Minimalist Concept Erasure in Generative Models

Yang Zhang · Er Jin · Yanfei Dong · Yixuan Wu · Phil Torr · Ashkan Khakzar · Johannes Stegmaier · Kenji Kawaguchi

Adversarial Reasoning at Jailbreaking Time

Mahdi Sabbaghi · Paul Kassianik · George Pappas · Amin Karbasi · Hamed Hassani

LlavaGuard: An Open VLM-based Framework for Safeguarding Vision Datasets and Models

Lukas Helff · Felix Friedrich · Manuel Brack · Kristian Kersting · Patrick Schramowski

Differentially Private Analysis for Binary Response Models: Optimality, Estimation, and Inference

Ce Zhang · Yixin Han · Yafei Wang · Xiaodong Yan · Linglong Kong · Ting Li · Bei Jiang

DMM: Distributed Matrix Mechanism for Differentially-Private Federated Learning Based on Constant-Overhead Linear Secret Resharing

Alexander Bienstock · Ujjwal Kumar · Antigoni Polychroniadou

A Unified Theoretical Analysis of Private and Robust Offline Alignment: from RLHF to DPO

Xingyu Zhou · Yulian Wu · Francesco Orabona

PASS: Private Attributes Protection with Stochastic Data Substitution

Yizhuo Chen · Chun-Fu (Richard) Chen · Hsiang Hsu · Shaohan Hu · Tarek Abdelzaher

Plausible Token Amplification for Improving Accuracy of Differentially Private In-Context Learning Based on Implicit Bayesian Inference

Yusuke Yamasaki · Kenta Niwa · Daiki Chijiwa · Takumi Fukami · Takayuki Miura

Is Your Model Fairly Certain? Uncertainty-Aware Fairness Evaluation for LLMs

Yinong O Wang · Nivedha Sivakumar · Falaah Arif Khan · Katherine Metcalf · Adam Golinski · Natalie Mackraz · Barry-John Theobald · Luca Zappella · Nicholas Apostoloff

On the Alignment between Fairness and Accuracy: from the Perspective of Adversarial Robustness

Junyi Chai · Taeuk Jang · Jing Gao · Xiaoqian Wang

Go to Event Page

Invited Talk

Adaptive Alignment: Designing AI for a Changing World - Frauke Kreuter

Frauke Kreuter

2:00 PM - 3:00 PM

As artificial intelligence systems become deeply embedded in our institutions, economies, and personal lives, the challenge of alignment—ensuring AI acts in accordance with human values and societal norms—has become both urgent and complex.

But what exactly should these systems be aligned to—and how do we know we're getting it right? To address this, we turn to a long-standing body of work: how societies have historically measured public preferences and moral norms—and what often goes wrong in the process.

The talk will introduce underutilized datasets—from decades of survey archives to international value studies—that could serve as empirical benchmarks for aligning AI systems with lived human norms. In addition to highlighting valuable data sources, we will examine how lessons from social science can inform the design of human feedback loops in AI. These insights help avoid common pitfalls in capturing human intentions and preferences—such as measurement error, framing effects, and unrepresentative sampling—that have plagued opinion research for decades.

We'll close by addressing the fluid and evolving nature of societal norms, emphasizing the need for alignment strategies that are adaptive to cultural and temporal change. Achieving this kind of adaptability requires not just better data, but durable collaborations between social scientists and machine learning researchers—so that updates to human values can be continuously reflected in system design. The goal is to provoke a deeper, interdisciplinary conversation about what it truly means to align AI with human values—and how to do so responsibly, reliably, and at scale.

... more

Speaker Bio

Professor Frauke Kreuter is Co-Director of the Social Data Science Center and faculty member in the Joint Program in Survey Methodology at the University of Maryland, USA; and Professor of Statistics and Data Science at the Ludwig-Maximilians-University of Munich. She is an elected fellow of the American Statistical Association and the 2020 recipient of the Warren Mitofsky Innovators Award of the American Association for Public Opinion Research. In addition to her academic work Dr. Kreuter is the Founder of the International Program for Survey and Data Science, developed in response to the increasing demand from researchers and practitioners for the appropriate methods and right tools to face a changing data environment; Co-Founder of the Coleridge Initiative, whose goal is to accelerate data-driven research and policy around human beings and their interactions for program management, policy development, and scholarly purposes by enabling efficient, effective, and secure access to sensitive data about society and the economy. coleridgeinitiative.org; and Co-Founder of the German language podcast Dig Deep.

... more

Oral

Oral 4C Privacy and Uncertainty Quantification

3:30 PM - 4:30 PM

4 Events in this session

On Differential Privacy for Adaptively Solving Search Problems via Sketching

Shiyuan Feng · Ying Feng · George Li · Zhao Song · David Woodruff · Lichen Zhang

Going Deeper into Locally Differentially Private Graph Neural Networks

Longzhu He · Chaozhuo Li · Peng Tang · Sen Su

Auditing $f$-differential privacy in one run

Saeed Mahloujifar · Luca Melis · Kamalika Chaudhuri

Conformal Prediction as Bayesian Quadrature

Jake Snell · Thomas Griffiths

Go to Event Page

Oral

Oral 4E Algorithms

3:30 PM - 4:30 PM

4 Events in this session

Improved Regret Analysis in Gaussian Process Bandits: Optimality for Noiseless Reward, RKHS norm, and Non-Stationary Variance

Shogo Iwazaki · Shion Takeno

High-Dimensional Prediction for Sequential Decision Making

Georgy Noarov · Ramya Ramalingam · Aaron Roth · Stephan Xie

Near-Optimal Decision Trees in a SPLIT Second

Varun Babbar · Hayden McTavish · Cynthia Rudin · Margo Seltzer

Expected Variational Inequalities

Brian Zhang · Ioannis Anagnostides · Emanuel Tewolde · Ratip Emin Berker · Gabriele Farina · Vincent Conitzer · Tuomas Sandholm

Go to Event Page

Oral

Oral 4D Applications in Science and Language

3:30 PM - 4:30 PM

4 Events in this session

AffectGPT: A New Dataset, Model, and Benchmark for Emotion Understanding with Multimodal Large Language Models

Zheng Lian · Haoyu Chen · Lan Chen · Haiyang Sun · Licai Sun · Yong Ren · Zebang Cheng · Bin Liu · Rui Liu · Xiaojiang Peng · Jiangyan Yi · Jianhua Tao

Long-Form Speech Generation with Spoken Language Models

Se Jin Park · Julian Salazar · Aren Jansen · Keisuke Kinoshita · Yong Man Ro · RJ Skerry-Ryan

Learning Time-Varying Multi-Region Brain Communications via Scalable Markovian Gaussian Processes

Weihan Li · Yule Wang · Chengrui Li · Anqi Wu

Learning Smooth and Expressive Interatomic Potentials for Physical Property Prediction

Xiang Fu · Brandon Wood · Luis Barroso-Luque · Daniel S. Levine · Meng Gao · Misko Dzamba · Larry Zitnick

Go to Event Page

Oral

Oral 4B Positions: Generative AI Evaluation

3:30 PM - 4:30 PM

4 Events in this session

Position: AI Competitions Provide the Gold Standard for Empirical Rigor in GenAI Evaluation

D. Sculley · William Cukierski · Phil Culliton · Sohier Dane · Maggie Demkin · Ryan Holbrook · Addison Howard · Paul Mooney · Walter Reade · Meg Risdal · Nate Keating

Position: Medical Large Language Model Benchmarks Should Prioritize Construct Validity

Ahmed Alaa · Thomas Hartvigsen · Niloufar Golchini · Shiladitya Dutta · Frances Dean · Inioluwa Raji · Travis Zack

Position: Principles of Animal Cognition to Improve LLM Evaluations

Sunayana Rane · Cyrus Kirkman · Graham Todd · Amanda Royka · Ryan Law · Erica Cartmill · Jacob Foster

Position: Political Neutrality in AI Is Impossible — But Here Is How to Approximate It

Jillian Fisher · Ruth Elisabeth Appel · Chan Young Park · Yujin Potter · Liwei Jiang · Taylor Sorensen · Shangbin Feng · Yulia Tsvetkov · Margaret Roberts · Jennifer Pan · Dawn Song · Yejin Choi

Go to Event Page

Oral

Oral 4A Representations 2

3:30 PM - 4:30 PM

4 Events in this session

Sundial: A Family of Highly Capable Time Series Foundation Models

Yong Liu · Guo Qin · Zhiyuan Shi · Zhi Chen · Caiyin Yang · Xiangdong Huang · Jianmin Wang · Mingsheng Long

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

Tiansheng Wen · Yifei Wang · Zequn Zeng · Zhong Peng · Yudi Su · Xinyang Liu · Bo Chen · Hongwei Liu · Stefanie Jegelka · Chenyu You

Partition First, Embed Later: Laplacian-Based Feature Partitioning for Refined Embedding and Visualization of High-Dimensional Data

Erez Peterfreund · Ofir Lindenbaum · Yuval Kluger · Boris Landa

Equivalence is All: A Unified View for Self-supervised Graph Learning

Yejiang Wang · Yuhai Zhao · Zhengkui Wang · Ling Li · Jiapu Wang · Fangting Li · Miaomiao Huang · Shirui Pan · Xingwei Wang

Go to Event Page

Poster

Poster Session 4 East

4:30 PM - 7:00 PM

315 Events in this session

FairICP: Encouraging Equalized Odds via Inverse Conditional Permutation

Yuheng Lai · Leying Guan

Optimal Fair Learning Robust to Adversarial Distribution Shift

Sushant Agarwal · Amit Jayant Deshpande · Rajmohan Rajaraman · Ravi Sundaram

Disparate Conditional Prediction in Multiclass Classifiers

Sivan Sabato · Eran Treister · Elad Yom-Tov

KGMark: A Diffusion Watermark for Knowledge Graphs

Hongrui Peng · Haolang Lu · Yuanlong Yu · WeiYe Fu · Kun Wang · Guoshun Nan

Fairness on Principal Stratum: A New Perspective on Counterfactual Fairness

Haoxuan Li · Zeyu Tang · Zhichao Jiang · Zhuangyan Fang · Yue Liu · zhi geng · Kun Zhang

Lightweight Protocols for Distributed Private Quantile Estimation

Anders Aamand · Fabrizio Boninsegna · Abigail Gentle · Jacob Imola · Rasmus Pagh

Private Federated Learning using Preference-Optimized Synthetic Data

Charlie Hou · Mei-Yu Wang · Yige Zhu · Daniel Lazar · Giulia Fanti

Privacy-Preserving Federated Convex Optimization: Balancing Partial-Participation and Efficiency via Noise Cancellation

Roie Reshef · Kfir Levy

EncryptedLLM: Privacy-Preserving Large Language Model Inference via GPU-Accelerated Fully Homomorphic Encryption

Leo de Castro · Daniel Escudero · Adya Agrawal · Antigoni Polychroniadou · Manuela Veloso

Auditing $f$-differential privacy in one run

Saeed Mahloujifar · Luca Melis · Kamalika Chaudhuri

You Get What You Give: Reciprocally Fair Federated Learning

Aniket Murhekar · Jiaxin Song · Parnian Shahkar · Bhaskar Ray Chaudhury · Ruta Mehta

FACTER: Fairness-Aware Conformal Thresholding and Prompt Engineering for Enabling Fair LLM-Based Recommender Systems

Arya Fayyazi · Mehdi Kamal · Massoud Pedram

Fairness Overfitting in Machine Learning: An Information-Theoretic Perspective

Firas Laakom · Haobo Chen · Jürgen Schmidhuber · Yuheng Bu

Clone-Robust AI Alignment

Ariel Procaccia · Benjamin Schiffer · Shirley Zhang

Understanding Fixed Predictions via Confined Regions

Connor Lawless · Lily Weng · Berk Ustun · Madeleine Udell

Graph Inverse Style Transfer for Counterfactual Explainability

Bardh Prenkaj · Efstratios Zaradoukas · Gjergji Kasneci

TOPLOC: A Locality Sensitive Hashing Scheme for Trustless Verifiable Inference

Jack Min Ong · Matthew Di Ferrante · Aaron Pazdera · Ryan Garner · Sami Jaghouar · Manveer Basra · Max Ryabinin · Johannes Hagemann

Evaluating Neuron Explanations: A Unified Framework with Sanity Checks

Tuomas Oikarinen · Ge Yan · Lily Weng

Near-Optimal Decision Trees in a SPLIT Second

Varun Babbar · Hayden McTavish · Cynthia Rudin · Margo Seltzer

X-Hacking: The Threat of Misguided AutoML

Rahul Sharma · Sumantrak Mukherjee · Andrea Šipka · Eyke Hüllermeier · Sebastian Vollmer · Sergey Redyuk · David A Selby

Sampling Binary Data by Denoising through Score Functions

Francis Bach · Saeed Saremi

Conditioning Diffusions Using Malliavin Calculus

Jakiw Pidstrigach · Elizabeth Baker · Carles Domingo i Enrich · George Deligiannidis · Nikolas Nüsken

Learn to Vaccinate: Combining Structure Learning and Effective Vaccination for Epidemic and Outbreak Control

Sepehr Elahi · Paula Mürmann · Patrick Thiran

Prediction-Powered E-Values

Daniel Csillag · Claudio Struchiner · Guilherme Tegoni Goedert

On the Vulnerability of Applying Retrieval-Augmented Generation within Knowledge-Intensive Application Domains

Xun Xian · Ganghua Wang · Xuan Bi · Rui Zhang · Jayanth Srinivasa · Ashish Kundu · Charles Fleming · Mingyi Hong · Jie Ding

LIMEFLDL: A Local Interpretable Model-Agnostic Explanations Approach for Label Distribution Learning

Xiuyi Jia · Jinchi Li · Yunan Lu · Weiwei Li

What makes an Ensemble (Un) Interpretable?

Shahaf Bassan · Guy Amir · Meirav Zehavi · Guy Katz

Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets

Wei Liu · Zhongyu Niu · Lang Gao · Zhiying Deng · Jun Wang · Haozhao Wang · Ruixuan Li

Learning to Route LLMs with Confidence Tokens

Yu-Neng Chuang · Prathusha Sarma · Parikshit Gopalan · John Boccio · Sara Bolouki · Xia Hu · Helen Zhou

Activation Space Interventions Can Be Transferred Between Large Language Models

Narmeen Oozeer · Dhruv Nathawani · Nirmalendu Prakash · Michael Lan · Abir HARRASSE · Amirali Abdullah

Differential Privacy Guarantees of Markov Chain Monte Carlo Algorithms

Andrea Bertazzi · Tim Johnston · Gareth Roberts · Alain Oliviero Durmus

New Bounds for Sparse Variational Gaussian Processes

Michalis Titsias

Return of the Latent Space COWBOYS: Re-thinking the use of VAEs for Bayesian Optimisation of Structured Spaces

Henry Moss · Sebastian Ober · Tom Diethe

Determinant Estimation under Memory Constraints and Neural Scaling Laws

Siavash Ameli · Chris van der Heide · Liam Hodgkinson · Fred Roosta · Michael Mahoney

Outsourced Diffusion Sampling: Efficient Posterior Inference in Latent Spaces of Generative Models

Siddarth Venkatraman · Mohsin Hasan · Minsu Kim · Luca Scimeca · Marcin Sendera · Yoshua Bengio · Glen Berseth · Nikolay Malkin

Conformal Prediction as Bayesian Quadrature

Jake Snell · Thomas Griffiths

Sample Complexity of Branch-length Estimation by Maximum Likelihood

David Clancy · Hanbaek Lyu · Sebastien Roch

A Mixture-Based Framework for Guiding Diffusion Models

Yazid Janati · Badr MOUFAD · Mehdi Qassime · Alain Oliviero Durmus · Eric Moulines · Jimmy Olsson

LEAPS: A discrete neural sampler via locally equivariant networks

Peter Holderrieth · Michael Albergo · Tommi Jaakkola

TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation

Gwen Yidou-Weng · Benjie Wang · Guy Van den Broeck

Learning Soft Sparse Shapes for Efficient Time-Series Classification

Zhen Liu · Yicheng Luo · Boyuan Li · Emadeldeen Eldele · Min Wu · Qianli Ma

Weakly Supervised Anomaly Detection via Dual-Tailed Kernel

Walid Durani · Tobias Nitzl · Claudia Plant · Christian Böhm

Weakly-Supervised Contrastive Learning for Imprecise Class Labels

Zi-Hao Zhou · Jun-Jie Wang · Tong Wei · Min-Ling Zhang

A Theoretical Framework For Overfitting In Energy-based Modeling

Giovanni Catania · Aurélien Decelle · Cyril Furtlehner · Beatriz Seoane

Partition First, Embed Later: Laplacian-Based Feature Partitioning for Refined Embedding and Visualization of High-Dimensional Data

Erez Peterfreund · Ofir Lindenbaum · Yuval Kluger · Boris Landa

Lightspeed Geometric Dataset Distance via Sliced Optimal Transport

Khai Nguyen · Hai Nguyen · Tuan Pham · Nhat Ho

Generalized Venn and Venn-Abers Calibration with Applications in Conformal Prediction

Lars van der Laan · Ahmed Alaa

Online Detection of LLM-Generated Texts via Sequential Hypothesis Testing by Betting

Can Chen · Jun-Kun Wang

Learning Survival Distributions with the Asymmetric Laplace Distribution

Deming Sheng · Ricardo Henao

PTTA: Purifying Malicious Samples for Test-Time Model Adaptation

Jing Ma · Hanlin Li · Xiang Xiang

Whoever Started the interference Should End It: Guiding Data-Free Model Merging via Task Vectors

Runxi Cheng · Feng Xiong · Yongxian Wei · Wanyun Zhu · Chun Yuan

Generalized additive models via direct optimization of regularized decision stump forests

Magzhan Gabidolla · Miguel Carreira-Perpinan

Approximately Correct Label Distribution Learning

Weiwei Li · Haitao Wu · Yunan Lu · Xiuyi Jia

Compressing tree ensembles through Level-wise Optimization and Pruning

Laurens Devos · Timo Martens · Deniz Oruc · Wannes Meert · Hendrik Blockeel · Jesse Davis

Learning Imbalanced Data with Beneficial Label Noise

Guangzheng Hu · Feng Liu · Mingming Gong · Guanghui Wang · Liuhua Peng

Predictive Performance of Deep Quantum Data Re-uploading Models

Xin Wang · Hanxiao Tao · Re-Bing Wu

Right Time to Learn: Promoting Generalization via Bio-inspired Spacing Effect in Knowledge Distillation

Guanglong Sun · Hongwei Yan · Liyuan Wang · Qian Li · Bo Lei · Yi Zhong

Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation

Michal Lukasik · Lin Chen · Harikrishna Narasimhan · Aditya Menon · Wittawat Jitkrittum · Felix Xinnan Yu · Sashank J. Reddi · Thomas Fu · MohammadHossein Bateni · Sanjiv Kumar

Concentration Distribution Learning from Label Distributions

Jiawei Tang · Yuheng Jia

Efficient LiDAR Reflectance Compression via Scanning Serialization

Jiahao Zhu · Kang You · Dandan Ding · Zhan Ma

Improved Coresets for Vertical Federated Learning: Regularized Linear and Logistic Regressions

Supratim Shit · Gurmehak chadha · Surendra kumar · Bapi Chatterjee

SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization

Runsheng Bai · Bo Liu · qiang liu

Geometric Contact Flows: Contactomorphisms for Dynamics and Control

Andrea Testa · Søren Hauberg · Tamim Asfour · Leonel Rozo

KoNODE: Koopman-Driven Neural Ordinary Differential Equations with Evolving Parameters for Time Series Analysis

Hanru Bai · Weiyang Ding

Spectral-Aware Reservoir Computing for Fast and Accurate Time Series Classification

Shikang Liu · Chuyang Wei · Xiren Zhou · Huanhuan Chen

Conformal Anomaly Detection in Event Sequences

Shuai Zhang · Chuan Zhou · Yang Liu · PENG ZHANG · Xixun Lin · Shirui Pan

Provable Length Generalization in Sequence Prediction via Spectral Filtering

Annie Marsden · Evan Dogariu · Naman Agarwal · Xinyi Chen · Daniel Suo · Elad Hazan

Residual TPP: A Unified Lightweight Approach for Event Stream Data Analysis

Ruoxin Yuan · Guanhua Fang

VisionTS: Visual Masked Autoencoders Are Free-Lunch Zero-Shot Time Series Forecasters

Mouxiang Chen · Lefei Shen · Zhuo Li · Xiaoyun Wang · Jianling Sun · Chenghao Liu

Low-distortion and GPU-compatible Tree Embeddings in Hyperbolic Space

Max van Spengler · Pascal Mettes

Controlling Neural Collapse Enhances Out-of-Distribution Detection and Transfer Learning

Md Yousuf Harun · Jhair Gallardo · Christopher Kanan

The Complexity of Learning Sparse Superposed Features with Feedback

Akash Kumar

Contrastive Learning with Simplicial Convolutional Networks for Short-Text Classification

Liang Huang · Benedict Lee · Daniel Ng · Kelin Xia

The Generalized Skew Spectrum of Graphs

Armando Bellante · Martin Plávala · Alessandro Luongo

Beyond Matryoshka: Revisiting Sparse Coding for Adaptive Representation

Tiansheng Wen · Yifei Wang · Zequn Zeng · Zhong Peng · Yudi Su · Xinyang Liu · Bo Chen · Hongwei Liu · Stefanie Jegelka · Chenyu You

Near Optimal Best Arm Identification for Clustered Bandits

Yash Kheshwani · Avishek Ghosh · Nikhil Karamchandani

Wait-Less Offline Tuning and Re-solving for Online Decision Making

Jingruo Sun · Wenzhi Gao · Ellen Vitercik · Yinyu Ye

Efficient Core-set Selection for Deep Learning Through Squared Loss Minimization

Jianting Chen

Sample Efficient Demonstration Selection for In-Context Learning

Kiran Purohit · Venktesh V · Sourangshu Bhattacharya · Avishek Anand

Robust Consensus Anchor Learning for Efficient Multi-view Subspace Clustering

Yalan Qin · Nan Pu · Guorui Feng · Nicu Sebe

From Spectrum-free towards Baseline-view-free: Double-track Proximity Driven Multi-view Clustering

Shengju Yu · Dong Zhibin · Siwei Wang · Suyuan Liu · KE LIANG · Xinwang Liu · Yue Liu · Yi Zhang

COKE: Core Kernel for More Efficient Approximation of Kernel Weights in Multiple Kernel Clustering

Weixuan Liang · Xinwang Liu · KE LIANG · Jiyuan Liu · En Zhu

TypyBench: Evaluating LLM Type Inference for Untyped Python Repositories

Honghua Dong · Jiacheng Yang · Xun Deng · Yuhe Jiang · Gennady Pekhimenko · Fan Long · Xujie Si

Regression for the Mean: Auto-Evaluation and Inference with Few Labels through Post-hoc Regression

Benjamin Eyre · David Madras

On Path to Multimodal Generalist: General-Level and General-Bench

Hao Fei · Yuan Zhou · Juncheng Li · Xiangtai Li · Qingshan Xu · Bobo Li · Shengqiong Wu · Yaoting Wang · Junbao Zhou · Jiahao Meng · Qingyu Shi · Zhiyuan Zhou · Liangtao Shi · Minghe Gao · Daoan Zhang · Zhiqi Ge · Siliang Tang · Kaihang Pan · Yaobo Ye · Haobo Yuan · Tao Zhang · Weiming Wu · Tianjie Ju · Zixiang Meng · Shilin Xu · Liyu Jia · Wentao Hu · Meng Luo · Jiebo Luo · Tat-Seng Chua · Shuicheng YAN · Hanwang Zhang

Is Complex Query Answering Really Complex?

Cosimo Gregucci · Bo Xiong · Daniel Hernández · Lorenzo Loconte · Pasquale Minervini · Steffen Staab · Antonio Vergari

SyncMind: Measuring Agent Out-of-Sync Recovery in Collaborative Software Engineering

Xuehang Guo · Xingyao Wang · Yangyi Chen · Sha Li · Chi Han · Manling Li · Heng Ji

To Each Metric Its Decoding: Post-Hoc Optimal Decision Rules of Probabilistic Hierarchical Classifiers

Roman Plaud · Alexandre Perez-Lebel · Matthieu Labeau · Antoine Saillenfest · Thomas Bonald

Pfeife: Automatic Pipeline Parallelism for PyTorch

Ho Young Jhoo · Chung-Kil Hur · Nuno P. Lopes

K$^2$IE: Kernel Method-based Kernel Intensity Estimators for Inhomogeneous Poisson Processes

Hideaki Kim · Tomoharu Iwata · Akinori Fujino

Kernel Quantile Embeddings and Associated Probability Metrics

Masha Naslidnyk · Siu Lun Chau · Francois-Xavier Briol · Krikamol Muandet

Learning Safe Strategies for Value Maximizing Buyers in Uniform Price Auctions

Negin Golrezaei · Sourav Sahoo

Clustering via Self-Supervised Diffusion

Roy Uziel · Irit Chelly · Oren Freifeld · Ari Pakman

Generalization Performance of Ensemble Clustering: From Theory to Algorithm

Xu Zhang · Haoye Qiu · Weixuan Liang · Hui LIU · Junhui Hou · Yuheng Jia

Almost Optimal Fully Dynamic $k$-Center Clustering with Recourse

Sayan Bhattacharya · Martín Costa · Ermiya Farokhnejad · Silvio Lattanzi · Nikos Parotsidis

Super Deep Contrastive Information Bottleneck for Multi-modal Clustering

Zhengzheng Lou · Ke Zhang · Yucong Wu · Shizhe Hu

Fast Incomplete Multi-view Clustering by Flexible Anchor Learning

Yalan Qin · Guorui Feng · Xinpeng Zhang

Graph Minimum Factor Distance and Its Application to Large-Scale Graph Data Clustering

Jicong Fan

Exogenous Isomorphism for Counterfactual Identifiability

Yikang Chen · Dehui du

Strategic A/B testing via Maximum Probability-driven Two-armed Bandit

Yu Zhang · Shanshan Zhao · Bokui Wan · Jinjuan Wang · Xiaodong Yan

Local Identifying Causal Relations in the Presence of Latent Variables

Zheng Li · Zeyu Liu · Feng Xie · Hao Zhang · Chunchen LIU · zhi geng

Distributionally Robust Policy Learning under Concept Drifts

Jingyuan Wang · Zhimei Ren · Ruohan Zhan · Zhengyuan Zhou

Counterfactual Contrastive Learning with Normalizing Flows for Robust Treatment Effect Estimation

Jiaxuan Zhang · Emadeldeen Eldele · Fuyuan CAO · Yang Wang · Xiaoli Li · Jiye Liang

Reducing Confounding Bias without Data Splitting for Causal Inference via Optimal Transport

Yuguang Yan · Zongyu Li · Haolin Yang · Zeqin Yang · Hao Zhou · Ruichu Cai · Zhifeng Hao

Differentiable Structure Learning with Ancestral Constraints

Taiyu Ban · Changxin Rong · Xiangyu Wang · Lyuzhou Chen · Xin Wang · Derui Lyu · Qinrui Zhu · Huanhuan Chen

Compelling ReLU Networks to Exhibit Exponentially Many Linear Regions at Initialization and During Training

Max Milkert · David Hyde · Forrest Laine

Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation

Zhan Zhuang · Xiequn Wang · Wei Li · Yulong Zhang · Qiushi Huang · Shuhao Chen · Xuehao Wang · Yanbin Wei · Yuhe Nie · Kede Ma · Yu Zhang · Ying Wei

Feature Shift Localization Network

Míriam Barrabés · Daniel Mas Montserrat · Kapal Dev · Alexander Ioannidis

One-Shot Heterogeneous Federated Learning with Local Model-Guided Diffusion Models

Mingzhao Yang · Shangchao Su · Bin Li · Xiangyang Xue

Learning with Selectively Labeled Data from Multiple Decision-makers

Jian Chen · Zhehao Li · Xiaojie Mao

Federated Learning for Feature Generalization with Convex Constraints

Dongwon Kim · Donghee Kim · Sung Kuk Shyn · Kwangsu Kim

Disentangling Invariant Subgraph via Variance Contrastive Estimation under Distribution Shifts

Haoyang Li · Xin Wang · Xueling Zhu · Weigao Wen · Wenwu Zhu

Info-Coevolution: An Efficient Framework for Data Model Coevolution

Ziheng Qin · Hailun Xu · Wei Yew · Qi Jia · Yang Luo · Kanchan Sarkar · Danhui Guan · Kai Wang · Yang You

Evolving Minds: Logic-Informed Inference from Temporal Action Patterns

Chao Yang · Shuting Cui · Yang Yang · Shuang Li

Projection Pursuit Density Ratio Estimation

Meilin Wang · Wei Huang · Mingming Gong · Zheng Zhang

Adaptive Estimation and Learning under Temporal Distribution Shift

Dheeraj Baby · Yifei Tang · Hieu Nguyen · Yu-Xiang Wang · Rohit Pyati

Provable Maximum Entropy Manifold Exploration via Diffusion Models

Riccardo De Santi · Marin Vlastelica · Ya-Ping Hsieh · Zebang Shen · Niao He · Andreas Krause

A Online Statistical Framework for Out-of-Distribution Detection

Xinsong Ma · Xin Zou · Weiwei Liu

Advancing Constrained Monotonic Neural Networks: Achieving Universal Approximation Beyond Bounded Activations

Davide Sartor · Alberto Sinigaglia · Gian Antonio Susto

Deep Linear Network Training Dynamics from Random Initialization: Data, Width, Depth, and Hyperparameter Transfer

Blake Bordelon · Cengiz Pehlevan

Rethinking Benign Overfitting in Two-Layer Neural Networks

Ruichen Xu · Kexin Chen

Constrained Belief Updates Explain Geometric Structures in Transformer Representations

Mateusz Piotrowski · Paul Riechers · Daniel Filan · Adam Shai

A Generalizable Physics-Enhanced State Space Model for Long-Term Dynamics Forecasting in Complex Environments

Yuchen Wang · Hongjue Zhao · Haohong Lin · Enze Xu · Lifang He · Huajie Shao

LSCD: Lomb--Scargle Conditioned Diffusion for Time series Imputation

Elizabeth M Fons Etcheverry · Alejandro Sztrajman · Yousef El-Laham · Luciana Ferrer · Svitlana Vyetrenko · Manuela Veloso

Channel Normalization for Time Series Channel Identification

Seunghan Lee · Taeyoung Park · Kibok Lee

Efficient Time Series Processing for Transformers and State-Space Models through Token Merging

Leon Götz · Marcel Kollovieh · Stephan Günnemann · Leo Schwinn

Quantifying Memory Utilization with Effective State-Size

Rom N. Parnichkun · Neehal Tumma · Armin Thomas · Alessandro Moro · Qi An · Taiji Suzuki · Atsushi Yamashita · Michael Poli · Stefano Massaroli

In-Context Fine-Tuning for Time-Series Foundation Models

Matthew Faw · Rajat Sen · Yichen Zhou · Abhimanyu Das

Self-Supervised Learning of Intertwined Content and Positional Features for Object Detection

Kang-Jun Liu · Masanori Suganuma · Takayuki Okatani

Non-Stationary Predictions May Be More Informative: Exploring Pseudo-Labels with a Two-Phase Pattern of Training Dynamics

Hongbin Pei · Jingxin Hai · Yu Li · Huiqi Deng · Denghao Ma · Jie Ma · Pinghui Wang · Jing Tao · Xiaohong Guan

Contradiction Retrieval via Contrastive Learning with Sparsity

Haike Xu · Zongyu Lin · Kai-Wei Chang · Yizhou Sun · Piotr Indyk

From Local Details to Global Context: Advancing Vision-Language Models with Attention-Based Selection

Lincan Cai · Jingxuan Kang · Shuang Li · Wenxuan Ma · Binhui Xie · Zhida Qin · Jian Liang

Integrating Intermediate Layer Optimization and Projected Gradient Descent for Solving Inverse Problems with Diffusion Models

Yang Zheng · Wen Li · Zhaoqiang Liu

Learning Input Encodings for Kernel-Optimal Implicit Neural Representations

Zhemin Li · Liyuan Ma · Hongxia Wang · Yaoyun Zeng · 晓龙韩

Understanding the Emergence of Multimodal Representation Alignment

Megan Tjandrasuwita · Chanakya Ekbote · Liu Ziyin · Paul Pu Liang

One Stone, Two Birds: Enhancing Adversarial Defense Through the Lens of Distributional Discrepancy

Jiacheng Zhang · Benjamin Rubinstein · Jingfeng Zhang · Feng Liu

Average Certified Radius is a Poor Metric for Randomized Smoothing

Chenhao Sun · Yuhao Mao · Mark Müller · Martin Vechev

REINFORCE Adversarial Attacks on Large Language Models: An Adaptive, Distributional, and Semantic Objective

Simon Geisler · Tom Wollschläger · M. Hesham Abdalla · Vincent Cohen-Addad · Johannes Gasteiger · Stephan Günnemann

When and How Does CLIP Enable Domain and Compositional Generalization?

Elias Kempf · Simon Schrodi · Max Argus · Thomas Brox

Phase and Amplitude-aware Prompting for Enhancing Adversarial Robustness

Yibo Xu · Dawei Zhou · Decheng Liu · Nannan Wang

Long-Short Alignment for Effective Long-Context Modeling in LLMs

Tianqi Du · Haotian Huang · Yifei Wang · Yisen Wang

Simplifying DINO via Coding Rate Regularization

Ziyang Wu · Jingyuan Zhang · Druv Pai · XuDong Wang · Chandan Singh · Jianwei Yang · Jianfeng Gao · Yi Ma

On the Out-of-Distribution Generalization of Self-Supervised Learning

Wenwen Qiang · Jingyao Wang · Zeen Song · Jiangmeng Li · Changwen Zheng

Functional Alignment Can Mislead: Examining Model Stitching

Damian Smith · Harvey Mannering · Antonia Marcu

Think Smarter not Harder: Adaptive Reasoning with Inference Aware Optimization

Zishun Yu · Tengyu Xu · Di Jin · Karthik Abinav Sankararaman · Yun He · Wenxuan Zhou · Zhouhao Zeng · Eryk Helenowski · Chen Zhu · Sinong Wang · Hao Ma · Han Fang

Taming Knowledge Conflicts in Language Models

Gaotang Li · Yuzhong Chen · Hanghang Tong

Reinforced Lifelong Editing for Language Models

Zherui Li · Houcheng Jiang · Hao Chen · Baolong Bi · Zhenhong Zhou · Fei Sun · Junfeng Fang · Xiang Wang

Iterative Vectors: In-Context Gradient Steering without Backpropagation

Yiting Liu · Zhi-Hong Deng

LLM Data Selection and Utilization via Dynamic Bi-level Optimization

Yang Yu · Kai Han · Hang Zhou · Yehui Tang · Kaiqi Huang · Yunhe Wang · Dacheng Tao

Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead

Rickard Gabrielsson · Jiacheng Zhu · Onkar Bhardwaj · Leshem Choshen · Kristjan Greenewald · Mikhail Yurochkin · Justin Solomon

An Analysis for Reasoning Bias of Language Models with Small Initialization

Junjie Yao · zhongwang zhang · Zhi-Qin John Xu

NestQuant: nested lattice quantization for matrix products and LLMs

Semyon Savkin · Eitan Porat · Or Ordentlich · Yury Polyanskiy

Revolve: Optimizing AI Systems by Tracking Response Evolution in Textual Optimization

Peiyan Zhang · Haibo Jin · Leyang Hu · Xinnuo Li · Liying Kang · Man Luo · Yangqiu Song · Haohan Wang

ROPO: Robust Preference Optimization for Large Language Models

Xize Liang · Chao Chen · Shuang Qiu · Jie Wang · Yue Wu · Zhihang Fu · Hanzhu Chen · Feng Wu · Jieping Ye

Improving Your Model Ranking on Chatbot Arena by Vote Rigging

Rui Min · Tianyu Pang · Chao Du · Qian Liu · Minhao Cheng · Min Lin

Exploiting Presentative Feature Distributions for Parameter-Efficient Continual Learning of Large Language Models

Xin Cheng · Jiabo Ye · Haiyang Xu · Ming Yan · Ji Zhang · Feng Liu · Fei Huang · Lei Feng

Reliable and Efficient Amortized Model-based Evaluation

Sang Truong · Yuheng Tu · Percy Liang · Bo Li · Sanmi Koyejo

AuPair: Golden Example Pairs for Code Repair

Aditi Mavalankar · Hassan Mansoor · Zita Marinho · Mariia Samsikova · Tom Schaul

ProofAug: Efficient Neural Theorem Proving via Fine-grained Proof Structure Analysis

Haoxiong Liu · Jiacheng Sun · Zhenguo Li · Andrew Yao

UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models

Xin Xu · Qiyun Xu · Tong Xiao · Tianhao Chen · Yuchen Yan · Jiaxin ZHANG · Shizhe Diao · Can Yang · Yang Wang

Unbiased Evaluation of Large Language Models from a Causal Perspective

Meilin Chen · Jian Tian · Liang Ma · Di Xie · Weijie Chen · Jiang Zhu

Reward-Guided Prompt Evolving in Reinforcement Learning for LLMs

Ziyu Ye · Rishabh Agarwal · Tianqi Liu · Rishabh Joshi · Sarmishta Velury · Quoc Le · Qijun Tan · Yuan Liu

Teaching Transformers Causal Reasoning through Axiomatic Training

Aniket Vashishtha · Abhinav Kumar · Atharva Pandey · Abbavaram Gowtham Reddy · Kabir Ahuja · Vineeth N Balasubramanian · Amit Sharma

KABB: Knowledge-Aware Bayesian Bandits for Dynamic Expert Coordination in Multi-Agent Systems

Jusheng Zhang · Zimeng Huang · Yijia Fan · Ningyuan Liu · Mingyan Li · Zhuojie Yang · Jiawei Yao · Jian Wang · Keze Wang

Hi-Patch: Hierarchical Patch GNN for Irregular Multivariate Time Series

Yicheng Luo · Bowen Zhang · Zhen Liu · Qianli Ma

Learning Distribution-wise Control in Representation Space for Language Models

Deng · Ruidi Chang · Hanjie Chen

Progressively Label Enhancement for Large Language Model Alignment

Biao Liu · Ning Xu · Xin Geng

The Geometry of Refusal in Large Language Models: Concept Cones and Representational Independence

Tom Wollschläger · Jannes Elstner · Simon Geisler · Vincent Cohen-Addad · Stephan Günnemann · Johannes Gasteiger

RAPID: Long-Context Inference with Retrieval-Augmented Speculative Decoding

Guanzheng Chen · Qilong Feng · Jinjie Ni · Xin Li · Michael Shieh

LLMs on the Line: Data Determines Loss-to-Loss Scaling Laws

Prasanna Mayilvahanan · Thaddäus Wiedemer · Sayak Mallick · Matthias Bethge · Wieland Brendel

DPO Meets PPO: Reinforced Token Optimization for RLHF

Han Zhong · Zikang Shan · Guhao Feng · Wei Xiong · Xinle Cheng · Li Zhao · Di He · Jiang Bian · Liwei Wang

polybasic Speculative Decoding Through a Theoretical Perspective

Ruilin Wang · Huixia Li · Yuexiao Ma · Xiawu Zheng · Fei Chao · Xuefeng Xiao · Rongrong Ji

XAttention: Block Sparse Attention with Antidiagonal Scoring

Ruyi Xu · Guangxuan Xiao · Haofeng Huang · Junxian Guo · Song Han

HyperIMTS: Hypergraph Neural Network for Irregular Multivariate Time Series Forecasting

Boyuan Li · Yicheng Luo · Zhen Liu · Junhao Zheng · Jianming Lv · Qianli Ma

Preference Adaptive and Sequential Text-to-Image Generation

Ofir Nabati · Guy Tennenholtz · Chih-wei Hsu · Moonkyung Ryu · Deepak Ramachandran · Yinlam Chow · Xiang Li · Craig Boutilier

xLSTM 7B: A Recurrent LLM for Fast and Efficient Inference

Maximilian Beck · Korbinian Pöppel · Phillip Lippe · Richard Kurle · Patrick Blies · Günter Klambauer · Sebastian Böck · Sepp Hochreiter

Hyperband-based Bayesian Optimization for Black-box Prompt Selection

Lennart Schneider · Martin Wistuba · Aaron Klein · Jacek Golebiowski · Giovanni Zappella · Felice Antonio Merra

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Tianzhe Chu · Yuexiang Zhai · Jihan Yang · Shengbang Tong · Saining Xie · Dale Schuurmans · Quoc Le · Sergey Levine · Yi Ma

BackSlash: Rate Constrained Optimized Training of Large Language Models

Jun Wu · jiangtao wen · Yuxing Han

Scaling Sparse Feature Circuits For Studying In-Context Learning

Dmitrii Kharlapenko · Stepan Shabalin · Arthur Conmy · Neel Nanda

Moirai-MoE: Empowering Time Series Foundation Models with Sparse Mixture of Experts

Xu Liu · Juncheng Liu · Gerald Woo · Taha Aksu · Yuxuan Liang · Roger Zimmermann · Chenghao Liu · Junnan Li · Silvio Savarese · Caiming Xiong · Doyen Sahoo

Improving Rationality in the Reasoning Process of Language Models through Self-playing Game

Pinzheng Wang · Juntao Li · Zecheng Tang · Haijia Gui · Min zhang

Multi-Turn Code Generation Through Single-Step Rewards

Arnav Kumar Jain · Gonzalo Gonzalez-Pumariega · Wayne Chen · Alexander Rush · Wenting Zhao · Sanjiban Choudhury

AnyEdit: Edit Any Knowledge Encoded in Language Models

Houcheng Jiang · Junfeng Fang · Ningyu Zhang · Mingyang Wan · Guojun Ma · Xiang Wang · Xiangnan He · Tat-Seng Chua

Parrot: Multilingual Visual Instruction Tuning

Hai-Long Sun · Da-Wei Zhou · Yang Li · Shiyin Lu · Chao Yi · Qing-Guo Chen · Zhao Xu · Weihua Luo · Kaifu Zhang · De-Chuan Zhan · Han-Jia Ye

FunBO: Discovering Acquisition Functions for Bayesian Optimization with FunSearch

Virginia Aglietti · Ira Ktena · Jessica Schrouff · Eleni Sgouritsa · Francisco Ruiz · Alan Malek · Alexis Bellot · Silvia Chiappa

AdaptiveStep: Automatically Dividing Reasoning Step through Model Confidence

Yuliang Liu · Junjie Lu · Chaofeng Qu · Zhaoling Chen · Zefan Cai · Jason Liu · Chonghan Liu · Yunhui Xia · Li Zhao · Jiang Bian · Chuheng Zhang · Wei Shen · Zhouhan Lin

Towards Lifelong Model Editing via Simulating Ideal Editor

Yaming Guo · Siyang Guo · Hengshu Zhu · Ying Sun

When Bad Data Leads to Good Models

Kenneth Li · Yida Chen · Fernanda Viégas · Martin Wattenberg

Boosting Multi-Domain Fine-Tuning of Large Language Models through Evolving Interactions between Samples

Xize Liang · Lin Yang · Jie Wang · Yiyang Lu · Runyu Wu · Hanzhu Chen · Jianye Hao

Fast Large Language Model Collaborative Decoding via Speculation

Jiale Fu · Yuchu Jiang · Junkai Chen · Jiaming Fan · Xin Geng · Xu Yang

REG: Rectified Gradient Guidance for Conditional Diffusion Models

Zhengqi Gao · Kaiwen Zha · Tianyuan Zhang · Zihui Xue · Duane Boning

Sparsing Law: Towards Large Language Models with Greater Activation Sparsity

Yuqi Luo · Chenyang Song · Xu Han · Yingfa Chen · Chaojun Xiao · Xiaojun Meng · Liqun Deng · Jiansheng Wei · Zhiyuan Liu · Maosong Sun

MASS: Mathematical Data Selection via Skill Graphs for Pretraining Large Language Models

Jiazheng Li · Lu Yu · Qing Cui · Zhiqiang Zhang · JUN ZHOU · Yanfang Ye · Chuxu Zhang

Hidden No More: Attacking and Defending Private Third-Party LLM Inference

Rahul Thomas · Louai Zahran · Erica Choi · Akilesh Potti · Micah Goldblum · Arka Pal

Discriminative Policy Optimization for Token-Level Reward Models

Hongzhan Chen · Tao Yang · Shiping Gao · Ruijun Chen · Xiaojun Quan · Hongtao Tian · Ting Yao

Benchmarking Abstract and Reasoning Abilities Through A Theoretical Perspective

Qingchuan Ma · Yuhang Wu · Xiawu Zheng · Rongrong Ji

Leveraging Online Olympiad-Level Math Problems for LLMs Training and Contamination-Resistant Evaluation

Sadegh Mahdavi · Muchen Li · Kaiwen Liu · Christos Thrampoulidis · Leonid Sigal · Renjie Liao

SkipGPT: Each Token is One of a Kind

Anhao Zhao · Fanghua Ye · Yingqi Fan · Junlong Tong · Jing Xiong · Zhiwei Fei · Hui Su · Anhao Zhao

Binary Hypothesis Testing for Softmax Models and Leverage Score Models

Yuzhou Gu · Zhao Song · Junze Yin

Structure-Guided Large Language Models for Text-to-SQL Generation

Qinggang Zhang · Hao Chen · Junnan Dong · Shengyuan Chen · Feiran Huang · Xiao Huang

Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling

Hongzhi Huang · Defa Zhu · Banggu Wu · Zeng · Ya Wang · Qiyang Min · zhou Xun

BanditSpec: Adaptive Speculative Decoding via Bandit Algorithms

Yunlong Hou · Fengzhuo Zhang · Cunxiao Du · Xuan Zhang · Jiachun Pan · Tianyu Pang · Chao Du · Vincent Tan · Zhuoran Yang

R.I.P.: Better Models by Survival of the Fittest Prompts

Ping Yu · Weizhe Yuan · Olga Golovneva · Tianhao Wu · Sainbayar Sukhbaatar · JASON WESTON · Jing Xu

MMInference: Accelerating Pre-filling for Long-Context Visual Language Models via Modality-Aware Permutation Sparse Attention

Yucheng Li · Huiqiang Jiang · Chengruidong Zhang · Qianhui Wu · Xufang Luo · Surin Ahn · Amir Abdi · Dongsheng Li · Jianfeng Gao · Yuqing Yang · Lili Qiu

Ferret: Federated Full-Parameter Tuning at Scale for Large Language Models

Yao Shu · Wenyang Hu · See-Kiong Ng · Bryan Kian Hsiang Low · Fei Yu

On the Duality between Gradient Transformations and Adapters

Lucas Torroba Hennigen · Hunter Lang · Han Guo · Yoon Kim

EduLLM: Leveraging Large Language Models and Framelet-Based Signed Hypergraph Neural Networks for Student Performance Prediction

Ming Li · Yukang Cheng · Lu Bai · Feilong Cao · Ke Lv · Jiye Liang · Pietro Lió

Topology-Aware Dynamic Reweighting for Distribution Shifts on Graph

Weihuang Zheng · Jiashuo Liu · Jiaxing Li · Jiayun Wu · Peng Cui · Youyong Kong

On Measuring Long-Range Interactions in Graph Neural Networks

Jacob Bamberger · Benjamin Gutteridge · Scott le Roux · Michael Bronstein · Xiaowen Dong

Towards LLM Unlearning Resilient to Relearning Attacks: A Sharpness-Aware Minimization Perspective and Beyond

Chongyu Fan · jinghan jia · Yihua Zhang · Anil Ramakrishna · Mingyi Hong · Sijia Liu

Generalists vs. Specialists: Evaluating LLMs on Highly-Constrained Biophysical Sequence Optimization Tasks

Angelica Chen · Samuel Stanton · Frances Ding · Robert Alberstein · Andrew Watkins · Richard Bonneau · Vladimir Gligorijevic · Kyunghyun Cho · Nathan Frey

Audio Flamingo 2: An Audio-Language Model with Long-Audio Understanding and Expert Reasoning Abilities

Sreyan Ghosh · Zhifeng Kong · Sonal Kumar · S Sakshi · Jaehyeon Kim · Wei Ping · Rafael Valle · Dinesh Manocha · Bryan Catanzaro

Oracle-MoE: Locality-preserving Routing in the Oracle Space for Memory-constrained Large Language Model Inference

Jixian Zhou · Fang DONG(董方) · Ruijun Huang · Hengjie Cao · Mengyi Chen · Yifeng Yang · Anrui Chen · Mingzhi Dong · Yujiang Wang · Dongsheng Li · David Clifton · Qin Lv · Rui Zhu · Chun Zhang · Fan Yang · Tun Lu · Ning Gu · Li Shang

Revisiting Chain-of-Thought in Code Generation: Do Language Models Need to Learn Reasoning before Coding?

Ren-Biao Liu · Anqi Li · ChaodingYang · Hui Sun · Ming Li

Calibrated Language Models and How to Find Them with Label Smoothing

Jerry Huang · Peng Lu · QIUHAO Zeng

Efficient Long Context Fine-tuning with Chunk Flow

Xiulong Yuan · Hongtao Xu · Wenting Shen · Ang Wang · Xiafei Qiu · Jie Zhang · Yuqiong Liu · Bowen Yu · Junyang Lin · Mingzhen Li · Weile Jia · Yong Li · Wei Lin

Persistent Topological Features in Large Language Models

Yuri Gardinazzi · Karthik Viswanathan · Giada Panerai · Alessio Ansuini · Alberto Cazzaniga · Matteo Biagetti

Weisfeiler and Leman Go Gambling: Why Expressive Lottery Tickets Win

Lorenz Kummer · Samir Moustafa · Anatol Ehrlich · Franka Bause · Nikolaus Suess · Wilfried Gansterer · Nils M. Kriege

Disentangled Graph Spectral Domain Adaptation

Liang Yang · Xin Chen · Jiaming Zhuo · Di Jin · Chuan Wang · Xiaochun Cao · Zhen Wang · Yuanfang Guo

Graph4MM: Weaving Multimodal Learning with Structural Information

Xuying Ning · Dongqi Fu · Tianxin Wei · Wujiang Xu · Jingrui He

Best of Both Worlds: Advantages of Hybrid Graph Sequence Models

Ali Behrouz · Ali Parviz · Mahdi Karami · Clayton Sanford · Bryan Perozzi · Vahab Mirrokni

Graph Neural Network Generalization With Gaussian Mixture Model Based Augmentation

Yassine Abbahaddou · Fragkiskos Malliaros · Johannes Lutzeyer · Amine Aboussalah · Michalis Vazirgiannis

Do We Really Need Message Passing in Brain Network Modeling?

Liang Yang · Yuwei Liu · Jiaming Zhuo · Di Jin · Chuan Wang · Zhen Wang · Xiaochun Cao

G-Designer: Architecting Multi-agent Communication Topologies via Graph Neural Networks

Guibin Zhang · Yanwei Yue · Xiangguo Sun · Guancheng Wan · Miao Yu · Junfeng Fang · Kun Wang · Tianlong Chen · Dawei Cheng

Stability and Generalization Capability of Subgraph Reasoning Models for Inductive Knowledge Graph Completion

Minsung Hwang · Jaejun Lee · Joyce Whang

Large Language-Geometry Model: When LLM meets Equivariance

Zongzhao Li · Jiacheng Cen · Bing Su · Tingyang Xu · Yu Rong · Deli Zhao · Wenbing Huang

Zero-Shot Generalization of GNNs over Distinct Attribute Domains

Yangyi Shen · Jincheng Zhou · Beatrice Bevilacqua · Joshua Robinson · Charilaos Kanatsoulis · Jure Leskovec · Bruno Ribeiro

Haste Makes Waste: A Simple Approach for Scaling Graph Neural Networks

Rui Xue · Tong Zhao · Neil Shah · Xiaorui Liu

A General Graph Spectral Wavelet Convolution via Chebyshev Order Decomposition

Nian Liu · Xiaoxin He · Thomas Laurent · Francesco Di Giovanni · Michael Bronstein · Xavier Bresson

SketchDNN: Joint Continuous-Discrete Diffusion for CAD Sketch Generation

Sathvik Chereddy · John Femiani

Score-based Pullback Riemannian Geometry: Extracting the Data Manifold Geometry using Anisotropic Flows

Willem Diepeveen · Georgios Batzolis · Zakhar Shumaylov · Carola-Bibiane Schönlieb

TimeStep Master: Asymmetrical Mixture of Timestep LoRA Experts for Versatile and Efficient Diffusion Models in Vision

Shaobin Zhuang · Yiwei Guo · Yanbo Ding · Kunchang Li · Xinyuan Chen · Yaohui Wang · Fangyikang Wang · Ying Zhang · Chen Li · Yali Wang

The Diffusion Duality

Subham Sekhar Sahoo · Justin Deschenaux · Aaron Gokaslan · Guanghan Wang · Justin Chiu · Volodymyr Kuleshov

Privacy Attacks on Image AutoRegressive Models

Antoni Kowalczuk · Jan Dubiński · Franziska Boenisch · Adam Dziedzic

Graph World Model

Tao Feng · Yexin Wu · Guanyu Lin · Jiaxuan You

GrokFormer: Graph Fourier Kolmogorov-Arnold Transformers

GUOGUO AI · Guansong Pang · Hezhe Qiao · YuanGao · Hui Yan

TopInG: Topologically Interpretable Graph Learning via Persistent Rationale Filtration

Cheng Xin · Fan Xu · Xin Ding · Jie Gao · Jiaxin Ding

SPHINX: Structural Prediction using Hypergraph Inference Network

Iulia Duta · Pietro Lió

Vision Graph Prompting via Semantic Low-Rank Decomposition

Zixiang Ai · Zichen Liu · Jiahuan Zhou

N2GON: Neural Networks for Graph-of-Net with Position Awareness

Yejiang Wang · Yuhai Zhao · Zhengkui Wang · Wen Shan · Ling Li · Qian Li · Miaomiao Huang · Meixia Wang · Shirui Pan · Xingwei Wang

How Expressive are Knowledge Graph Foundation Models?

Xingyue Huang · Pablo Barcelo · Michael Bronstein · Ismail Ceylan · Mikhail Galkin · Juan Reutter · Miguel Romero Orth

Equivalence is All: A Unified View for Self-supervised Graph Learning

Yejiang Wang · Yuhai Zhao · Zhengkui Wang · Ling Li · Jiapu Wang · Fangting Li · Miaomiao Huang · Shirui Pan · Xingwei Wang

Towards a Mechanistic Explanation of Diffusion Model Generalization

Matthew Niedoba · Berend Zwartsenberg · Kevin Murphy · Frank Wood

Wasserstein Flow Matching: Generative Modeling Over Families of Distributions

Doron Haviv · Aram-Alexandre Pooladian · Dana Pe'er · Brandon Amos

RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior

Ching-Hua Lee · Chouchang Yang · Jaejin Cho · Yashas Malur Saidutta · Rakshith Sharma Srinivasa · Yilin Shen · Hongxia Jin

MDDM: Practical Message-Driven Generative Image Steganography Based on Diffusion Models

Zihao Xu · Dawei xu · Zihan Li · Chuan Zhang

Smooth Interpolation for Improved Discrete Graph Generative Models

Yuxuan Song · Juntong Shi · Jingjing Gong · Minkai Xu · Stefano Ermon · Hao Zhou · Wei-Ying Ma

Mechanisms of Projective Composition of Diffusion Models

Arwen Bradley · Preetum Nakkiran · David Berthelot · James Thornton · Joshua M Susskind

RocketKV: Accelerating Long-Context LLM Inference via Two-Stage KV Cache Compression

Payman Behnam · Yaosheng Fu · Ritchie Zhao · Po-An Tsai · Zhiding Yu · Alexey Tumanov

Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models

JINHAO LIANG · Jacob Christopher · Sven Koenig · Ferdinando Fioretto

Generative Audio Language Modeling with Continuous-valued Tokens and Masked Next-Token Prediction

Shu-wen Yang · Byeonggeun Kim · Kuan Po Huang · Qingming Tang · Huy Phan · Bo-Ru Lu · Harshavardhan Sundar · Shalini Ghosh · Hung-yi Lee · Chieh-Chi Kao · Chao Wang

Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts

Marta Skreta · Tara Akhound-Sadegh · Viktor Ohanesian · Roberto Bondesan · Alan Aspuru-Guzik · Arnaud Doucet · Rob Brekelmans · Alexander Tong · Kirill Neklyudov

TabNAT: A Continuous-Discrete Joint Generative Framework for Tabular Data

Hengrui Zhang · Liancheng Fang · Qitian Wu · Philip Yu

Hyper-Transforming Latent Diffusion Models

Ignacio Peis · Batuhan Koyuncu · Isabel Valera · Jes Frellsen

Cross-regularization: Adaptive Model Complexity through Validation Gradients

Carlos Stein Naves de Brito

RZ-NAS: Enhancing LLM-guided Neural Architecture Search via Reflective Zero-Cost Strategy

Zipeng Ji · Guanghui Zhu · Chunfeng Yuan · Yihua Huang

SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference

Yuan Zhang · Chun-Kai Fan · Junpeng Ma · Wenzhao Zheng · Tao Huang · Kuan Cheng · Denis Gudovskiy · Tomoyuki Okuno · Yohei Nakata · Kurt Keutzer · Shanghang Zhang

Implicit Language Models are RNNs: Balancing Parallelization and Expressivity

Mark Schoene · Babak Rahmani · Heiner Kremer · Fabian Falck · Hitesh Ballani · Jannes Gladrow

$\infty$-Video: A Training-Free Approach to Long Video Understanding via Continuous-Time Memory Consolidation

Saúl Santos · António Farinhas · Daniel McNamee · Andre Martins

ParallelComp: Parallel Long-Context Compressor for Length Extrapolation

Jing Xiong · Jianghan Shen · Chuanyang Zheng · Zhongwei Wan · Chenyang Zhao · Chiwun Yang · Fanghua Ye · Hongxia Yang · Lingpeng Kong · Ngai Wong

Efficient Length-Generalizable Attention via Causal Retrieval for Long-Context Language Modeling

Xiang Hu · Zhihao Teng · Jun Zhao · Wei Wu · Kewei Tu

Rethinking the Bias of Foundation Model under Long-tailed Distribution

Jiahao Chen · Bin Qin · Jiangmeng Li · Hao Chen · Bing Su

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Yi-Fan Zhang · Tao Yu · Haochen Tian · Chaoyou Fu · Peiyan Li · Jianshu Zeng · Wulin Xie · Yang Shi · Huanyu Zhang · Junkang Wu · xue wang · Yibo Hu · Bin Wen · Tingting Gao · Zhang Zhang · Fan Yang · Di ZHANG · Liang Wang · Rong Jin

Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees

Zehong Wang · Zheyuan Zhang · Tianyi MA · Nitesh Chawla · Chuxu Zhang · Yanfang Ye

PEAKS: Selecting Key Training Examples Incrementally via Prediction Error Anchored by Kernel Similarity

Mustafa Burak Gurbuz · Xingyu Zheng · Constantine Dovrolis

Learngene Tells You How to Customize: Task-Aware Parameter Initialization at Flexible Scales

Jiaze Xu · Shiyu Xia · Xu Yang · JIAQI LYU · Xin Geng

CSTrack: Enhancing RGB-X Tracking via Compact Spatiotemporal Features

xiaokun Feng · Dailing Zhang · Shiyu Hu · Xuchen Li · Meiqi Wu · Jing Zhang · Xiaotang Chen · Kaiqi Huang

Accelerating PDE-Constrained Optimization by the Derivative of Neural Operators

Ze Cheng · Zhuoyu Li · Wang Xiaoqiang · Jianing Huang · Zhizhou Zhang · Zhongkai Hao · Hang Su

Scalable Meta-Learning via Mixed-Mode Differentiation

Iurii Kemaev · Dan Andrei Calian · Luisa Zintgraf · Gregory Farquhar · Hado van Hasselt

An Efficient Matrix Multiplication Algorithm for Accelerating Inference in Binary and Ternary Neural Networks

Mohsen Dehghankar · Mahdi Erfanian · Abolfazl Asudeh

MERGE$^3$: Efficient Evolutionary Merging on Consumer-grade GPUs

Tommaso Mencattini · Adrian Robert Minut · Donato Crisostomi · Andrea Santilli · Emanuele Rodola

SLiM: One-shot Quantization and Sparsity with Low-rank Approximation for LLM Weight Compression

Mohammad Mozaffari · Amir Yazdanbakhsh · Maryam Mehri Dehnavi

A Closer Look at Backdoor Attacks on CLIP

Shuo He · Zhifang Zhang · Feng Liu · Roy Lee · Bo An · Lei Feng

SBGD: Improving Graph Diffusion Generative Model via Stochastic Block Diffusion

Junwei Su · shan Wu

GLGENN: A Novel Parameter-Light Equivariant Neural Networks Architecture Based on Clifford Geometric Algebras

Ekaterina Filimoshina · Dmitry Shirokov

OW-VAP: Visual Attribute Parsing for Open World Object Detection

Xing Xi · Xing Fu · Weiqiang Wang · Ronghua Luo

Taming Diffusion for Dataset Distillation with High Representativeness

Lin Zhao · Yushu Wu · Xinru Jiang · Jianyang Gu · Yanzhi Wang · Xiaolin Xu · Pu Zhao · Xue Lin

GS-Bias: Global-Spatial Bias Learner for Single-Image Test-Time Adaptation of Vision-Language Models

Zhaohong Huang · Yuxin Zhang · JingJing Xie · Fei Chao · Rongrong Ji

Open-Det: An Efficient Learning Framework for Open-Ended Detection

Guiping Cao · Tao Wang · Wenjian Huang · Xiangyuan Lan · Jianguo Zhang · Dongmei Jiang

Position: We Can’t Understand AI Using our Existing Vocabulary

John Hewitt · Robert Geirhos · Been Kim

Position: Rethinking Explainable Machine Learning as Applied Statistics

Sebastian Bordt · Eric Raidl · Ulrike Luxburg

Position: Principles of Animal Cognition to Improve LLM Evaluations

Sunayana Rane · Cyrus Kirkman · Graham Todd · Amanda Royka · Ryan Law · Erica Cartmill · Jacob Foster

Position: The Most Expensive Part of an LLM *should* be its Training Data

Nikhil Kandpal · Colin Raffel

Position: Political Neutrality in AI Is Impossible — But Here Is How to Approximate It

Position: Iterative Online-Offline Joint Optimization is Needed to Manage Complex LLM Copyright Risks

Yanzhou Pan · Jiayi Chen · Jiamin Chen · Zhaozhuo Xu · Denghui Zhang

Tree-Sliced Wasserstein Distance: A Geometric Perspective

Viet Hoang Tran · Trang Pham · Tho Tran Huu · Minh-Khoi Nguyen-Nhat · Thanh Chu · Tam Le · Tan Nguyen

Position: Human Baselines in Model Evaluations Need Rigor and Transparency (With Recommendations & Reporting Checklist)

Kevin Wei · Patricia Paskov · Sunishchal Dev · Michael Byun · Anka Reuel · Xavier Roberts-Gaal · Rachel Calcott · Evie Coxon · Chinmay Deshpande

Position: Medical Large Language Model Benchmarks Should Prioritize Construct Validity

Ahmed Alaa · Thomas Hartvigsen · Niloufar Golchini · Shiladitya Dutta · Frances Dean · Inioluwa Raji · Travis Zack

Position: AI Competitions Provide the Gold Standard for Empirical Rigor in GenAI Evaluation

D. Sculley · William Cukierski · Phil Culliton · Sohier Dane · Maggie Demkin · Ryan Holbrook · Addison Howard · Paul Mooney · Walter Reade · Meg Risdal · Nate Keating

Position: AI Should Not Be An Imitation Game: Centaur Evaluations

Andreas Haupt · Erik Brynjolfsson

Position: All Current Generative Fidelity and Diversity Metrics are Flawed

Ossi Räisä · Boris van Breugel · Mihaela van der Schaar

Position: Theory of Mind Benchmarks are Broken for Large Language Models

Matthew Riemer · Zahra Ashktorab · Djallel Bouneffouf · Payel Das · Miao Liu · Justin Weisz · Murray Campbell

Position: The Future of Bayesian Prediction Is Prior-Fitted

Samuel Gabriel Müller · Arik Reuter · Noah Hollmann · David Rügamer · Frank Hutter

Position: We Need Responsible, Application-Driven (RAD) AI Research

Sarah Hartman · Cheng Soon Ong · Julia Powles · Petra Kuhnert

Cowpox: Towards the Immunity of VLM-based Multi-Agent Systems

YUTONG WU · Jie Zhang · Yiming Li · Chao Zhang · Qing Guo · Han Qiu · Nils Lukas · Tianwei Zhang

PoisonedEye: Knowledge Poisoning Attack on Retrieval-Augmented Generation based Large Vision-Language Models

Chenyang Zhang · Xiaoyu Zhang · Jian Lou · KAI WU · Zilong Wang · Xiaofeng Chen

Omni-Angle Assault: An Invisible and Powerful Physical Adversarial Attack on Face Recognition

Shuai Yuan · Hongwei Li · Rui Zhang · Hangcheng Cao · Wenbo Jiang · Tao Ni · Wenshu Fan · Qingchuan Zhao · Guowen Xu

Diffusion-based Adversarial Purification from the Perspective of the Frequency Domain

Gaozheng Pei · Ke Ma · Yingfei Sun · Qianqian Xu · Qingming Huang

BiMark: Unbiased Multilayer Watermarking for Large Language Models

Xiaoyan Feng · He Zhang · Yanjun Zhang · Leo Yu Zhang · Shirui Pan

MELON: Provable Defense Against Indirect Prompt Injection Attacks in AI Agents

Kaijie Zhu · Xianjun Yang · Jindong Wang · Wenbo Guo · William Wang

OR-Bench: An Over-Refusal Benchmark for Large Language Models

Jiaxing Cui · Wei-Lin Chiang · Ion Stoica · Cho-Jui Hsieh

Improving LLM Safety Alignment with Dual-Objective Optimization

Xuandong Zhao · Will Cai · Tianneng Shi · David Huang · Licong Lin · Song Mei · Dawn Song

Safety Reasoning with Guidelines

Haoyu Wang · Zeyu Qin · Li Shen · Xueqian Wang · Dacheng Tao · Minhao Cheng

Optimizing Adaptive Attacks against Watermarks for Language Models

Abdulrahman Diaa · Toluwani Aremu · Nils Lukas

Antidote: Post-fine-tuning Safety Alignment for Large Language Models against Harmful Fine-tuning Attack

Tiansheng Huang · Gautam Bhattacharya · Pratik Joshi · Joshua Kimball · Ling Liu

Hardware and Software Platform Inference

Cheng Zhang · Hanna Foerster · Robert Mullins · Yiren Zhao · Ilia Shumailov

BaxBench: Can LLMs Generate Correct and Secure Backends?

Mark Vero · Niels Mündler · Viktor Chibotaru · Veselin Raychev · Maximilian Baader · Nikola Jovanović · Jingxuan He · Martin Vechev

DIS-CO: Discovering Copyrighted Content in VLMs Training Data

André Duarte · Xuandong Zhao · Arlindo Oliveira · Lei Li

Quantifying Prediction Consistency Under Fine-tuning Multiplicity in Tabular LLMs

Faisal Hamman · Sachindra P Dissanayake · Saumitra Mishra · Freddy Lecue · Sanghamitra Dutta

"Who experiences large model decay and why?" A Hierarchical Framework for Diagnosing Heterogeneous Performance Drift

Harvineet Singh · Fan Xia · Alexej Gossmann · Andrew Chuang · Julian Hong · Jean Feng

SCISSOR: Mitigating Semantic Bias through Cluster-Aware Siamese Networks for Robust Classification

Shuo Yang · Bardh Prenkaj · Gjergji Kasneci

Federated Disentangled Tuning with Textual Prior Decoupling and Visual Dynamic Adaptation

Yihao Yang · Wenke Huang · Guancheng Wan · Bin Yang · Mang Ye

Going Deeper into Locally Differentially Private Graph Neural Networks

Longzhu He · Chaozhuo Li · Peng Tang · Sen Su

Scaling Test-Time Compute Without Verification or RL is Suboptimal

Amrith Setlur · Nived Rajaraman · Sergey Levine · Aviral Kumar

Go to Event Page

Poster

Poster Session 4 West

4:30 PM - 7:00 PM

203 Events in this session

Windows Agent Arena: Evaluating Multi-Modal OS Agents at Scale

Rogerio Bonatti · Dan Zhao · Francesco Bonacci · Dillon Dupont · Sara Abdali · Yinheng Li · Yadong Lu · Justin Wagle · Kazuhito Koishida · Arthur Bucker · Lawrence Jang · Zheng Hui

Dimensionality Reduction on Complex Vector Spaces for Euclidean Distance with Dynamic Weights

Simone Moretti · Paolo Pellizzoni · Francesco Silvestri

CursorCore: Assist Programming through Aligning Anything

Hao Jiang · Qi Liu · Rui Li · Shengyu Ye · Shijin Wang

Fully Dynamic Embedding into $\ell_p$ Spaces

Kiarash Banihashem · Xiang Chen · MohammadTaghi Hajiaghayi · Sungchul Kim · Kanak Mahadik · Ryan A Rossi · Tong Yu

Understanding the Kronecker Matrix-Vector Complexity of Linear Algebra

Raphael Meyer · William Swartworth · David Woodruff

Square$\chi$PO: Differentially Private and Robust $\chi^2$-Preference Optimization in Offline Direct Alignment

Xingyu Zhou · Yulian Wu · Wenqian Weng · Francesco Orabona

Accelerating Quantum Reinforcement Learning with a Quantum Natural Policy Gradient Based Approach

Yang Xu · Vaneet Aggarwal

Bellman Unbiasedness: Toward Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation

Taehyun Cho · Seungyub Han · Seokhun Ju · Dohyeong Kim · Kyungjae Lee · Jungwoo Lee

Quantum Speedups in Regret Analysis of Infinite Horizon Average-Reward Markov Decision Processes

Bhargav Ganguly · Yang Xu · Vaneet Aggarwal

Rectifying Conformity Scores for Better Conditional Coverage

Vincent Plassier · Alexander Fishkov · Victor Dheur · Mohsen Guizani · Souhaib Ben Taieb · Maxim Panov · Eric Moulines

On Differential Privacy for Adaptively Solving Search Problems via Sketching

Shiyuan Feng · Ying Feng · George Li · Zhao Song · David Woodruff · Lichen Zhang

Matrix Completion with Incomplete Side Information via Orthogonal Complement Projection

Gengshuo Chang · Wei Zhang · Lehan Zhang

$\mathcal{V}ista\mathcal{DPO}$: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models

Haojian Huang · Haodong Chen · Shengqiong Wu · Meng Luo · Jinlan Fu · Xinya Du · Hanwang Zhang · Hao Fei

Generalization Principles for Inference over Text-Attributed Graphs with Large Language Models

Haoyu Wang · Shikun Liu · Rongzhe Wei · Pan Li

Expected Variational Inequalities

Brian Zhang · Ioannis Anagnostides · Emanuel Tewolde · Ratip Emin Berker · Gabriele Farina · Vincent Conitzer · Tuomas Sandholm

Invariant Deep Uplift Modeling for Incentive Assignment in Online Marketing via Probability of Necessity and Sufficiency

Zexu Sun · Qiyu Han · Hao Yang · Anpeng Wu · Minqin Zhu · Dugang Liu · Chen Ma · Yunpeng Weng · Xing Tang · xiuqiang He

AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML

Patara Trirat · Wonyong Jeong · Sung Ju Hwang

AffectGPT: A New Dataset, Model, and Benchmark for Emotion Understanding with Multimodal Large Language Models

Zheng Lian · Haoyu Chen · Lan Chen · Haiyang Sun · Licai Sun · Yong Ren · Zebang Cheng · Bin Liu · Rui Liu · Xiaojiang Peng · Jiangyan Yi · Jianhua Tao

Skip the Equations: Learning Behavior of Personalized Dynamical Systems Directly From Data

Krzysztof Kacprzyk · Julianna Piskorz · Mihaela van der Schaar

Thermalizer: Stable autoregressive neural emulation of spatiotemporal chaos

Chris Pedersen · Laure Zanna · Joan Bruna

Differential Privacy Under Class Imbalance: Methods and Empirical Insights

Lucas Rosenblatt · Yuliia Lut · Ethan Turok · Marco Medina · Rachel Cummings

Sidechain conditioning and modeling for full-atom protein sequence design with FAMPNN

Talal Widatalla · Richard Shuai · Brian Hie · Po-Ssu Huang

Foundation Molecular Grammar: Multi-Modal Foundation Models Induce Interpretable Molecular Graph Languages

Michael Sun · Weize Yuan · Gang Liu · Wojciech Matusik · Jie Chen

Retrieval Augmented Zero-Shot Enzyme Generation for Specified Substrate

Jiahe Du · Kaixiong Zhou · Xinyu Hong · Zhaozhuo Xu · Jinbo Xu · Xiao Huang

LLM-Augmented Chemical Synthesis and Design Decision Programs

Haorui Wang · Jeff Guo · Lingkai Kong · Rampi Ramprasad · Philippe Schwaller · Yuanqi Du · Chao Zhang

Learn Singularly Perturbed Solutions via Homotopy Dynamics

Chuqi CHEN · Yahong Yang · Yang Xiang · Wenrui Hao

Boosting Protein Graph Representations through Static-Dynamic Fusion

Pengkang Guo · Bruno Correia · Pierre Vandergheynst · Daniel Probst

Learning Smooth and Expressive Interatomic Potentials for Physical Property Prediction

Xiang Fu · Brandon Wood · Luis Barroso-Luque · Daniel S. Levine · Meng Gao · Misko Dzamba · Larry Zitnick

Retrieval-Augmented Language Model for Knowledge-aware Protein Encoding

Zhang Jiasheng · Delvin Zhang · Shuang Liang · Zhengpin Li · ZHITAO YING · Jie Shao

A Physics-Augmented Deep Learning Framework for Classifying Single Molecule Force Spectroscopy Data

Cailong Hua · Sivaraman Rajaganapathy · Rebecca Slick · Joseph Vavra · Joseph Muretta · James Ervasti · Murti Salapaka

OmniArch: Building Foundation Model for Scientific Computing

Tianyu Chen · Haoyi Zhou · Ying Li · Hao Wang · Chonghan Gao · Rongye Shi · Shanghang Zhang · Jianxin Li

Sub-Sequential Physics-Informed Learning with State Space Model

Chenhui Xu · Dancheng Liu · Yuting Hu · Jiajie Li · Ruiyang Qin · Qingxiao Zheng · Jinjun Xiong

UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules

Ziyang Yu · Wenbing Huang · Yang Liu

Quadruple Attention in Many-body Systems for Accurate Molecular Property Predictions

Jiahua Rao · Dahao Xu · Wentao Wei · Yicong Chen · Mingjun Yang · Yuedong Yang

Latent Mamba Operator for Partial Differential Equations

Karn Tiwari · Niladri Dutta · N M Anoop Krishnan · Prathosh AP

Piloting Structure-Based Drug Design via Modality-Specific Optimal Schedule

Keyue Qiu · Yuxuan Song · Zhehuan Fan · Peidong Liu · Zhe Zhang · Mingyue Zheng · Hao Zhou · Wei-Ying Ma

CoCoA-Mix: Confusion-and-Confidence-Aware Mixture Model for Context Optimization

Dasol Hong · Wooju Lee · Hyun Myung

Attributes Shape the Embedding Space of Face Recognition Models

Pierrick Leroy · Antonio Mastropietro · Marco Nurisso · Francesco Vaccarino

Agent Workflow Memory

Zhiruo Wang · Jiayuan Mao · Daniel Fried · Graham Neubig

Scaling Large Motion Models with Million-Level Human Motions

Ye Wang · Sipeng Zheng · Bin Cao · Qianshan Wei · Weishuai Zeng · Qin Jin · Zongqing Lu

Componential Prompt-Knowledge Alignment for Domain Incremental Learning

Kunlun Xu · Xu Zou · Gang Hua · Jiahuan Zhou

Task-Gated Multi-Expert Collaboration Network for Degraded Multi-Modal Image Fusion

Yiming Sun · Xin Li · Pengfei Zhu · Qinghua Hu · Dongwei Ren · Huiying Xu · Xinzhong Zhu

Diff-MoE: Diffusion Transformer with Time-Aware and Space-Adaptive Experts

Kun Cheng · Xiao He · Lei Yu · Zhijun Tu · Mingrui Zhu · Nannan Wang · Xinbo Gao · Jie Hu

3D Question Answering via only 2D Vision-Language Models

FENGYUN WANG · Sicheng Yu · Jiawei Wu · Jinhui Tang · Hanwang Zhang · Qianru Sun

ReFrame: Layer Caching for Accelerated Inference in Real-Time Rendering

Lufei Liu · Tor Aamodt

Beyond Cropped Regions: New Benchmark and Corresponding Baseline for Chinese Scene Text Retrieval in Diverse Layouts

Li gengluo · Huawen Shen · Yu ZHOU

UncertainSAM: Fast and Efficient Uncertainty Quantification of the Segment Anything Model

Timo Kaiser · Thomas Norrenbrock · Bodo Rosenhahn

MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost

Sen Xing · Muyan Zhong · Zeqiang Lai · Liangchen Li · Jiawen Liu · Yaohui Wang · Jifeng Dai · Wenhai Wang

Text-to-CAD Generation Through Infusing Visual Feedback in Large Language Models

Ruiyu Wang · Yu Yuan · Shizhao Sun · Jiang Bian

Visual Abstraction: A Plug-and-Play Approach for Text-Visual Retrieval

Guofeng Ding · Yiding Lu · Peng Hu · Mouxing Yang · Yijie Lin · Xi Peng

Visual Graph Arena: Evaluating Visual Conceptualization of Vision and Multimodal Large Language Models

Zahra Babaiee · Peyman M. Kiasari · Daniela Rus · Radu Grosu

Steerable Transformers for Volumetric Data

Soumyabrata Kundu · Risi Kondor

MoMa: Modulating Mamba for Adapting Image Foundation Models to Video Recognition

Yuhuan Yang · Chaofan Ma · Zhenjie Mao · Jiangchao Yao · Ya Zhang · Yanfeng Wang

Event-Customized Image Generation

Zhen Wang · Yilei JIANG · Dong Zheng · Jun Xiao · Long Chen

Probabilistic Interactive 3D Segmentation with Hierarchical Neural Processes

Jie Liu · Pan Zhou · Zehao Xiao · Jiayi Shen · Wenzhe Yin · Jan-jakob Sonke · Efstratios Gavves

Unifying Knowledge from Diverse Datasets to Enhance Spatial-Temporal Modeling: A Granularity-Adaptive Geographical Embedding Approach

Zhigaoyuan Wang · Ying Sun · Hengshu Zhu

Inverse problems with experiment-guided AlphaFold

Sai Advaith Maddipatla · Nadav Bojan · Meital Bojan · Sanketh Vedula · Paul Schanda · Ailie Marx · Alexander Bronstein

Rethink GraphODE Generalization within Coupled Dynamical System

Guancheng Wan · Zijie Huang · Wanjia Zhao · Xiao Luo · Yizhou Sun · Wei Wang

SlimLLM: Accurate Structured Pruning for Large Language Models

Jialong Guo · Xinghao Chen · Yehui Tang · Yunhe Wang

Efficient and Separate Authentication Image Steganography Network

Junchao Zhou · Yao Lu · Jie Wen · Guangming Lu

Subobject-level Image Tokenization

Delong Chen · Samuel Cahyawijaya · Jianfeng Liu · Baoyuan Wang · Pascale FUNG

Complex Wavelet Mutual Information Loss: A Multi-Scale Loss Function for Semantic Segmentation

Renhao Lu

Gamma Distribution PCA-Enhanced Feature Learning for Angle-Robust SAR Target Recognition

Chong Zhang · Peng Zhang · Mengke Li

Beyond the Permutation Symmetry of Transformers: The Role of Rotation for Model Fusion

Binchi Zhang · Zaiyi Zheng · Zhengzhang Chen · Jundong Li

AGAV-Rater: Adapting Large Multimodal Model for AI-Generated Audio-Visual Quality Assessment

Yuqin Cao · Xiongkuo Min · Yixuan Gao · Wei Sun · Guangtao Zhai

Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models

Zehan Wang · Ziang Zhang · Tianyu Pang · Chao Du · Hengshuang Zhao · Zhou Zhao

LieRE: Lie Rotational Positional Encodings

Sophie Ostmeier · Brian Axelrod · Maya Varma · Michael Moseley · Akshay Chaudhari · Curtis Langlotz

DAMA: Data- and Model-aware Alignment of Multi-modal LLMs

Jinda Lu · Junkang Wu · Jinghan Li · Xiaojun Jia · Shuo Wang · Yi-Fan Zhang · Junfeng Fang · Xiang Wang · Xiangnan He

Auto-reconfiguration for Latency Minimization in CPU-based DNN Serving

Ankit Bhardwaj · Amar Phanishayee · Deepak Narayanan · Ryan Stutsman

Cross-Modal Alignment via Variational Copula Modelling

Feng Wu · Tsai Hor Chan · Fuying Wang · Guosheng Yin · Lequan Yu

SAFER: A Calibrated Risk-Aware Multimodal Recommendation Model for Dynamic Treatment Regimes

Yishan Shen · Yuyang Ye · Hui Xiong · Yong Chen

Distribution-aware Fairness Learning in Medical Image Segmentation From A Control-Theoretic Perspective

Yujin Oh · Pengfei Jin · Sangjoon Park · Sekeun Kim · Siyeop yoon · Jin Kim · Kyungsang Kim · Xiang Li · Quanzheng Li

EARTH: Epidemiology-Aware Neural ODE with Continuous Disease Transmission Graph

Guancheng Wan · Zewen Liu · Xiaojun Shan · Max Lau · B. Aditya Prakash · Wei Jin

CFP-Gen: Combinatorial Functional Protein Generation via Diffusion Language Models

Junbo Yin · Chao Zha · Wenjia He · Chencheng Xu · Xin Gao

PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

Sophia Tang · Yinuo Zhang · Pranam Chatterjee, PhD

Protriever: End-to-End Differentiable Protein Homology Search for Fitness Prediction

Ruben Weitzman · Peter Mørch Groth · Lood van Niekerk · Aoi Otani · Yarin Gal · Debora Marks · Pascal Notin

Reconstructing Cell Lineage Trees from Phenotypic Features with Metric Learning

Da Kuang · GuanWen Qiu · Junhyong Kim

LangDAug: Langevin Data Augmentation for Multi-Source Domain Generalization in Medical Image Segmentation

Piyush Lalitkumar Tiwary · Kinjawl Bhattacharyya · Prathosh AP

Gradient-based Explanations for Deep Learning Survival Models

Sophie Hanna Langbein · Niklas Koenen · Marvin N. Wright

Breaking the Barrier of Hard Samples: A Data-Centric Approach to Synthetic Data for Medical Tasks

Maynara de Souza · Cleber Zanchettin

Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling

Jinghan Li · Zhicheng Sun · Yadong Mu

Efficient Robotic Policy Learning via Latent Space Backward Planning

Dongxiu Liu · Haoyi Niu · Zhihao Wang · Jinliang Zheng · Yinan Zheng · Zhonghong Ou · Jianming HU · Jianxiong Li · Xianyuan Zhan

Learning Time-Varying Multi-Region Brain Communications via Scalable Markovian Gaussian Processes

Weihan Li · Yule Wang · Chengrui Li · Anqi Wu

Dynamical Modeling of Behaviorally Relevant Spatiotemporal Patterns in Neural Imaging Data

Mohammad Hosseini · Maryam Shanechi

Scaling Laws for Task-Optimized Models of the Primate Visual Ventral Stream

Abdulkadir Gokce · Martin Schrimpf

BSO: Binary Spiking Online Optimization Algorithm

Yu Liang · Yu Yang · Wenjie Wei · Ammar Belatreche · Shuai Wang · Malu Zhang · Yang Yang

SynEVO: A neuro-inspired spatiotemporal evolutional framework for cross-domain adaptation

jiayue Liu · Zhongchao Yi · Zhengyang Zhou · Qihe Huang · Kuo Yang · Xu Wang · Yang Wang

Promoting Ensemble Diversity with Interactive Bayesian Distributional Robustness for Fine-tuning Foundation Models

Ngoc Quan Pham · Tuan Truong · Quyen Tran · Tan Nguyen · Dinh Phung · Trung Le

Efficient First-Order Optimization on the Pareto Set for Multi-Objective Learning under Preference Guidance

Lisha Chen · Quan Xiao · Ellen Fukuda · Xinyi Chen · Kun Yuan · Tianyi Chen

High-Fidelity Simultaneous Speech-To-Speech Translation

Tom Labiausse · Laurent Mazaré · Edouard Grave · Alexandre Défossez · Neil Zeghidour

Adaptive Elicitation of Latent Information Using Natural Language

Jimmy Wang · Tom Zollo · Richard Zemel · Hongseok Namkoong

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

Li-Wei Chen · Takuya Higuchi · Zakaria Aldeneh · Ahmed Hussen Abdelaziz · Alexander Rudnicky

Synthesizing Privacy-Preserving Text Data via Finetuning *without* Finetuning Billion-Scale LLMs

Bowen Tan · Zheng Xu · Eric Xing · Zhiting Hu · Shanshan Wu

Emotional Face-to-Speech

Jiaxin Ye · Boyuan Cao · Hongming Shan

CoSER: Coordinating LLM-Based Persona Simulation of Established Roles

Xintao Wang · Heng Wang · Yifei Zhang · Xinfeng Yuan · Rui Xu · Jen-Tse Huang · Siyu Yuan · Haoran Guo · Jiangjie Chen · Shuchang Zhou · Wei Wang · Yanghua Xiao

Learning from others' mistakes: Finetuning machine translation models with span-level error annotations

Lily Zhang · Hamid Dadkhahi · Mara Finkelstein · Firas Trabelsi · Jiaming Luo · Markus Freitag

Sortformer: A Novel Approach for Permutation-Resolved Speaker Supervision in Speech-to-Text Systems

Taejin Park · Ivan Medennikov · Kunal Dhawan · Weiqing Wang · He Huang · Nithin Koluguri · Krishna Puvvada · Jagadeesh Balam · Boris Ginsburg

Long-Form Speech Generation with Spoken Language Models

Se Jin Park · Julian Salazar · Aren Jansen · Keisuke Kinoshita · Yong Man Ro · RJ Skerry-Ryan

From Mechanistic Interpretability to Mechanistic Biology: Training, Evaluating, and Interpreting Sparse Autoencoders on Protein Language Models

Etowah Adams · Liam Bai · Minji Lee · Yiyang Yu · Mohammed AlQuraishi

Boosting Masked ECG-Text Auto-Encoders as Discriminative Learners

Hung Manh Pham · Aaqib Saeed · Dong Ma

Domain-Adapted Diffusion Model for PROTAC Linker Design Through the Lens of Density Ratio in Chemical Space

Zixing Song · Ziqiao Meng · Jose Miguel Hernandez-Lobato

SUICA: Learning Super-high Dimensional Sparse Implicit Neural Representations for Spatial Transcriptomics

Qingtian Zhu · Yumin Zheng · Yuling Sang · Yifan Zhan · Ziyan Zhu · Jun Ding · Yinqiang Zheng

DriveGPT: Scaling Autoregressive Behavior Models for Driving

Xin Huang · Eric M. Wolff · Paul Vernaza · Tung Phan-Minh · Hongge Chen · David Hayden · Mark Edmonds · Brian Pierce · Xinxin Chen · Pratik Elias Jacob · Xiaobai Chen · Chingiz Tairbekov · Pratik Agarwal · Tianshi Gao · Yuning Chai · Siddhartha Srinivasa

A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems

Manan Tayal · Aditya Singh · Shishir Nadubettu Yadukumar · Somil Bansal

DiffusionVLA: Scaling Robot Foundation Models via Unified Diffusion and Autoregression

Junjie Wen · Yichen Zhu · Minjie Zhu · Zhibin Tang · Jinming Li · Zhongyi Zhou · Xiaoyu Liu · Chaomin Shen · Yaxin Peng · Feifei Feng

SAM2Act: Integrating Visual Foundation Model with A Memory Architecture for Robotic Manipulation

Haoquan Fang · Markus Grotz · Wilbert Pumacay · Yi Ru Wang · Dieter Fox · Ranjay Krishna · Jiafei Duan

Optimizing Social Network Interventions via Hypergradient-Based Recommender System Design

Marino Kühne · Panagiotis D. Grontas · Giulia De Pasquale · Giuseppe Belgioioso · Florian Dörfler · John Lygeros

Causality-Aware Contrastive Learning for Robust Multivariate Time-Series Anomaly Detection

HyunGi Kim · Jisoo Mok · Dong Jun Lee · Jaihyun Lew · Sungjae Sungjae · Sungroh Yoon

Exploring Representations and Interventions in Time Series Foundation Models

Michal Wilinski · Mononito Goswami · Willa Potosnak · Nina Żukowska · Artur Dubrawski

TimePro: Efficient Multivariate Long-term Time Series Forecasting with Variable- and Time-Aware Hyper-state

Xiaowen Ma · Zhen-Liang Ni · Shuai Xiao · Xinghao Chen

BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modeling

Hao Li · Yu-Hao Huang · Chang Xu · Viktor Schlegel · Renhe Jiang · Riza Batista-Navarro · Goran Nenadic · Jiang Bian

Latent Variable Estimation in Bayesian Black-Litterman Models

Thomas Y.L. Lin · Jerry Yao-Chieh Hu · Wan-Jiun Paul Chiou · Peter Lin

LineFlow: A Framework to Learn Active Control of Production Lines

Kai Müller · Martin Wenzel · Tobias Windisch

COGNATE: Acceleration of Sparse Tensor Programs on Emerging Hardware using Transfer Learning

Chamika Sudusinghe · Gerasimos Gerogiannis · Damitha Lenadora · Charles Block · Josep Torrellas · Charith Mendis

DiMa: Understanding the Hardness of Online Matching Problems via Diffusion Models

Boyu Zhang · Aocheng Shen · Bing Liu · Qiankun Zhang · Bin Yuan · Wang · Shenghao Liu · Xianjun Deng

Chip Placement with Diffusion Models

Vint Lee · Minh Nguyen · Leena Elzeiny · Chun Deng · Pieter Abbeel · Wawrzynek

PARQ: Piecewise-Affine Regularized Quantization

Lisa Jin · Jianhao Ma · Zechun Liu · Andrey Gromov · Aaron Defazio · Lin Xiao

Aligned Multi Objective Optimization

Yonathan Efroni · Ben Kretzu · Daniel Jiang · Jalaj Bhandari · Zheqing Zhu · Karen Ullrich

Towards Understanding Gradient Dynamics of the Sliced-Wasserstein Distance via Critical Point Analysis

Christophe Vauthier · Anna Korba · Quentin Mérigot

Fast Tensor Completion via Approximate Richardson Iteration

Mehrdad Ghadiri · Matthew Fahrbach · Yunbum Kook · Ali Jadbabaie

Toward a Unified Theory of Gradient Descent under Generalized Smoothness

Alexander Tyurin

Online Pre-Training for Offline-to-Online Reinforcement Learning

Yongjae Shin · Jeonghye Kim · Whiyoung Jung · Sunghoon Hong · Deunsol Yoon · Youngsoo Jang · Geon-Hyeong Kim · Jongseong Chae · Youngchul Sung · Kanghoon Lee · Woohyung Lim

Enhancing Diversity In Parallel Agents: A Maximum State Entropy Exploration Story

Vincenzo De Paola · Riccardo Zamboni · Mirco Mutti · Marcello Restelli

SERENA: A Unified Stochastic Recursive Variance Reduced Gradient Framework for Riemannian Non-Convex Optimization

Yan Liu · Mingjie Chen · Chaojie Ji · Hao Zhang · Ruxin Wang

EARL-BO: Reinforcement Learning for Multi-Step Lookahead, High-Dimensional Bayesian Optimization

Mujin Cheon · Jay Lee · Dong-Yeun Koh · Calvin Tsay

Refining Adaptive Zeroth-Order Optimization at Ease

Yao Shu · Qixin Zhang · Kun He · Zhongxiang Dai

BARK: A Fully Bayesian Tree Kernel for Black-box Optimization

Toby Boyne · Jose Pablo Folch · Robert Lee · Behrang Shafei · Ruth Misener

Provable Benefit of Random Permutations over Uniform Sampling in Stochastic Coordinate Descent

Donghwa Kim · Jaewook Lee · Chulhee Yun

A Comprehensive Framework for Analyzing the Convergence of Adam: Bridging the Gap with SGD

Ruinan Jin · Xiao Li · Yaoliang Yu · Baoxiang Wang

The Global Convergence Time of Stochastic Gradient Descent in Non-Convex Landscapes: Sharp Estimates via Large Deviations

Waïss Azizian · Franck Iutzeler · Jérôme Malick · Panayotis Mertikopoulos

Stochastic Smoothed Primal-Dual Algorithms for Nonconvex Optimization with Linear Inequality Constraints

Ruichuan Huang · Jiawei Zhang · Ahmet Alacaoglu

Guarantees of a Preconditioned Subgradient Algorithm for Overparameterized Asymmetric Low-rank Matrix Recovery

Paris Giampouras · HanQin Cai · Rene Vidal

When, Where and Why to Average Weights?

Niccolò Ajroldi · Antonio Orvieto · Jonas Geiping

Improving Generalization in Federated Learning with Highly Heterogeneous Data via Momentum-Based Stochastic Controlled Weight Averaging

Junkang Liu · Yuanyuan Liu · Fanhua Shang · Hongying Liu · Jin Liu · Wei Feng

Shortcut-connected Expert Parallelism for Accelerating Mixture of Experts

Weilin Cai · Juyong Jiang · Le Qin · Junwei Cui · Sunghun Kim · Jiayi Huang

Nesterov Method for Asynchronous Pipeline Parallel Optimization

Thalaiyasingam Ajanthan · Sameera Ramasinghe · Yan Zuo · Gil Avraham · Alexander Long

Breaking Barriers: Combinatorial Algorithms for Non-Monotone Submodular Maximization with Sublinear Adaptivity and $1/e$ Approximation

Yixin Chen · Wenjing Chen · Alan Kuhnle

Edge-Colored Clustering in Hypergraphs: Beyond Minimizing Unsatisfied Edges

Alex Crane · Thomas Stanley · Blair D. Sullivan · Nate Veldt

Faster Global Minimum Cut with Predictions

Helia Niaparast · Benjamin Moseley · Karan Singh

Geometric Algebra Planes: Convex Implicit Neural Volumes

Irmak Sivgin · Sara Fridovich-Keil · Gordon Wetzstein · Mert Pilanci

The Sparse-Plus-Low-Rank Quasi-Newton Method for Entropic-Regularized Optimal Transport

Chenrui Wang · Yixuan Qiu

Scaffold with Stochastic Gradients: New Analysis with Linear Speed-Up

Paul Mangold · Alain Oliviero Durmus · Aymeric Dieuleveut · Eric Moulines

Maximum Total Correlation Reinforcement Learning

Bang You · Puze Liu · Huaping Liu · Jan Peters · Oleg Arenz

Penalizing Infeasible Actions and Reward Scaling in Reinforcement Learning with Offline Data

Jeonghye Kim · Yongjae Shin · Whiyoung Jung · Sunghoon Hong · Deunsol Yoon · Youngchul Sung · Kanghoon Lee · Woohyung Lim

Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning

Zhenghai Xue · Lang Feng · Jiacheng Xu · Kang Kang · xiang wen · Bo An · Shuicheng YAN

Online Laplacian-Based Representation Learning in Reinforcement Learning

Maheed Ahmed · Jayanth Bhargav · Mahsa Ghasemi

Meta-Reinforcement Learning with Adaptation from Human Feedback via Preference-Order-Preserving Task Embedding

Siyuan Xu · Minghui Zhu

Robot-Gated Interactive Imitation Learning with Adaptive Intervention Mechanism

Haoyuan Cai · Zhenghao Peng · Bolei Zhou

Score as Action: Fine Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning

Hanyang Zhao · Haoxian Chen · Ji Zhang · David Yao · Wenpin Tang

Consensus Based Stochastic Optimal Control

Liyao Lyu · Jingrun Chen

RobustLight: Improving Robustness via Diffusion Reinforcement Learning for Traffic Signal Control

Mingyuan Li · Jiahao Wang · Guangsheng Yu · Xu Wang · Qianrun Chen · Wei Ni · Lixiang Li · Haipeng Peng

LMRL Gym: Benchmarks for Multi-Turn Reinforcement Learning with Language Models

Marwa Abdulhai · Isadora White · Charlie Snell · Charles Sun · Joey Hong · Yuexiang Zhai · Kelvin Xu · Sergey Levine

Proto Successor Measure: Representing the Behavior Space of an RL Agent

Siddhant Agarwal · Harshit Sikchi · Peter Stone · Amy Zhang

CLARIFY: Contrastive Preference Reinforcement Learning for Untangling Ambiguous Queries

Ni Mu · Hao Hu · Xiao Hu · Yiqin Yang · Bo XU · Qing-Shan Jia

A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks

Thomas Schmied · Thomas Adler · Vihang Patil · Maximilian Beck · Korbinian Pöppel · Johannes Brandstetter · Günter Klambauer · Razvan Pascanu · Sepp Hochreiter

Flow Q-Learning

Seohong Park · Qiyang Li · Sergey Levine

Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer

Yilun Kong · Guozheng Ma · Qi Zhao · Haoyu Wang · Li Shen · Xueqian Wang · Dacheng Tao

Hierarchical Reinforcement Learning with Uncertainty-Guided Diffusional Subgoals

Vivienne Huiling Wang · Tinghuai Wang · Joni Pajarinen

Efficient Skill Discovery via Regret-Aware Optimization

He ZHANG · Ming Zhou · shaopeng zhai · Ying Sun · Hui Xiong

DIME: Diffusion-Based Maximum Entropy Reinforcement Learning

Onur Celik · Zechu Li · Denis Blessing · Ge Li · Daniel Palenicek · Jan Peters · Georgia Chalvatzaki · Gerhard Neumann

Comparing Comparisons: Informative and Easy Human Feedback with Distinguishability Queries

Xuening Feng · Zhaohui Jiang · Timo Kaufmann · Eyke Hüllermeier · Paul Weng · Yifei Zhu

The Courage to Stop: Overcoming Sunk Cost Fallacy in Deep Reinforcement Learning

Jiashun Liu · Johan Obando-Ceron · Pablo Samuel Castro · Aaron Courville · Ling Pan

Generalization Analysis for Controllable Learning

Yi-Fan Zhang · Xiao Zhang · Min-Ling Zhang

Graph Attention is Not Always Beneficial: A Theoretical Analysis of Graph Attention Mechanisms via Contextual Stochastic Block Models

Zhongtian Ma · Qiaosheng Zhang · Bocheng Zhou · Yexin Zhang · Shuyue Hu · Zhen Wang

Mastering Multiple-Expert Routing: Realizable $H$-Consistency and Strong Guarantees for Learning to Defer

Anqi Mao · Mehryar Mohri · Yutao Zhong

Learning Configurations for Data-Driven Multi-Objective Optimization

Zhiyang Chen · Hailong Yao · Xia Yin

Anytime-Constrained Equilibria in Polynomial Time

Jeremy McMahan

Continuous-Time Analysis of Heavy Ball Momentum in Min-Max Games

Yi Feng · Kaito Fujii · EFSTRATIOS PANTELEIMON SKOULAKIS · Xiao Wang · Volkan Cevher

A Closer Look at Multimodal Representation Collapse

Abhra Chaudhuri · Anjan Dutta · Tu Bui · Serban Georgescu

A Theoretical Study of (Hyper) Self-Attention through the Lens of Interactions: Representation, Training, Generalization

Muhammed Ustaomeroglu · Guannan Qu

Improved Expressivity of Hypergraph Neural Networks through High-Dimensional Generalized Weisfeiler-Leman Algorithms

Detian Zhang · Zhang Chengqiang · Yanghui Rao · Qing Li · Chunjiang Zhu

Propagation of Chaos for Mean-Field Langevin Dynamics and its Application to Model Ensemble

Atsushi Nitanda · Anzelle Lee · Damian Kai · Mizuki Sakaguchi · Taiji Suzuki

Universal Length Generalization with Turing Programs

Kaiying Hou · David Brandfonbrener · Sham Kakade · Samy Jelassi · Eran Malach

Grokking Beyond the Euclidean Norm of Model Parameters

Pascal Jr Tikeng Notsawo · Guillaume Dumas · Guillaume Rabusseau

Sharp Optimality of Simple, Plug-in Estimation of the Fisher Information of a Smoothed Density

Subhodh Kotekal

Towards Better-than-2 Approximation for Constrained Correlation Clustering

Andreas Kalavas · Evangelos Kipouridis · Nithin Varma

Empirical Design in Reinforcement Learning

Andrew Patterson · Samuel F Neumann · Martha White · Adam White

Improving the Continuity of Goal-Achievement Ability via Policy Self-Regularization for Goal-Conditioned Reinforcement Learning

Xudong Gong · Sen Yang · Feng Dawei · Kele Xu · Bo Ding · Huaimin Wang · Yong Dou

Power Mean Estimation in Stochastic Continuous Monte-Carlo Tree Search

Tuan Dam

Finite-Time Global Optimality Convergence in Deep Neural Actor-Critic Methods for Decentralized Multi-Agent Reinforcement Learning

Zhiyao Zhang · Myeung Suk Oh · Hairi · Ziyue Luo · Alvaro Velasquez · Jia (Kevin) Liu

Sable: a Performant, Efficient and Scalable Sequence Model for MARL

Omayma Mahjoub · Sasha Abramowitz · Ruan de Kock · Wiem Khlifi · Simon Du Toit · Jemma Daniel · Louay Nessir · Louise Beyers · Juan Formanek · Liam Clark · Arnu Pretorius

Zero Shot Generalization of Vision-Based RL Without Data Augmentation

Sumeet Batra · Gaurav Sukhatme

Efficient Multivariate Robust Mean Estimation Under Mean-Shift Contamination

Ilias Diakonikolas · Giannis Iakovidis · Daniel Kane · Thanasis Pittas

Understanding the Statistical Accuracy-Communication Trade-off in Personalized Federated Learning with Minimax Guarantees

Xin Yu · Zelin He · Ying Sun · Lingzhou Xue · Runze Li

A Theory for Conditional Generative Modeling on Multiple Data Sources

Rongzhen Wang · Yan Zhang · Chenyu Zheng · Chongxuan Li · Guoqiang Wu

Provable Efficiency of Guidance in Diffusion Models for General Data Distribution

Gen Li · Yuchen Jiao

Towards Understanding Catastrophic Forgetting in Two-layer Convolutional Neural Networks

Boqi Li · Youjun Wang · Weiwei Liu

A Unified View on Learning Unnormalized Distributions via Noise-Contrastive Estimation

Jongha (Jon) Ryu · Abhin Shah · Gregory Wornell

Grokking at the Edge of Linear Separability

Alon Beck · Noam Levi · Yohai Bar-Sinai

Policy-Regret Minimization in Markov Games with Function Approximation

Thanh Nguyen-Tang · Raman Arora

Nonlinear transformers can perform inference-time feature learning

Naoki Nishikawa · Yujin Song · Kazusato Oko · Denny Wu · Taiji Suzuki

Constrained Online Convex Optimization with Polyak Feasibility Steps

Spencer Hutchinson · Mahnoosh Alizadeh

Connecting Thompson Sampling and UCB: Towards More Efficient Trade-offs Between Privacy and Regret

Bingshan Hu · Zhiming Huang · Tianyue Zhang · Mathias Lécuyer · Nidhi Hegde

Prediction-Aware Learning in Multi-Agent Systems

Aymeric Capitaine · Etienne Boursier · Eric Moulines · Michael Jordan · Alain Oliviero Durmus

Regret-Free Reinforcement Learning for Temporal Logic Specifications

R Majumdar · Mahmoud Salamati · Sadegh Soudjani

Dueling Convex Optimization with General Preferences

Aadirupa Saha · Tomer Koren · Yishay Mansour

Geometric Resampling in Nearly Linear Time for Follow-the-Perturbed-Leader with Best-of-Both-Worlds Guarantee in Bandit Problems

Botao Chen · Jongyeong Lee · Junya Honda

Online Episodic Convex Reinforcement Learning

Bianca Marin Moreno · Khaled Eldowa · Pierre Gaillard · Margaux Brégère · Nadia Oudjane

On Mitigating Affinity Bias through Bandits with Evolving Biased Feedback

Matthew Faw · Constantine Caramanis · Jessica Hoffmann

High-Dimensional Prediction for Sequential Decision Making

Georgy Noarov · Ramya Ramalingam · Aaron Roth · Stephan Xie

Improved Regret Analysis in Gaussian Process Bandits: Optimality for Noiseless Reward, RKHS norm, and Non-Stationary Variance

Shogo Iwazaki · Shion Takeno

Generalization of noisy SGD in unbounded non-convex settings

Leello Dadi · Volkan Cevher

A Parameter-Free and Near-Optimal Zeroth-Order Algorithm for Stochastic Convex Optimization

Kunjie Ren · Luo Luo

Go to Event Page

Social

Navigating Generative AI and LLMs Across Languages

Kristina Nasr · Nikka Mofid

7:00 PM - 9:00 PM

This is a unique platform for researchers, developers, and enthusiasts to forge new collaborations, share knowledge, and discuss open research questions. Whether you are actively shaping the future of multilingual AI, curious about its global impact, or seeking to connect with peers facing similar challenges, this social offers a fun and dynamic space for collective learning and sparking solutions towards building more inclusive and effective AI systems for everyone.

... more

Social

Agents and Safety

Ekaterina Artemova · Alexander Borodetskiy · Ksenia Peresvetova · Elizaveta Yoshida

7:00 PM - 9:00 PM

This social brings together AI practitioners focused on agent development and AI safety to address the unique risks these agents pose, such as misuse, unintended actions, and adversarial attacks, which traditional security models often fail to mitigate. The event will explore both development-phase safeguards and post-deployment evaluation strategies, including red teaming, automated testing, monitoring, and human-in-the-loop assessments. In the first part, expert speakers will share real-world cases and technical insights into current safety challenges and solutions. In the second part, attendees will engage in open discussions to exchange ideas and propose new directions for ensuring that increasingly autonomous agents remain safe, reliable, and aligned with human values. The goal is to foster collaboration and innovation toward building trustworthy AI systems.

... more

Social

co&co x Vector Institute- AI Career Compass: Navigating Career Paths from Opportunities to Understanding Your Market Value as an AI Researcher

Johannah Thumb · Nicole Bannon

7:00 PM - 9:00 PM

Most AI researchers entering the job market are unsure about what career paths to pursue and have little visibility into their true market value and even less guidance on how to advocate for it.

This interactive social combines career exploration with compensation mastery for the AI/ML community. Discover diverse career pathways while learning to identify and negotiate your true market value in today's competitive landscape.

Whether you're getting ready for your next internship, exploring full-time roles in academia or industry, or negotiating a raise or promotion, this session will help you map your career path, identify your market value, and claim it.

Attendees will walk away feeling more confident and informed and better equipped to advocate for their worth.

Takeaways:

- Concrete job search and interview guidance including the STAR method for presenting research

- Insider knowledge on AI/ML compensation and negotiation strategies

- Real stories from researchers and industry professionals across sectors sharing their career journeys and tips for success

About the Speakers:

Nicole Bannon is the founder of co&co, a strategic communications and negotiation consultancy for technical talent. She has coached 500+ AI researchers and engineers through high-stakes negotiations, helping clients land offers at OpenAI, DeepMind, Meta, Anthropic, and more — including comp packages up to $$7.4M/year.

Nicole has given talks (like this one) at major conferences 10+ times, including ICML 2024 (400+ attendees), NeurIPS, CVPR, ACL, ICLR, and the Grace Hopper Celebration over 2022-2025. She’s partnered with Black in AI, Women in Machine Learning, Women in Computer Science, and other affinity groups to make negotiation education more inclusive and accessible across the field.

---

Johannah Thumb is the Manager, Student Engagement and Research Programming at the Vector Institute, where she spearheads workforce development initiatives and research programming to support student and researcher development. She collaborates with academic and industry partners to align programming with workforce needs and expand research and training opportunities for emerging AI talent. Her leadership extends to high-impact events that cultivate a thriving AI community by connecting emerging professionals with peers, mentors, and industry experts. Johannah also curates professional development programming to equip students in achieving their dream roles in AI. With a strong commitment to inclusivity in the field, she is dedicated to shaping a diverse and skilled next generation of AI researchers and professionals.

Track Record & Demand:
This session builds on a series of well-attended “Know Your Market Value” events hosted at NeurIPS, ICML, CVPR, ACL, and ICLR, each drawing 150–400+ attendees.

... more

Social

Queer in AI

Claas Voelcker · Michelle Lin

7:00 PM - 9:00 PM

Main Navigation

ICML Lounge Area

Registration East

Registration West

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

Exhibits

WiML

Oral 3D Optimization

Oral 3B Representations 1

Oral 3E Causality and Domain Generalization

Oral 3A Reasoning

Oral 3C Data-Centric ML

Poster Session 3 West

Poster Session 3 East

Adaptive Alignment: Designing AI for a Changing World - Frauke Kreuter

Oral 4C Privacy and Uncertainty Quantification

Oral 4E Algorithms

Oral 4D Applications in Science and Language

Oral 4B Positions: Generative AI Evaluation

Oral 4A Representations 2

Poster Session 4 East

Poster Session 4 West

Navigating Generative AI and LLMs Across Languages

Agents and Safety

co&co x Vector Institute- AI Career Compass: Navigating Career Paths from Opportunities to Understanding Your Market Value as an AI Researcher

Queer in AI