ICML 2024 Wednesday 07/24

Timezone: Europe/Vienna

Full Schedule Sun 7/21 Mon 7/22 Tue 7/23 Wed 7/24 Thu 7/25 Fri 7/26 Sat 7/27

Registration Desk

Registration

8:30 AM - 6:00 PM

Invited Talk

Gondzo - Charting a Path for African Low-Resource Languages: A Multifaceted Approach to Research and Development

Vukosi Marivate

9:00 AM - 10:00 AM

Speaker Bio

Prof Vukosi Marivate is an Associate Professor of Computer Science and holds the ABSA UP Chair of Data Science at the University of Pretoria. He specialises in developing Machine Learning (ML) and Artificial Intelligence (AI) methods to extract insights from data, with a particular focus on the intersection of ML/AI and Natural Language Processing (NLP). His research is dedicated to improving the methods, tools and availability of data for local or low-resource languages. As the leader of the [Data Science for Social Impact research group](https://dsfsi.github.io/) in the Computer Science department, Vukosi is interested in using data science to solve social challenges. He has worked on projects related to science, energy, public safety, and utilities, among others. Prof Marivate is a co-founder of [Lelapa AI](https://lelapa.ai/), an African startup focused on AI for Africans by Africans. Vukosi is co-founder and advisor to [Masakhane Research Foundation](https://www.masakhane.io/), which aims to develop NLP technologies for African languages. Vukosi is also a co-founder of the [Deep Learning Indaba](https://deeplearningindaba.com/), the leading grassroots Machine Learning and Artificial Intelligence conference on the African continent that aims to empower and support African researchers and practitioners in the field.

... more

Affinity Event

Women in Machine Learning (WiML) Symposium at ICML 2024

Caroline Weis · Tatjana Chavdarova · Mandana Samiei

9:00 AM - 4:00 PM

The Women in Machine Learning (WiML) workshop was founded in 2006 to forge connections within the relatively small community of women working in machine learning, to encourage mentorship and exchange of ideas, and to promote communication. This year, we aim to focus particularly on the elements that have driven high participant interaction and networking based on our experience from past WiML events, while keeping the program shorter. Instead of the participant-led breakout sessions, the invited speakers and/or panelists will lead a Q&A/breakout session, occurring in parallel to each other in a 1-hour time-slot. The idea is that after participants have heard about a topic from the respective talk, there will be more questions and engagements. In addition to the short talks and parallel Q&A sessions, the program will include mentoring and career roundtables and panel discussions.To indicate the change to a shorter program and emphasize the more interactive format, we are planning to rebrand the next iteration of this workshop. We would like to organize the first “WiML Symposium” at the ICML 2024 conference.

... more

Oral

Oral 3F Causality

10:30 AM - 11:30 AM

4 Events in this session

Doubly Robust Causal Effect Estimation under Networked Interference via Targeted Learning

Weilin Chen · Ruichu Cai · Zeqin Yang · Jie Qiao · Yuguang Yan · Zijian Li · Zhifeng Hao

Hybrid$^2$ Neural ODE Causal Modeling and an Application to Glycemic Response

Junyi Zou · Matthew Levine · Dessi Zaharieva · Ramesh Johari · Emily Fox

Inferring the Long-Term Causal Effects of Long-Term Treatments from Short-Term Experiments

Allen Tran · Aurelien Bibaut · Nathan Kallus

ACE: Off-Policy Actor-Critic with Causality-Aware Entropy Regularization

Tianying Ji · Yongyuan Liang · Yan Zeng · Yu Luo · Guowei Xu · Jiawei Guo · Ruijie Zheng · Furong Huang · Fuchun Sun · Huazhe Xu

Go to Event Page

Oral

Oral 3D Probabilistic Inference

10:30 AM - 11:30 AM

4 Events in this session

Active Statistical Inference

Tijana Zrnic · Emmanuel J Candes

Sparse Inducing Points in Deep Gaussian Processes: Enhancing Modeling with Denoising Diffusion Variational Inference

JIAN XU · Delu Zeng · John Paisley

Probabilistic Generating Circuits - Demystified

Sanyam Agarwal · Markus Bläser

Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo

Stephen Zhao · Rob Brekelmans · Alireza Makhzani · Roger Grosse

Go to Event Page

Oral

Oral 3B Diffusion Models

10:30 AM - 11:30 AM

4 Events in this session

Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution

Aaron Lou · Chenlin Meng · Stefano Ermon

Mean-field Chaos Diffusion Models

Sungwoo Park · Dongjun Kim · Ahmed Alaa

NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models

Zeqian Ju · Yuancheng Wang · Kai Shen · Xu Tan · Detai Xin · Dongchao Yang · Eric Liu · Yichong Leng · Kaitao Song · Siliang Tang · Zhizheng Wu · Tao Qin · Xiangyang Li · Wei Ye · Shikun Zhang · Jiang Bian · Lei He · Jinyu Li · sheng zhao

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Patrick Esser · Sumith Kulal · Andreas Blattmann · Rahim Entezari · Jonas Müller · Harry Saini · Yam Levi · Dominik Lorenz · Axel Sauer · Frederic Boesel · Dustin Podell · Tim Dockhorn · Zion English · Robin Rombach

Go to Event Page

Oral

Oral 3C LLMs: Code and Arithmetic

10:30 AM - 11:30 AM

4 Events in this session

Chain of Code: Reasoning with a Language Model-Augmented Code Emulator

Chengshu Li · Jacky Liang · Andy Zeng · Xinyun Chen · Karol Hausman · Dorsa Sadigh · Sergey Levine · Li Fei-Fei · Fei Xia · brian ichter

SceneCraft: An LLM Agent for Synthesizing 3D Scenes as Blender Code

ziniu hu · Ahmet Iscen · Aashi Jain · Thomas Kipf · Yisong Yue · David Ross · Cordelia Schmid · Alireza Fathi

Interpreting and Improving Large Language Models in Arithmetic Calculation

Wei Zhang · Wan Chaoqun · Yonggang Zhang · Yiu Ming Cheung · Xinmei Tian · Xu Shen · Jieping Ye

Evaluation of LLMs on Syntax-Aware Code Fill-in-the-Middle Tasks

Linyuan Gong · Sida Wang · Mostafa Elhoushi · Alvin Cheung

Go to Event Page

Oral

Oral 3A Reinforcement Learning 1

10:30 AM - 11:30 AM

4 Events in this session

Position: Automatic Environment Shaping is the Next Frontier in RL

Younghyo Park · Gabriel Margolis · Pulkit Agrawal

Pausing Policy Learning in Non-stationary Reinforcement Learning

Hyunin Lee · Ming Jin · Javad Lavaei · Somayeh Sojoudi

OMPO: A Unified Framework for RL under Policy and Dynamics Shifts

Yu Luo · Tianying Ji · Fuchun Sun · Jianwei Zhang · Huazhe Xu · Xianyuan Zhan

Online Matching with Stochastic Rewards: Provable Better Bound via Adversarial Reinforcement Learning

Qiankun Zhang · Aocheng Shen · Boyu Zhang · Hanrui Jiang · Bingqian Du

Go to Event Page

Oral

Oral 3E Data and Society

10:30 AM - 11:30 AM

4 Events in this session

Position: Measure Dataset Diversity, Don't Just Claim It

Dora Zhao · Jerone Andrews · Orestis Papakyriakopoulos · Alice Xiang

Rethinking Data Shapley for Data Selection Tasks: Misleads and Merits

Jiachen Wang · Tianji Yang · James Zou · Yongchan Kwon · Ruoxi Jia

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Weixin Liang · Zachary Izzo · Yaohui Zhang · Haley Lepp · Hancheng Cao · Xuandong Zhao · Lingjiao Chen · Haotian Ye · Sheng Liu · Zhi Huang · Daniel McFarland · James Zou

Differentiable Mapper for Topological Optimization of Data Representation

Ziyad Oulhaj · Mathieu Carrière · Bertrand Michel

Go to Event Page

Poster

Poster Session 3

11:30 AM - 1:00 PM

449 Events in this session

BLO-SAM: Bi-level Optimization Based Finetuning of the Segment Anything Model for Overfitting-Preventing Semantic Segmentation

Li Zhang · Youwei Liang · Ruiyi Zhang · Amirhosein Javadi · Pengtao Xie

Exploiting Code Symmetries for Learning Program Semantics

Kexin Pei · Weichen Li · Qirui Jin · Shuyang Liu · Scott Geng · Lorenzo Cavallaro · Junfeng Yang · Suman Jana

Be Your Own Neighborhood: Detecting Adversarial Examples by the Neighborhood Relations Built on Self-Supervised Learning

Zhiyuan He · Yijun Yang · Pin-Yu Chen · Qiang Xu · Tsung-Yi Ho

Ensemble Pruning for Out-of-distribution Generalization

Fengchun Qiao · Xi Peng

An Unsupervised Approach for Periodic Source Detection in Time Series

Berken Utku Demirel · Christian Holz

Beyond Individual Input for Deep Anomaly Detection on Tabular Data

Hugo Thimonier · Fabrice Popineau · Arpad Rimmel · Bich-Liên DOAN

Exploring the Low-Pass Filtering Behavior in Image Super-Resolution

Haoyu Deng · Zijing Xu · Yule Duan · Xiao Wu · Wen-Jie Shu · Liang-Jian Deng

Achieving Lossless Gradient Sparsification via Mapping to Alternative Space in Federated Learning

Do-Yeon Kim · Dong-Jun Han · Jun Seo · Jaekyun Moon

Asymptotics of feature learning in two-layer networks after one gradient-step

Hugo Cui · Luca Pesce · Yatin Dandi · FLORENT KRZAKALA · Yue Lu · Lenka Zdeborova · Bruno Loureiro

No Free Prune: Information-Theoretic Barriers to Pruning at Initialization

Tanishq Kumar · Kevin Luo · Mark Sellke

Towards Theoretical Understandings of Self-Consuming Generative Models

Shi Fu · Sen Zhang · Yingjie Wang · Xinmei Tian · Dacheng Tao

MagicPose: Realistic Human Poses and Facial Expressions Retargeting with Identity-aware Diffusion

Di Chang · Yichun Shi · Quankai Gao · Hongyi Xu · Jessica Fu · Guoxian Song · Qing Yan · Yizhe Zhu · Xiao Yang · Mohammad Soleymani

The Benefits of Reusing Batches for Gradient Descent in Two-Layer Networks: Breaking the Curse of Information and Leap Exponents

Yatin Dandi · Emanuele Troiani · Luca Arnaboldi · Luca Pesce · Lenka Zdeborova · FLORENT KRZAKALA

Catapults in SGD: spikes in the training loss and their impact on generalization through feature learning

Libin Zhu · Chaoyue Liu · Adityanarayanan Radhakrishnan · Misha Belkin

How Spurious Features are Memorized: Precise Analysis for Random and NTK Features

Simone Bombari · Marco Mondelli

The Illusion of State in State-Space Models

William Merrill · Jackson Petty · Ashish Sabharwal

Integrating Multimodal Data for Joint Generative Modeling of Complex Dynamics

Manuel Brenner · Florian Hess · Georgia Koppe · Daniel Durstewitz

Neural Jump-Diffusion Temporal Point Processes

Shuai Zhang · Chuan Zhou · Yang Liu · PENG ZHANG · Xixun Lin · Zhiming Ma

Graph-based Forecasting with Missing Data through Spatiotemporal Downsampling

Ivan Marisca · Cesare Alippi · Filippo Maria Bianchi

Amortized Equation Discovery in Hybrid Dynamical Systems

Yongtuo Liu · Sara Magliacane · Miltiadis (Miltos) Kofinas · Efstratios Gavves

Scale-Free Image Keypoints Using Differentiable Persistent Homology

Giovanni Barbarani · Francesco Vaccarino · Gabriele Trivigno · Marco Guerra · Gabriele Berton · Carlo Masone

Gradient-based Visual Explanation for Transformer-based CLIP

Chenyang ZHAO · Kun Wang · Xingyu Zeng · Rui Zhao · Antoni Chan

EvTexture: Event-driven Texture Enhancement for Video Super-Resolution

Dachun Kai · Jiayao Lu · Yueyi Zhang · Xiaoyan Sun

DeCoOp: Robust Prompt Tuning with Out-of-Distribution Detection

Zhi Zhou · Ming Yang · Jiang-Xin Shi · Lan-Zhe Guo · Yu-Feng Li

Beyond Sole Strength: Customized Ensembles for Generalized Vision-Language Models

Zhihe Lu · Jiawang Bai · Xin Li · Zeyu Xiao · Xinchao Wang

Towards Unified Multi-granularity Text Detection with Interactive Attention

Xingyu Wan · Chengquan Zhang · Pengyuan Lyu · Sen Fan · Zihan Ni · Kun Yao · Errui Ding · Jingdong Wang

PointMC: Multi-instance Point Cloud Registration based on Maximal Cliques

Yue Wu · Xidao hu · Yongzhe Yuan · Xiaolong Fan · Maoguo Gong · Hao Li · Mingyang Zhang · Qiguang Miao · Wenping Ma

Drug Discovery with Dynamic Goal-aware Fragments

Seul Lee · Seanie Lee · Kenji Kawaguchi · Sung Ju Hwang

Generative Flows on Discrete State-Spaces: Enabling Multimodal Flows with Applications to Protein Co-Design

Andrew Campbell · Jason Yim · Regina Barzilay · Tom Rainforth · Tommi Jaakkola

Faster Sampling via Stochastic Gradient Proximal Sampler

Xunpeng Huang · Difan Zou · Hanze Dong · Yian Ma · Tong Zhang

A New Branch-and-Bound Pruning Framework for $\ell_0$-Regularized Problems

Guyard Theo · Cédric Herzet · Clément Elvira · Ayse-Nur Arslan

High-Probability Bound for Non-Smooth Non-Convex Stochastic Optimization with Heavy Tails

Langqi Liu · Yibo Wang · Lijun Zhang

Riemannian coordinate descent algorithms on matrix manifolds

Andi Han · Pratik Kumar Jawanpuria · Bamdev Mishra

Supervised Matrix Factorization: Local Landscape Analysis and Applications

Joowon Lee · Hanbaek Lyu · Weixin Yao

Symmetric Matrix Completion with ReLU Sampling

Huikang Liu · Peng Wang · Longxiu Huang · Qing Qu · Laura Balzano

Exponential Spectral Pursuit: An Effective Initialization Method for Sparse Phase Retrieval

Mengchu Xu · Zhang Yuxuan · Jian Wang

Spectral Preconditioning for Gradient Methods on Graded Non-convex Functions

Nikita Doikov · Sebastian Stich · Martin Jaggi

MADA: Meta-Adaptive Optimizers Through Hyper-Gradient Descent

Kaan Ozkara · Can Karakus · Parameswaran Raman · Mingyi Hong · Shoham Sabach · Branislav Kveton · Volkan Cevher

MALIBO: Meta-learning for Likelihood-free Bayesian Optimization

Jiarong Pan · Stefan Falkner · Felix Berkenkamp · Joaquin Vanschoren

Interaction-based Retrieval-augmented Diffusion Models for Protein-specific 3D Molecule Generation

Zhilin Huang · Ling Yang · Xiangxin Zhou · Chujun Qin · Yijie Yu · Xiawu Zheng · Zikun Zhou · Wentao Zhang · Yu Wang · Wenming Yang

PDHG-Unrolled Learning-to-Optimize Method for Large-Scale Linear Programming

Bingheng Li · Linxin Yang · Yupeng Chen · Senmiao Wang · Haitao Mao · Qian Chen · Yao Ma · Akang Wang · Tian Ding · Jiliang Tang · Ruoyu Sun

Consistent Submodular Maximization

PAUL DUETTING · Federico Fusco · Silvio Lattanzi · Ashkan Norouzi-Fard · Morteza Zadimoghaddam

LPGD: A General Framework for Backpropagation through Embedded Optimization Layers

Anselm Paulus · Georg Martius · Vit Musil

Differentiable Mapper for Topological Optimization of Data Representation

Ziyad Oulhaj · Mathieu Carrière · Bertrand Michel

Learning Associative Memories with Gradient Descent

Vivien Cabannnes · Berfin Simsek · Alberto Bietti

Differentiable Model Scaling using Differentiable Topk

Kai Liu · Ruohui Wang · Jianfei Gao · Kai Chen

Neural NeRF Compression

Tuan Pham · Stephan Mandt

One Meta-tuned Transformer is What You Need for Few-shot Learning

Xu Yang · Huaxiu Yao · Ying WEI

Equivariant Diffusion for Crystal Structure Prediction

Peijia Lin · Pin Chen · Rui Jiao · Qing Mo · Jianhuan Cen · Wenbing Huang · Yang Liu · Dan Huang · Yutong Lu

FAFE: Immune Complex Modeling with Geodesic Distance Loss on Noisy Group Frames

Ruidong Wu · Ruihan Guo · Rui Wang · Shitong Luo · Xu Yue · Jiahan Li · Jianzhu Ma · qiang liu · Yunan Luo · Jian Peng

Antibody Design Using a Score-based Diffusion Model Guided by Evolutionary, Physical and Geometric Constraints

Tian Zhu · Milong Ren · Haicang Zhang

CLIPZyme: Reaction-Conditioned Virtual Screening of Enzymes

Peter Mikhael · Itamar Chinn · Regina Barzilay

Actions Speak Louder than Words: Trillion-Parameter Sequential Transducers for Generative Recommendations

Jiaqi Zhai · Yunxing Liao · Xing Liu · Yueming Wang · Rui Li · Xuan Cao · Yazhi Gao · Zhaojie Gong · Fangda Gu · Michael He · Yinghai Lu · Yu Shi

SuDA: Support-based Domain Adaptation for Sim2Real Hinge Joint Tracking with Flexible Sensors

Fang Jiawei · Haishan Song · Chengxu Zuo · xiaoxia gao · Xiaowei Chen · Guo Shihui · Yipeng Qin

Polygonal Unadjusted Langevin Algorithms: Creating stable and efficient adaptive algorithms for neural networks

Dongyoung Lim · Sotirios Sabanis

Promoting External and Internal Equities Under Ex-Ante/Ex-Post Metrics in Online Resource Allocation

Karthik Abinav Sankararaman · Aravind Srinivasan · Pan Xu

Offline Multi-Objective Optimization

Ke Xue · Rong-Xi Tan · Xiaobin Huang · Chao Qian

Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark

Yihua Zhang · Pingzhi Li · Junyuan Hong · Jiaxiang Li · Yimeng Zhang · Wenqing Zheng · Pin-Yu Chen · Jason Lee · Wotao Yin · Mingyi Hong · Zhangyang “Atlas” Wang · Sijia Liu · Tianlong Chen

Variance-reduced Zeroth-Order Methods for Fine-Tuning Language Models

Tanmay Gautam · Youngsuk Park · Hao Zhou · Parameswaran Raman · Wooseok Ha

Bayesian Optimization of Function Networks with Partial Evaluations

Poompol Buathong · Jiayue Wan · Raul Astudillo · Samuel Daulton · Maximilian Balandat · Peter Frazier

Dynamic Byzantine-Robust Learning: Adapting to Switching Byzantine Workers

Ron Dorfman · Naseem Yehya · Kfir Levy

Accelerating Federated Learning with Quick Distributed Mean Estimation

Ran Ben Basat · Shay Vargaftik · Amit Portnoy · Gil Einziger · Yaniv Ben Itzhak · Michael Mitzenmacher

FADAS: Towards Federated Adaptive Asynchronous Optimization

Yujia Wang · Shiqiang Wang · Songtao Lu · Jinghui Chen

Integrated Hardware Architecture and Device Placement Search

Irene Wang · Jakub Tarnawski · Amar Phanishayee · Divya Mahajan

Recurrent Early Exits for Federated Learning with Heterogeneous Clients

Royson Lee · Javier Fernandez-Marques · Xu Hu · Da Li · Stefanos Laskaridis · Łukasz Dudziak · Timothy Hospedales · Ferenc Huszár · Nicholas Lane

Quantum Theory and Application of Contextual Optimal Transport

Nicola Mariella · Albert Akhriev · Francesco Tacchino · Christa Zoufal · Juan Gonzalez-Espitia · Benedek Harsanyi · Eugene Koskin · Ivano Tavernelli · Stefan Woerner · Marianna Rapsomaniki · Sergiy Zhuk · Jannis Born

ACE: Off-Policy Actor-Critic with Causality-Aware Entropy Regularization

Tianying Ji · Yongyuan Liang · Yan Zeng · Yu Luo · Guowei Xu · Jiawei Guo · Ruijie Zheng · Furong Huang · Fuchun Sun · Huazhe Xu

ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive Advantages

Andrew Jesson · Christopher Lu · Gunshi Gupta · Nicolas Beltran-Velez · Angelos Filos · Jakob Foerster · Yarin Gal

Risk Aware Benchmarking of Large Language Models

Apoorva Nitsure · Youssef Mroueh · Mattia Rigotti · Kristjan Greenewald · Brian Belgodere · Mikhail Yurochkin · Jiri Navratil · Igor Melnyk · Jarret Ross

Acquiring Diverse Skills using Curriculum Reinforcement Learning with Mixture of Experts

Onur Celik · Aleksandar Taranovic · Gerhard Neumann

Rich-Observation Reinforcement Learning with Continuous Latent Dynamics

Yuda Song · Lili Wu · Dylan Foster · Akshay Krishnamurthy

Learning Causal Dynamics Models in Object-Oriented Environments

Zhongwei Yu · Jingqing Ruan · Dengpeng Xing

Just Cluster It: An Approach for Exploration in High-Dimensions using Clustering and Pre-Trained Representations

Stefan Sylvius Wagner Martinez · Stefan Harmeling

Bridging Environments and Language with Rendering Functions and Vision-Language Models

Théo Cachet · Christopher Dance · Olivier Sigaud

SiT: Symmetry-invariant Transformers for Generalisation in Reinforcement Learning

Matthias Weissenbacher · Rishabh Agarwal · Yoshinobu Kawahara

Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learning

Donghu Kim · Hojoon Lee · Kyungmin Lee · Dongyoon Hwang · Jaegul Choo

Trust the Model Where It Trusts Itself - Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption

Bernd Frauenknecht · Artur Eisele · Devdutt Subhasish · Friedrich Solowjow · Sebastian Trimpe

Breadth-First Exploration on Adaptive Grid for Reinforcement Learning

Youngsik Yoon · Gangbok Lee · Sungsoo Ahn · Jungseul Ok

Enhancing Value Function Estimation through First-Order State-Action Dynamics in Offline Reinforcement Learning

Yun-Hsuan Lien · Ping-Chun Hsieh · Tzu-Mao Li · Yu-Shuen Wang

Combining Experimental and Historical Data for Policy Evaluation

Ting Li · Chengchun Shi · Qianglin Wen · Yang Sui · Yongli Qin · Chunbo Lai · Hongtu Zhu

In-Context Decision Transformer: Reinforcement Learning via Hierarchical Chain-of-Thought

sili huang · Jifeng Hu · Hechang Chen · Lichao Sun · Bo Yang

Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation

Fengdi Che · Chenjun Xiao · Jincheng Mei · Bo Dai · Ramki Gummadi · Oscar Ramirez · Christopher Harris · Rupam Mahmood · Dale Schuurmans

Information-Directed Pessimism for Offline Reinforcement Learning

Alec Koppel · Sujay Bhatt · Jiacheng Guo · Joe Eappen · Mengdi Wang · Sumitra Ganesh

PlanDQ: Hierarchical Plan Orchestration via D-Conductor and Q-Performer

Chang Chen · Junyeob Baek · Fei Deng · Kenji Kawaguchi · Caglar Gulcehre · Sungjin Ahn

RVI-SAC: Average Reward Off-Policy Deep Reinforcement Learning

Yukinari Hisaki · Isao Ono

Pausing Policy Learning in Non-stationary Reinforcement Learning

Hyunin Lee · Ming Jin · Javad Lavaei · Somayeh Sojoudi

Feasible Reachable Policy Iteration

Shentao Qin · Yujie Yang · Yao Mu · Jie Li · Wenjun Zou · Jingliang Duan · Shengbo Li

Distributional Bellman Operators over Mean Embeddings

Li Kevin Wenliang · Gregoire Deletang · Matthew Aitchison · Marcus Hutter · Anian Ruoss · Arthur Gretton · Mark Rowland

Position: Automatic Environment Shaping is the Next Frontier in RL

Younghyo Park · Gabriel Margolis · Pulkit Agrawal

OMPO: A Unified Framework for RL under Policy and Dynamics Shifts

Yu Luo · Tianying Ji · Fuchun Sun · Jianwei Zhang · Huazhe Xu · Xianyuan Zhan

OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning

Sheng Yue · Xingyuan Hua · Ju Ren · Sen Lin · Junshan Zhang · Yaoxue Zhang

HarmonyDream: Task Harmonization Inside World Models

Haoyu Ma · Jialong Wu · Ningya Feng · Chenjun Xiao · Dong Li · Jianye Hao · Jianmin Wang · Mingsheng Long

Limited Preference Aided Imitation Learning from Imperfect Demonstrations

Xingchen Cao · Fan-Ming Luo · Junyin Ye · Tian Xu · Zhilong Zhang · Yang Yu

HGAP: Boosting Permutation Invariant and Permutation Equivariant in Multi-Agent Reinforcement Learning via Graph Attention Network

Bor Jiun Lin · Chun-Yi Lee

Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning

Yizhe Huang · Anji Liu · Fanqi Kong · Yaodong Yang · Song-Chun Zhu · Xue Feng

Near-Optimal Reinforcement Learning with Self-Play under Adaptivity Constraints

Dan Qiao · Yu-Xiang Wang

Sample-Efficient Multiagent Reinforcement Learning with Reset Replay

Yaodong Yang · Guangyong Chen · Jianye Hao · Pheng Ann Heng

SpikeLM: Towards General Spike-Driven Language Modeling via Elastic Bi-Spiking Mechanisms

Xingrun Xing · Zheng Zhang · Ziyi Ni · Shitao Xiao · Yiming Ju · Siqi Fan · Yequan Wang · Jiajun Zhang · Guoqi Li

Truly No-Regret Learning in Constrained MDPs

Adrian Müller · Pragnya Alatur · Volkan Cevher · Giorgia Ramponi · Niao He

Position: Benchmarking is Limited in Reinforcement Learning Research

Scott Jordan · Adam White · Bruno da Silva · Martha White · Philip Thomas

Sequential Neural Score Estimation: Likelihood-Free Inference with Conditional Score Based Diffusion Models

Louis Sharrock · Jack Simons · Song Liu · Mark Beaumont

Learning to Scale Logits for Temperature-Conditional GFlowNets

Minsu Kim · Joohwan Ko · Taeyoung Yun · Dinghuai Zhang · Ling Pan · Woo Chang Kim · Jinkyoo Park · Emmanuel Bengio · Yoshua Bengio

Density Ratio Estimation with Doubly Strong Robustness

Ryosuke Nagumo · Hironori Fujisawa

Robust Inverse Graphics via Probabilistic Inference

Tuan Anh Le · Pavel Sountsov · Matthew Hoffman · Ben Lee · Brian Patton · Rif Saurous

Sparse Inducing Points in Deep Gaussian Processes: Enhancing Modeling with Denoising Diffusion Variational Inference

JIAN XU · Delu Zeng · John Paisley

Partially Stochastic Infinitely Deep Bayesian Neural Networks

Sergio Calvo Ordoñez · Matthieu Meunier · Francesco Piatti · Yuantao Shi

Listening to the noise: Blind Denoising with Gibbs Diffusion

David Heurtel-Depeiges · Charles Margossian · Ruben Ohana · Bruno Régaldo-Saint Blancard

Simultaneous identification of models and parameters of scientific simulators

Cornelius Schröder · Jakob Macke

Challenges and Considerations in the Evaluation of Bayesian Causal Discovery

Amir Mohammad Karimi Mamaghan · Panagiotis Tigas · Karl Johansson · Yarin Gal · Yashas Annadani · Stefan Bauer

Stable Differentiable Causal Discovery

Achille Nazaret · Justin Hong · Elham Azizi · David Blei

Stochastic Quantum Sampling for Non-Logconcave Distributions and Estimating Partition Functions

Guneykan Ozgul · Xiantao Li · Mehrdad Mahdavi · Chunhao Wang

Parallel Affine Transformation Tuning of Markov Chain Monte Carlo

Philip Schär · Michael Habeck · Daniel Rudolf

Energy-Efficient Gaussian Processes Using Low-Precision Arithmetic

Nicolas Alder · Ralf Herbrich

Amortized Variational Deep Kernel Learning

Alan Matias · César Lincoln Mattos · Joao Paulo Gomes · Diego Mesquita

Robust and Conjugate Gaussian Process Regression

Matias Altamirano · Francois-Xavier Briol · Jeremias Knoblauch

Preventing Model Collapse in Gaussian Process Latent Variable Models

Ying Li · Zhidi Lin · Feng Yin · Michael Minyi Zhang

Physics and Lie symmetry informed Gaussian processes

David Dalton · Dirk Husmeier · Hao Gao

Latent Optimal Paths by Gumbel Propagation for Variational Bayesian Dynamic Programming

Xinlei Niu · Christian Walder · Jing Zhang · Charles Martin

Beyond ELBOs: A Large-Scale Evaluation of Variational Methods for Sampling

Denis Blessing · Xiaogang Jia · Johannes Esslinger · Francisco Vargas · Gerhard Neumann

Bayesian Program Learning by Decompiling Amortized Knowledge

Alessandro Palmarini · Christopher Lucas · Siddharth N

Multi-View Stochastic Block Models

Vincent Cohen-Addad · Tommaso d'Orsi · Silvio Lattanzi · Rajai Nasser

A Bias-Variance-Covariance Decomposition of Kernel Scores for Generative Models

Sebastian Gregor Gruber · Florian Buettner

Deep Demonstration Tracing: Learning Generalizable Imitator Policy for Runtime Imitation from a Single Demonstration

Xiong-Hui Chen · Junyin Ye · Hang Zhao · Yi-Chen Li · Xu-Hui Liu · Haoran Shi · Yu-Yan Xu · Zhihao Ye · Si-Hang Yang · Yang Yu · Anqi Huang · Kai Xu · Zongzhang Zhang

Provably Neural Active Learning Succeeds via Prioritizing Perplexing Samples

Dake Bu · Wei Huang · Taiji Suzuki · Ji Cheng · Qingfu Zhang · Zhiqiang Xu · Hau-San Wong

Towards Understanding Inductive Bias in Transformers: A View From Infinity

Itay Lavie · Guy Gur-Ari · Zohar Ringel

Differentially Private Domain Adaptation with Theoretical Guarantees

Raef Bassily · Corinna Cortes · Anqi Mao · Mehryar Mohri

Stability and Generalization of Stochastic Compositional Gradient Descent Algorithms

Ming Yang · Xiyuan Wei · Tianbao Yang · Yiming Ying

Criterion Collapse and Loss Distribution Control

Matthew J. Holland

Can Implicit Bias Imply Adversarial Robustness?

Hancheng Min · Rene Vidal

A Fine-grained Analysis of Fitted Q-evaluation: Beyond Parametric Models

Jiayi Wang · Zhengling Qi · Raymond K. W. Wong

Tilting the Odds at the Lottery: the Interplay of Overparameterisation and Curricula in Neural Networks

Stefano Mannelli · Yaraslau Ivashynka · Andrew Saxe · Luca Saglietti

Optimal Coresets for Low-Dimensional Geometric Median

Peyman Afshani · Chris Schwiegelshohn

Non-Vacuous Generalization Bounds for Large Language Models

Sanae Lotfi · Marc Finzi · Yilun Kuang · Tim G. J. Rudner · Micah Goldblum · Andrew Wilson

The good, the bad and the ugly sides of data augmentation: An implicit spectral regularization perspective

Chi-Heng Lin · Chiraag Kaushik · Eva Dyer · Vidya Muthukumar

Prediction Accuracy of Learning in Games : Follow-the-Regularized-Leader meets Heisenberg

Yi Feng · Georgios Piliouras · Xiao Wang

High-Dimensional Kernel Methods under Covariate Shift: Data-Dependent Implicit Regularization

Yihang Chen · Fanghui Liu · Taiji Suzuki · Volkan Cevher

EDISON: Enhanced Dictionary-Induced Tensorized Incomplete Multi-View Clustering with Gaussian Error Rank Minimization

Zhibin Gu · Zhendong Li · Songhe Feng

Regression Learning with Limited Observations of Multivariate Outcomes and Features

Yifan Sun · Grace Yi

Decoupling Learning and Decision-Making: Breaking the $\mathcal{O}(\sqrt{T})$ Barrier in Online Resource Allocation with First-Order Methods

Wenzhi Gao · Chunlin Sun · Chenyu Xue · Yinyu Ye

Borda Regret Minimization for Generalized Linear Dueling Bandits

Yue Wu · Tao Jin · Qiwei Di · Hao Lou · Farzad Farnoud · Quanquan Gu

Online Learning in CMDPs: Handling Stochastic and Adversarial Constraints

Francesco Emanuele Stradi · Jacopo Germano · Gianmarco Genalti · Matteo Castiglioni · Alberto Marchesi · Nicola Gatti

Testing the Feasibility of Linear Programs with Bandit Feedback

Aditya Gangrade · Aditya Gopalan · Venkatesh Saligrama · Clay Scott

Exploration by Optimization with Hybrid Regularizers: Logarithmic Regret with Adversarial Robustness in Partial Monitoring

Taira Tsuchiya · Shinji Ito · Junya Honda

Asymptotically Optimal and Computationally Efficient Average Treatment Effect Estimation in A/B testing

VIKAS DEEP · Achal Bassamboo · Sandeep Juneja

Finite-Time Convergence and Sample Complexity of Actor-Critic Multi-Objective Reinforcement Learning

Tianchen Zhou · Hairi · Haibo Yang · Jia (Kevin) Liu · Tian Tong · Fan Yang · Michinari Momma · Yan Gao

Hierarchical Integral Probability Metrics: A distance on random probability measures with low sample complexity

Marta Catalano · Hugo Lavenant

Probabilistic Generating Circuits - Demystified

Sanyam Agarwal · Markus Bläser

Enhancing Sufficient Dimension Reduction via Hellinger Correlation

Seungbeom Hong · Ilmun Kim · Jun Song

From Classification Accuracy to Proper Scoring Rules: Elicitability of Probabilistic Top List Predictions

Johannes Resin

Fast Algorithms for Hypergraph PageRank with Applications to Semi-Supervised Learning

Konstantinos Ameranis · Adela DePavia · Lorenzo Orecchia · Erasmo Tani

Learning Solution-Aware Transformers for Efficiently Solving Quadratic Assignment Problem

Zhentao Tan · Yadong Mu

Handling Heterogeneous Curvatures in Bandit LQR Control

Yu-Hu Yan · Jing Wang · Peng Zhao

Random Exploration in Bayesian Optimization: Order-Optimal Regret and Computational Efficiency

Sudeep Salgia · Sattar Vakili · Qing Zhao

ContPhy: Continuum Physical Concept Learning and Reasoning from Videos

Zhicheng Zheng · Xin Yan · Zhenfang Chen · Jingzhou Wang · Qin Zhi Eddie Lim · Josh Tenenbaum · Chuang Gan

Eluder-based Regret for Stochastic Contextual MDPs

Orin Levy · Asaf Cassel · Alon Cohen · Yishay Mansour

No-Regret Reinforcement Learning in Smooth MDPs

Davide Maran · Alberto Maria Metelli · Matteo Papini · Marcello Restelli

Efficient Black-box Adversarial Attacks via Bayesian Optimization Guided by a Function Prior

Shuyu Cheng · Yibo Miao · Yinpeng Dong · Xiao Yang · Xiao-Shan Gao · Jun Zhu

Near-Optimal Regret in Linear MDPs with Aggregate Bandit Feedback

Asaf Cassel · Haipeng Luo · Aviv Rosenberg · Dmitry Sotnikov

More Benefits of Being Distributional: Second-Order Bounds for Reinforcement Learning

Kaiwen Wang · Owen Oertell · Alekh Agarwal · Nathan Kallus · Wen Sun

Don’t Label Twice: Quantity Beats Quality when Comparing Binary Classifiers on a Budget

Florian Dorner · Moritz Hardt

Uncertainty Estimation by Density Aware Evidential Deep Learning

Taeseong Yoon · Heeyoung Kim

Local Causal Structure Learning in the Presence of Latent Variables

Feng Xie · Zheng Li · Peng Wu · Yan Zeng · Chunchen LIU · zhi geng

From Geometry to Causality- Ricci Curvature and the Reliability of Causal Inference on Networks

Amirhossein Farzam · Allen Tannenbaum · Guillermo Sapiro

Learning to Infer Generative Template Programs for Visual Concepts

R. Kenny Jones · Siddhartha Chaudhuri · Daniel Ritchie

Multimodal Prototyping for cancer survival prediction

Andrew Song · Richard Chen · Guillaume Jaume · Anurag Vaidya · Alexander Baras · Faisal Mahmood

Reservoir Computing for Short High-Dimensional Time Series: an Application to SARS-CoV-2 Hospitalization Forecast

Thomas Ferté · Dutartre Dan · Boris Hejblum · Romain Griffier · Vianney Jouhet · Rodolphe Thiébaut · Pierrick Legrand · Xavier Hinaut

Zero-Shot ECG Classification with Multimodal Learning and Test-time Clinical Knowledge Enhancement

che liu · Zhongwei Wan · Cheng Ouyang · Anand Shah · Wenjia Bai · Rossella Arcucci

Multi-Agent Reinforcement Learning Meets Leaf Sequencing in Radiotherapy

Riqiang Gao · Florin-Cristian Ghesu · Simon Arberet · Shahab Basiri · Esa Kuusela · Martin Kraus · Dorin Comaniciu · Ali Kamen

Reference Neural Operators: Learning the Smooth Dependence of Solutions of PDEs on Geometric Deformations

Ze Cheng · Zhongkai Hao · Wang Xiaoqiang · Jianing Huang · Youjia Wu · Xudan Liu · Yiru Zhao · LIU SONGMING · Hang Su

Towards General Neural Surrogate Solvers with Specialized Neural Accelerators

Chenkai Mao · Robert Lupoiu · Tianxiang Dai · Mingkun Chen · Jonathan Fan

A Neural-Preconditioned Poisson Solver for Mixed Dirichlet and Neumann Boundary Conditions

Kai Weixian Lan · Elias Gueidon · Ayano Kaneda · Julian Panetta · Joseph Teran

Self-Supervised Coarsening of Unstructured Grid with Automatic Differentiation

Sergei Shumilin · Alexander Ryabov · Nikolay Yavich · Evgeny Burnaev · Vladimir Vanovskiy

TENG: Time-Evolving Natural Gradient for Solving PDEs With Deep Neural Nets Toward Machine Precision

Zhuo Chen · Jacob McCarran · Esteban Vizcaino · Marin Soljačić · Di Luo

Dynamic Facility Location in High Dimensional Euclidean Spaces

Sayan Bhattacharya · Gramoz Goranci · Shaofeng Jiang · Yi Qian · Yubo Zhang

Stochastic Interpolants with Data-Dependent Couplings

Michael Albergo · Mark Goldstein · Nicholas Boffi · Rajesh Ranganath · Eric Vanden-Eijnden

Transport of Algebraic Structure to Latent Embeddings

Samuel Pfrommer · Brendon G. Anderson · Somayeh Sojoudi

Generalization in Kernel Regression Under Realistic Assumptions

Daniel Barzilai · Ohad Shamir

Boosting Offline Optimizers with Surrogate Sensitivity

Cuong Dao · Phi Le Nguyen · Thao Nguyen Truong · Nghia Hoang

tnGPS: Discovering Unknown Tensor Network Structure Search Algorithms via Large Language Models (LLMs)

Junhua Zeng · Chao Li · Zhun Sun · Qibin Zhao · Guoxu Zhou

OAK: Enriching Document Representations using Auxiliary Knowledge for Extreme Classification

Shikhar Mohan · Deepak Saini · Anshul Mittal · Sayak Ray Chowdhury · Bhawna Paliwal · Jian Jiao · Manish Gupta · Manik Varma

Online Isolation Forest

Filippo Leveni · Guilherme Weigert Cassales · Bernhard Pfahringer · Albert Bifet · Giacomo Boracchi

Biharmonic Distance of Graphs and its Higher-Order Variants: Theoretical Properties with Applications to Centrality and Clustering

Mitchell Black · Lucy Lin · Weng-Keen Wong · Amir Nayyeri

Inferring the Long-Term Causal Effects of Long-Term Treatments from Short-Term Experiments

Allen Tran · Aurelien Bibaut · Nathan Kallus

Accelerating Legacy Numerical Solvers by Non-intrusive Gradient-based Meta-solving

Sohei Arisaka · Qianxiao Li

A Generative Approach for Treatment Effect Estimation under Collider Bias: From an Out-of-Distribution Perspective

Baohong Li · Haoxuan Li · Anpeng Wu · Minqin Zhu · shiyuan Peng · Qingyu Cao · Kun Kuang

Modular Learning of Deep Causal Generative Models for High-dimensional Causal Inference

Md Musfiqur Rahman · Murat Kocaoglu

Conditional Common Entropy for Instrumental Variable Testing and Partial Identification

Ziwei Jiang · Murat Kocaoglu

Causal Discovery with Fewer Conditional Independence Tests

Kirankumar Shiragur · Jiaqi Zhang · Caroline Uhler

Hybrid$^2$ Neural ODE Causal Modeling and an Application to Glycemic Response

Junyi Zou · Matthew Levine · Dessi Zaharieva · Ramesh Johari · Emily Fox

Longitudinal Targeted Minimum Loss-based Estimation with Temporal-Difference Heterogeneous Transformer

Toru Shirakawa · Yi Li · Yulun Wu · Sky Qiu · Yuxuan Li · Mingduo Zhao · Hiroyasu Iso · Mark van der Laan

Compressible Dynamics in Deep Overparameterized Low-Rank Learning & Adaptation

Can Yaras · Peng Wang · Laura Balzano · Qing Qu

Exploring Training on Heterogeneous Data with Mixture of Low-rank Adapters

Yuhang Zhou · Zhao Zihua · Siyuan Du · Haolin li · Jiangchao Yao · Ya Zhang · Yanfeng Wang

RoboMP$^2$: A Robotic Multimodal Perception-Planning Framework with Multimodal Large Language Models

Qi Lv · Hao Li · Xiang Deng · Rui Shao · Michael Wang · Liqiang Nie

SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation

Junjie Zhang · Chenjia Bai · Haoran He · Zhigang Wang · Bin Zhao · Xiu Li · Xuelong Li

MS-TIP: Imputation Aware Pedestrian Trajectory Prediction

Pranav Singh Chib · Achintya Nath · Paritosh Kabra · Ishu Gupta · Pravendra Singh

Log Neural Controlled Differential Equations: The Lie Brackets Make A Difference

Benjamin Walker · Andrew McLeod · Tiexin QIN · Yichuan Cheng · Haoliang Li · Terry Lyons

Probabilistic Time Series Modeling with Decomposable Denoising Diffusion Model

Tijin Yan · Hengheng Gong · Yongping He · Yufeng Zhan · Yuanqing Xia

TSLANet: Rethinking Transformers for Time Series Representation Learning

Emadeldeen Eldele · Mohamed Ragab · Zhenghua Chen · Min Wu · Xiaoli Li

Realistic Unsupervised CLIP Fine-tuning with Universal Entropy Optimization

Jian Liang · Sheng · Zhengbo Wang · Ran He · Tieniu Tan

Efficient Online Set-valued Classification with Bandit Feedback

Zhou Wang · Xingye Qiao

Quality-Weighted Vendi Scores And Their Application To Diverse Experimental Design

Quan Nguyen · Adji Bousso Dieng

On Multi-Armed Bandit with Impatient Arms

Yuming Shao · Zhixuan Fang

A General Online Algorithm for Optimizing Complex Performance Metrics

Wojciech Kotlowski · Marek Wydmuch · Erik Schultheis · Rohit Babbar · Krzysztof Dembczynski

Reducing sequential change detection to sequential estimation

Shubhanshu Shekhar · Aaditya Ramdas

Network Tight Community Detection

Jiayi Deng · Xiaodong Yang · Jun Yu · Jun Liu · Zhaiming Shen · Danyang Huang · Huimin Cheng

Learning Universal Predictors

Jordi Grau-Moya · Tim Genewein · Marcus Hutter · Laurent Orseau · Gregoire Deletang · Elliot Catt · Anian Ruoss · Li Kevin Wenliang · Christopher Mattern · Matthew Aitchison · Joel Veness

StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization

Songhua Liu · Xin Jin · Xingyi Yang · Jingwen Ye · Xinchao Wang

Adaptive Group Personalization for Federated Mutual Transfer Learning

Haoqing Xu · Dian Shen · Meng Wang · Beilun Wang

Federated Neuro-Symbolic Learning

Pengwei Xing · Songtao Lu · Han Yu

Federated Continual Learning via Prompt-based Dual Knowledge Transfer

Hongming Piao · Yichen WU · Dapeng Wu · Ying WEI

Unleashing the Power of Meta-tuning for Few-shot Generalization Through Sparse Interpolated Experts

Shengzhuang Chen · Jihoon Tack · Yunqiao Yang · Yee-Whye Teh · Jonathan Richard Schwarz · Ying WEI

Tabular Insights, Visual Impacts: Transferring Expertise from Tables to Images

Jun-Peng Jiang · Han-Jia Ye · Leye Wang · Yang Yang · Yuan Jiang · De-Chuan Zhan

Position: Measure Dataset Diversity, Don't Just Claim It

Dora Zhao · Jerone Andrews · Orestis Papakyriakopoulos · Alice Xiang

Curated LLM: Synergy of LLMs and Data Curation for tabular augmentation in low-data regimes

Nabeel Seedat · Nicolas Huynh · Boris van Breugel · M van der Schaar

The Relative Value of Prediction in Algorithmic Decision Making

Juan Perdomo

Building Socially-Equitable Public Models

Yejia Liu · Jianyi Yang · Pengfei Li · Tongxin Li · Shaolei Ren

What Would Gauss Say About Representations? Probing Pretrained Image Models using Synthetic Gaussian Benchmarks

Ching-Yun (Irene) Ko · Pin-Yu Chen · Payel Das · Jeet Mohapatra · Luca Daniel

Probabilistic Forecasting with Stochastic Interpolants and Föllmer Processes

Yifan Chen · Mark Goldstein · Mengjian Hua · Michael Albergo · Nicholas Boffi · Eric Vanden-Eijnden

Predictive Performance Comparison of Decision Policies Under Confounding

Luke Guerdan · Amanda Coston · Ken Holstein · Steven Wu

FairProof : Confidential and Certifiable Fairness for Neural Networks

Chhavi Yadav · Amrita Roy Chowdhury · Dan Boneh · Kamalika Chaudhuri

Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles

Bhrij Patel · Wesley A. Suttle · Alec Koppel · Vaneet Aggarwal · Brian Sadler · Dinesh Manocha · Amrit Singh Bedi

Purifying Quantization-conditioned Backdoors via Layer-wise Activation Correction with Distribution Approximation

Boheng Li · Yishuo Cai · Jisong Cai · Yiming Li · Han Qiu · Run Wang · Tianwei Zhang

Disparate Impact on Group Accuracy of Linearization for Private Inference

Saswat Das · Marco Romanelli · Ferdinando Fioretto

Balancing Similarity and Complementarity for Federated Learning

Kunda Yan · Sen Cui · Abudukelimu Wuerkaixi · Jingfeng ZHANG · Bo Han · Gang Niu · Masashi Sugiyama · Changshui Zhang

Differentially Private Decentralized Learning with Random Walks

Edwige Cyffers · Aurélien Bellet · Jalaj Upadhyay

Privacy Profiles for Private Selection

Antti Koskela · Rachel Redberg · Yu-Xiang Wang

Ditto: Quantization-aware Secure Inference of Transformers upon MPC

Haoqi Wu · Wenjing Fang · Yancheng Zheng · Junming Ma · Jin Tan · Lei Wang

How to Make the Gradients Small Privately: Improved Rates for Differentially Private Non-Convex Optimization

Andrew Lowy · Jonathan Ullman · Stephen Wright

Differentially Private Representation Learning via Image Captioning

Tom Sander · Yaodong Yu · Maziar Sanjabi · Alain Oliviero Durmus · Yi Ma · Kamalika Chaudhuri · Chuan Guo

Differentially private exact recovery for stochastic block models

Dung Nguyen · Anil Vullikanti

Auditing Private Prediction

Karan Chadha · Matthew Jagielski · Nicolas Papernot · Christopher A. Choquette Choo · Milad Nasr

Proactive DP: A Multiple Target Optimization Framework for DP-SGD

Marten van Dijk · Nhuong Nguyen · Toan N. Nguyen · Lam M. Nguyen · Phuong Ha Nguyen

Position: AI/ML Influencers Have a Place in the Academic Process

Iain Xie Weissburg · Mehir Arora · Xinyi Wang · Liangming Pan · William Wang

Beyond the Norms: Detecting Prediction Errors in Regression Models

Andres Altieri · Marco Romanelli · Georg Pichler · Florence Alberge · Pablo Piantanida

GRATH: Gradual Self-Truthifying for Large Language Models

Weixin Chen · Dawn Song · Bo Li

Distributionally Robust Data Valuation

Xiaoqiang Lin · Xinyi Xu · Zhaoxuan Wu · See-Kiong Ng · Bryan Kian Hsiang Low

A Theory of Fault-Tolerant Learning

Changlong Wu · Yifan Wang · Ananth Grama

Fair Off-Policy Learning from Observational Data

Dennis Frauen · Valentyn Melnychuk · Stefan Feuerriegel

An Empirical Study Into What Matters for Calibrating Vision-Language Models

Weijie Tu · Weijian Deng · Dylan Campbell · Stephen Gould · Tom Gedeon

Designing Decision Support Systems using Counterfactual Prediction Sets

Eleni Straitouri · Manuel Gomez-Rodriguez

Diversified Batch Selection for Training Acceleration

Feng Hong · Yueming LYU · Jiangchao Yao · Ya Zhang · Ivor Tsang · Yanfeng Wang

Trustworthy Actionable Perturbations

Jesse Friedbaum · Sudarshan Adiga · Ravi Tandon

Attribution-based Explanations that Provide Recourse Cannot be Robust

Hidde Fokkema · Rianne de Heide · Tim van Erven

Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models

Asma Ghandeharioun · ‪Avi Caciularu‬‏ · Adam Pearce · Lucas Dixon · Mor Geva

Probabilistic Conceptual Explainers: Trustworthy Conceptual Explanations for Vision Foundation Models

Hengyi Wang · Shiwei Tan · Hao Wang

Total Variation Floodgate for Variable Importance Inference in Classification

Wenshuo Wang · Lucas Janson · Lihua Lei · Aaditya Ramdas

Understanding Inter-Concept Relationships in Concept-Based Models

Naveen Raman · Mateo Espinosa Zarlenga · Mateja Jamnik

Understanding Retrieval-Augmented Task Adaptation for Vision-Language Models

Yifei Ming · Sharon Li

Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews

Weixin Liang · Zachary Izzo · Yaohui Zhang · Haley Lepp · Hancheng Cao · Xuandong Zhao · Lingjiao Chen · Haotian Ye · Sheng Liu · Zhi Huang · Daniel McFarland · James Zou

Learning Decision Trees and Forests with Algorithmic Recourse

Kentaro Kanamori · Takuya Takagi · Ken Kobayashi · Yuichi Ike

Semantically-correlated memories in a dense associative model

Thomas F Burns

The Emergence of Reproducibility and Consistency in Diffusion Models

Huijie Zhang · Jinfan Zhou · Yifu Lu · Minzhe Guo · Peng Wang · Liyue Shen · Qing Qu

Junk DNA Hypothesis: Pruning Small Pre-Trained Weights $\textit{Irreversibly}$ and $\textit{Monotonically}$ Impairs ``Difficult" Downstream Tasks in LLMs

Lu Yin · Ajay Jaiswal · Shiwei Liu · Souvik Kundu · Zhangyang “Atlas” Wang

Reflective Policy Optimization

Yaozhong Gan · yan renye · zhe wu · Junliang Xing

Implicit Compressibility of Overparametrized Neural Networks Trained with Heavy-Tailed SGD

Yijun Wan · Melih Barsbey · Abdellatif Zaidi · Umut Simsekli

Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution

Aaron Lou · Chenlin Meng · Stefano Ermon

Multi-Sender Persuasion: A Computational Perspective

Safwan Hossain · Tonghan Wang · Tao Lin · Yiling Chen · David Parkes · Haifeng Xu

DIDI: Diffusion-Guided Diversity for Offline Behavioral Generation

Jinxin Liu · Xinghong Guo · Zifeng Zhuang · Donglin Wang

Is Inverse Reinforcement Learning Harder than Standard Reinforcement Learning? A Theoretical Perspective

Lei Zhao · Mengdi Wang · Yu Bai

Detecting Any instruction-to-answer interaction relationship:Universal Instruction-to-Answer Navigator for Med-VQA

Zhongze Wu · Hongyan Xu · Yitian Long · Shan You · Xiu Su · Jun Long · Yueyi Luo · Chang Xu

A Nearly Optimal Single Loop Algorithm for Stochastic Bilevel Optimization under Unbounded Smoothness

Xiaochuan Gong · Jie Hao · Mingrui Liu

SqueezeLLM: Dense-and-Sparse Quantization

Sehoon Kim · Coleman Hooper · Amir Gholaminejad · Zhen Dong · Xiuyu Li · Sheng Shen · Michael Mahoney · EECS Kurt Keutzer

Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws

Nikhil Sardana · Jacob Portes · Alexandre (Sasha) Doubov · Jonathan Frankle

Position: Machine Learning-powered Assessments of the EU Digital Services Act Aid Quantify Policy Impacts on Online Harms

Eleonora Bonel · Luca Nannini · Davide Bassi · Michele Maggini

How Far Can Fairness Constraints Help Recover From Biased Data?

Mohit Sharma · Amit Jayant Deshpande

Individual Fairness in Graph Decomposition

Kamesh Munagala · Govind S. Sankar

Faithfulness Measurable Masked Language Models

Andreas Madsen · Siva Reddy · Sarath Chandar

Position: Explain to Question not to Justify

Przemyslaw Biecek · Wojciech Samek

Rethinking Data Shapley for Data Selection Tasks: Misleads and Merits

Jiachen Wang · Tianji Yang · James Zou · Yongchan Kwon · Ruoxi Jia

A General Framework for Sequential Decision-Making under Adaptivity Constraints

Nuoya Xiong · Zhaoran Wang · Zhuoran Yang

PANDA: Expanded Width-Aware Message Passing Beyond Rewiring

Jeongwhan Choi · Sumin Parksumin · Hyowon Wi · Sung-Bae Cho · Noseong Park

Trainable Transformer in Transformer

Abhishek Panigrahi · Sadhika Malladi · Mengzhou Xia · Sanjeev Arora

Improving Group Robustness on Spurious Correlation Requires Preciser Group Inference

Yujin Han · Difan Zou

Switchable Decision: Dynamic Neural Generation Networks

Shujian Zhang · Korawat Tanwisuth · Chengyue Gong · Pengcheng He · Mingyuan Zhou

Collaborative Heterogeneous Causal Inference Beyond Meta-analysis

Tianyu Guo · Sai Praneeth Karimireddy · Michael Jordan

Collage: Light-Weight Low-Precision Strategy for LLM Training

Tao Yu · Gaurav Gupta · KARTHICK GOPALSWAMY · Amith Mamidala · Hao Zhou · Jeffrey Huynh · Youngsuk Park · Ron Diamant · Anoop Deoras · Luke Huan

Local Feature Selection without Label or Feature Leakage for Interpretable Machine Learning Predictions

Harrie Oosterhuis · Lijun Lyu · Avishek Anand

Vanilla Bayesian Optimization Performs Great in High Dimensions

Carl Hvarfner · Erik Hellsten · Luigi Nardi

Sparse Cocktail: Every Sparse Pattern Every Sparse Ratio All At Once

Zhangheng Li · Shiwei Liu · Tianlong Chen · Ajay Jaiswal · Zhenyu Zhang · Dilin Wang · Raghuraman Krishnamoorthi · Shiyu Chang · Zhangyang “Atlas” Wang

Momentor: Advancing Video Large Language Model with Fine-Grained Temporal Reasoning

Long Qian · Juncheng Li · Yu Wu · Yaobo Ye · Hao Fei · Tat-Seng Chua · Yueting Zhuang · Siliang Tang

Score identity Distillation: Exponentially Fast Distillation of Pretrained Diffusion Models for One-Step Generation

Mingyuan Zhou · Huangjie Zheng · Zhendong Wang · Mingzhang Yin · Hai Huang

Online Matching with Stochastic Rewards: Provable Better Bound via Adversarial Reinforcement Learning

Qiankun Zhang · Aocheng Shen · Boyu Zhang · Hanrui Jiang · Bingqian Du

Auto-Encoding Morph-Tokens for Multimodal LLM

Kaihang Pan · Siliang Tang · Juncheng Li · Zhaoyu Fan · Wei Chow · Shuicheng YAN · Tat-Seng Chua · Yueting Zhuang · Hanwang Zhang

Mathematical Framework for Online Social Media Auditing

Wasim Huleihel · Yehonathan Refael

Towards Realistic Model Selection for Semi-supervised Learning

Muyang Li · Xiaobo Xia · Runze Wu · Fengming Huang · Jun Yu · Bo Han · Tongliang Liu

Spectral Phase Transition and Optimal PCA in Block-Structured Spiked Models

Pierre Mergny · Justin Ko · FLORENT KRZAKALA

Language Models as Science Tutors

Alexis Chevalier · Jiayi Geng · Alexander Wettig · Howard Chen · Sebastian Mizera · Toni Annala · Max Aragon · Arturo Fanlo · Simon Frieder · Simon Machado · Akshara P · Ellie Thieu · Jiachen Wang · Zirui Wang · Xindi Wu · Mengzhou Xia · Wenhan Xia · Jiatong Yu · Junjie Zhu · Zhiyong Ren · Sanjeev Arora · Danqi Chen

An Explicit Frame Construction for Normalizing 3D Point Clouds

Justin Baker · Shih-Hsin Wang · Tommaso de Fernex · Bao Wang

Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design

Shuze Liu · Shangtong Zhang

Auto-Regressive Next-Token Predictors are Universal Learners

Eran Malach

Peeking with PEAK: Sequential, Nonparametric Composite Hypothesis Tests for Means of Multiple Data Streams

Brian Cho · Kyra Gan · Nathan Kallus

SceneCraft: An LLM Agent for Synthesizing 3D Scenes as Blender Code

ziniu hu · Ahmet Iscen · Aashi Jain · Thomas Kipf · Yisong Yue · David Ross · Cordelia Schmid · Alireza Fathi

Provably Efficient Exploration in Quantum Reinforcement Learning with Logarithmic Worst-Case Regret

Han Zhong · Jiachen Hu · Yecheng Xue · Tongyang Li · Liwei Wang

Community-Invariant Graph Contrastive Learning

Shiyin Tan · Dongyuan Li · Renhe Jiang · Ying Zhang · Manabu Okumura

Offline Transition Modeling via Contrastive Energy Learning

Ruifeng Chen · Chengxing Jia · Zefang Huang · Tian-Shuo Liu · Xu-Hui Liu · Yang Yu

An Improved Finite-time Analysis of Temporal Difference Learning with Deep Neural Networks

Zhifa Ke · Zaiwen Wen · Junyu Zhang

NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models

Transforming and Combining Rewards for Aligning Large Language Models

Zihao Wang · Chirag Nagpal · Jonathan Berant · Jacob Eisenstein · Alexander D'Amour · Sanmi Koyejo · Victor Veitch

Sequential Kernel Goodness-of-fit Testing

Zhengyu Zhou · Weiwei Liu

Controlled Decoding from Language Models

Sidharth Mudgal · Jong Lee · Harish Ganapathy · YaGuang Li · Tao Wang · Yanping Huang · Zhifeng Chen · Heng-Tze Cheng · Michael Collins · Trevor Strohman · Jilin Chen · Alex Beutel · Ahmad Beirami

Self-Infilling Code Generation

Lin Zheng · Jianbo Yuan · Zhi Zhang · Hongxia Yang · Lingpeng Kong

Position: What makes an image realistic?

Lucas Theis

$\mathtt{VITS}$ : Variational Inference Thompson Sampling for contextual bandits

Pierre Clavier · Tom Huix · Alain Oliviero Durmus

DPOT: Auto-Regressive Denoising Operator Transformer for Large-Scale PDE Pre-Training

Zhongkai Hao · Chang Su · LIU SONGMING · Julius Berner · Chengyang Ying · Hang Su · Anima Anandkumar · Jian Song · Jun Zhu

Leveraging (Biased) Information: Multi-armed Bandits with Offline Data

Wang Chi Cheung · Lixing Lyu

Mean-field Chaos Diffusion Models

Sungwoo Park · Dongjun Kim · Ahmed Alaa

Completing Visual Objects via Bridging Generation and Segmentation

Xiang Li · Yinpeng Chen · Chung-Ching Lin · Hao Chen · Kai Hu · Rita Singh · Bhiksha Raj · Lijuan Wang · Zicheng Liu

Can Looped Transformers Learn to Implement Multi-step Gradient Descent for In-context Learning?

Khashayar Gatmiry · Nikunj Saunshi · Sashank J. Reddi · Stefanie Jegelka · Sanjiv Kumar

SILVER: Single-loop variance reduction and application to federated learning

Kazusato Oko · Shunta Akiyama · Denny Wu · Tomoya Murata · Taiji Suzuki

UPOCR: Towards Unified Pixel-Level OCR Interface

Dezhi Peng · Zhenhua Yang · Jiaxin Zhang · Chongyu Liu · Yongxin Shi · Kai Ding · Fengjun Guo · Lianwen Jin

Effective Federated Graph Matching

Yang Zhou · Zijie Zhang · Zeru Zhang · Lingjuan Lyu · Wei-Shinn Ku

Understanding and Diagnosing Deep Reinforcement Learning

Ezgi Korkmaz

Projecting Molecules into Synthesizable Chemical Spaces

Shitong Luo · Wenhao Gao · Zuofan Wu · Jian Peng · Connor Coley · Jianzhu Ma

Keypoint-based Progressive Chain-of-Thought Distillation for LLMs

Kaituo Feng · Changsheng Li · Xiaolu Zhang · JUN ZHOU · Ye Yuan · Guoren Wang

Chain of Code: Reasoning with a Language Model-Augmented Code Emulator

Chengshu Li · Jacky Liang · Andy Zeng · Xinyun Chen · Karol Hausman · Dorsa Sadigh · Sergey Levine · Li Fei-Fei · Fei Xia · brian ichter

InstructSpeech: Following Speech Editing Instructions via Large Language Models

Rongjie Huang · Ruofan Hu · Yongqi Wang · Zehan Wang · xize cheng · Ziyue Jiang · Zhenhui Ye · Dongchao Yang · Luping Liu · Peng Gao · Zhou Zhao

RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis

Yao Mu · Junting Chen · Qing-Long Zhang · Shoufa Chen · Qiaojun Yu · Chongjian GE · Runjian Chen · Zhixuan Liang · Mengkang Hu · Chaofan Tao · Peize Sun · Haibao Yu · Chao Yang · WENQI SHAO · Wenhai Wang · Jifeng Dai · Yu Qiao · Mingyu Ding · Ping Luo

Revisiting Scalable Hessian Diagonal Approximations for Applications in Reinforcement Learning

Mohamed Elsayed · Homayoon Farrahi · Felix Dangel · Rupam Mahmood

A Graph is Worth $K$ Words: Euclideanizing Graph using Pure Transformer

Zhangyang Gao · Daize Dong · Cheng Tan · Jun Xia · Bozhen Hu · Stan Z Li

PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation

Runze Liu · Yali Du · Fengshuo Bai · Jiafei Lyu · Xiu Li

FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion

Zehan Wang · Ziang Zhang · xize cheng · Rongjie Huang · Luping Liu · Zhenhui Ye · Haifeng Huang · Yang Zhao · Tao Jin · Peng Gao · Zhou Zhao

Bounded and Uniform Energy-based Out-of-distribution Detection for Graphs

Shenzhi Yang · Bin Liang · An Liu · Lin Gui · Xingkai Yao · Xiaofang Zhang

MLI Formula: A Nearly Scale-Invariant Solution with Noise Perturbation

Bowen Tao · Xin-Chun Li · De-Chuan Zhan

ArtWhisperer: A Dataset for Characterizing Human-AI Interactions in Artistic Creations

Kailas Vodrahalli · James Zou

High-Performance Temporal Reversible Spiking Neural Networks with $\mathcal{O}(L)$ Training Memory and $\mathcal{O}(1)$ Inference Cost

JiaKui Hu · Man Yao · Xuerui Qiu · Yuhong Chou · Yuxuan Cai · Ning Qiao · Yonghong Tian · Bo XU · Guoqi Li

Revealing Vision-Language Integration in the Brain with Multimodal Networks

Vighnesh Subramaniam · Colin Conwell · Christopher Wang · Gabriel Kreiman · Boris Katz · Ignacio Cases · Andrei Barbu

Position: Enforced Amnesia as a Way to Mitigate the Potential Risk of Silent Suffering in the Conscious AI

Yegor Tkachenko

Autaptic Synaptic Circuit Enhances Spatio-temporal Predictive Learning of Spiking Neural Networks

Lihao Wang · Zhaofei Yu

Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners?

Andreas Opedal · Alessandro Stolfo · Haruki Shirakami · Ying Jiao · Ryan Cotterell · Bernhard Schölkopf · Abulhair Saparov · Mrinmaya Sachan

Leveraging Attractor Dynamics in Spatial Navigation for Better Language Parsing

Xiaolong Zou · Xingxing Cao · Xiaojiao Yang · Bo Hong

Exploring the Enigma of Neural Dynamics Through A Scattering-Transform Mixer Landscape for Riemannian Manifold

Tingting Dan · Ziquan Wei · Won Hwa Kim · Guorong Wu

StackSight: Unveiling WebAssembly through Large Language Models and Neurosymbolic Chain-of-Thought Decompilation

Weike Fang · Zhejian Zhou · Junzhou He · Weihang Wang

ELF: Encoding Speaker-Specific Latent Speech Feature for Speech Synthesis

Jungil Kong · Junmo Lee · Jeongmin Kim · Beomjeong Kim · JIHOON PARK · Dohee Kong · Changheon Lee · Sangjin Kim

PinNet: Pinpoint Instructive Information for Retrieval Augmented Code-to-Text Generation

Han Fu · Jian Tan · Pinhan Zhang · Feifei Li · Jianling Sun

UniAudio: Towards Universal Audio Generation with Large Language Models

Dongchao Yang · Jinchuan Tian · Xu Tan · Rongjie Huang · Songxiang Liu · Haohan Guo · Xuankai Chang · Jiatong Shi · sheng zhao · Jiang Bian · Zhou Zhao · Xixin Wu · Helen M Meng

Successor Features for Efficient Multi-Subject Controlled Text Generation

Meng Cao · Mehdi Fatemi · Jackie Chi Kit Cheung · Samira Shabanian

LLark: A Multimodal Instruction-Following Language Model for Music

Josh Gardner · Simon Durand · Daniel Stoller · Rachel Bittner

SelfVC: Voice Conversion With Iterative Refinement using Self Transformations

Paarth Neekhara · Shehzeen Hussain · Rafael Valle · Boris Ginsburg · Rishabh Ranjan · Shlomo Dubnov · Farinaz Koushanfar · Julian McAuley

Predicting Dose-Response Curves with Deep Neural Networks

Pedro A. Campana · Paul Prasse · Tobias Scheffer

Cell2Sentence: Teaching Large Language Models the Language of Biology

Daniel Levine · Syed Rizvi · Sacha Lévy · Nazreen Pallikkavaliyaveetil MohammedSheriff · David Zhang · Xingyu Chen · SINA GHADERMARZI · Ruiming Wu · Zihe Zheng · Ivan Vrkic · Anna Zhong · Daphne Raskin · Insu Han · Antonio Henrique de Oliveira Fonseca · Josue Ortega Caro · Amin Karbasi · Rahul Dhodapkar · David van Dijk

CauDiTS: Causal Disentangled Domain Adaptation of Multivariate Time Series

Junxin Lu · Shiliang Sun

SleepFM: Multi-modal Representation Learning for Sleep Across Brain Activity, ECG and Respiratory Signals

Rahul Thapa · Bryan He · Magnus Ruud Kjaer · Hyatt Moore · Gauri Ganjoo · Emmanuel Mignot · James Zou

Predicting and Interpreting Energy Barriers of Metallic Glasses with Graph Neural Networks

Haoyu Li · Shichang Zhang · Longwen Tang · Mathieu Bauchy · Yizhou Sun

Reinforcement Learning within Tree Search for Fast Macro Placement

Zijie Geng · Jie Wang · Ziyan Liu · Siyuan Xu · Zhentao Tang · Mingxuan Yuan · Jianye Hao · Yongdong Zhang · Feng Wu

Bagged Deep Image Prior for Recovering Images in the Presence of Speckle Noise

Xi Chen · Zhewen Hou · Christopher Metzler · Arian Maleki · Shirin Jalali

Learning Linear Block Error Correction Codes

Yoni Choukroun · Lior Wolf

MathScale: Scaling Instruction Tuning for Mathematical Reasoning

Zhengyang Tang · Xingxing Zhang · Benyou Wang · Furu Wei

Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity

Xudong Li · Timin Gao · Runze Hu · Yan Zhang · Shengchuan Zhang · Xiawu Zheng · Jingyuan Zheng · Yunhang Shen · Ke Li · Yutao Liu · Pingyang Dai · Rongrong Ji

Convex and Bilevel Optimization for Neural-Symbolic Inference and Learning

Charles Dickens · Changyu Gao · Connor Pryor · Stephen Wright · Lise Getoor

What needs to go right for an induction head? A mechanistic study of in-context learning circuits and their formation

Aaditya Singh · Ted Moskovitz · Feilx Hill · Stephanie Chan · Andrew Saxe

Is Kernel Prediction More Powerful than Gating in Convolutional Neural Networks?

Lorenz K. Muller

How to Leverage Diverse Demonstrations in Offline Imitation Learning

Sheng Yue · Jiani Liu · Xingyuan Hua · Ju Ren · Sen Lin · Junshan Zhang · Yaoxue Zhang

To Cool or not to Cool? Temperature Network Meets Large Foundation Models via DRO

Zi-Hao Qiu · Siqi Guo · Mao Xu · Tuo Zhao · Lijun Zhang · Tianbao Yang

Harmonizing Generalization and Personalization in Federated Prompt Learning

Tianyu Cui · Hongxia Li · Jingya Wang · Ye Shi

Fine-grained Classes and How to Find Them

Matej Grcic · Artyom Gadetsky · Maria Brbic

Efficient Precision and Recall Metrics for Assessing Generative Models using Hubness-aware Sampling

Yuanbang Liang · Jing Wu · Yu-Kun Lai · Yipeng Qin

Bayesian Knowledge Distillation: A Bayesian Perspective of Distillation with Uncertainty Quantification

Luyang Fang · Yongkai Chen · Wenxuan Zhong · Ping Ma

Which Frequencies do CNNs Need? Emergent Bottleneck Structure in Feature Learning

Yuxiao Wen · Arthur Jacot

SelMatch: Effectively Scaling Up Dataset Distillation via Selection-Based Initialization and Partial Updates by Trajectory Matching

Yongmin Lee · Hye Won Chung

Bidirectional Reciprocative Information Communication for Few-Shot Semantic Segmentation

Yuanwei Liu · Junwei Han · Xiwen Yao · Salman Khan · Hisham Cholakkal · Rao Anwer · Nian Liu · Fahad Khan

D-Flow: Differentiating through Flows for Controlled Generation

Heli Ben-Hamu · Omri Puny · Itai Gat · Brian Karrer · Uriel Singer · Yaron Lipman

Data-efficient Large Vision Models through Sequential Autoregression

Zhiwei Hao · Jianyuan Guo · Chengcheng Wang · Yehui Tang · Han Wu · Han Hu · Kai Han · Chang Xu

Don't be so Negative! Score-based Generative Modeling with Oracle-assisted Guidance

Saeid Naderiparizi · Xiaoxuan Liang · Setareh Cohan · Berend Zwartsenberg · Frank Wood

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

DFlow: A Generative Model Combining Denoising AutoEncoder and Normalizing Flow for High Fidelity Waveform Generation

Chenfeng Miao · Qingying Zhu · Chen Minchuan · Wei Hu · Zijian Li · Shaojun Wang · Jing Xiao

HyperFields: Towards Zero-Shot Generation of NeRFs from Text

Sudarshan Babu · Richard Liu · Zi Yu Zhou · Michael Maire · Greg Shakhnarovich · Rana Hanocka

Boximator: Generating Rich and Controllable Motions for Video Synthesis

Jiawei Wang · Yuchen Zhang · Jiaxin Zou · Yan Zeng · Guoqiang Wei · Liping Yuan · Hang Li

CHAI: Clustered Head Attention for Efficient LLM Inference

Saurabh Agarwal · Bilge Acun · Basil Hosmer · Mostafa Elhoushi · Yejin Lee · Shivaram Venkataraman · Dimitris Papailiopoulos · Carole-Jean Wu

InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation

Jacob Si · Wendy Yusi Cheng · Michael Cooper · Rahul G. Krishnan

Visual Transformer with Differentiable Channel Selection: An Information Bottleneck Inspired Approach

Yancheng Wang · Ping Li · Yingzhen Yang

How Smooth Is Attention?

Valérie Castin · Pierre Ablin · Gabriel Peyré

SparQ Attention: Bandwidth-Efficient LLM Inference

Luka Ribar · Ivan Chelombiev · Luke Hudlass-Galley · Charlie Blake · Carlo Luschi · Douglas Orr

Two Tales of Single-Phase Contrastive Hebbian Learning

Rasmus Kjær Høier · Christopher Zach

A2Q+: Improving Accumulator-Aware Weight Quantization

Ian Colbert · Alessandro Pappalardo · Jakoba Petri-Koenig · Yaman Umuroglu

Jetfire: Efficient and Accurate Transformer Pretraining with INT8 Data Flow and Per-Block Quantization

Haocheng Xi · Yuxiang Chen · Kang Zhao · KAI JUN TEH · Jianfei Chen · Jun Zhu

Amend to Alignment: Decoupled Prompt Tuning for Mitigating Spurious Correlation in Vision-Language Models

Jie ZHANG · Xiaosong Ma · Song Guo · Peng Li · Wenchao Xu · Xueyang Tang · Zicong Hong

Sparse Dimensionality Reduction Revisited

Mikael Møller Høgsgaard · Lior Kamma · Kasper Green Larsen · Jelani Nelson · Chris Schwiegelshohn

On a Neural Implementation of Brenier's Polar Factorization

Nina Vesseron · Marco Cuturi

Scalable High-Resolution Pixel-Space Image Synthesis with Hourglass Diffusion Transformers

Katherine Crowson · Stefan Baumann · Alex Birch · Tanishq Abraham · Daniel Kaplan · Enrico Shippole

Non-confusing Generation of Customized Concepts in Diffusion Models

Wang Lin · Jingyuan CHEN · Jiaxin Shi · Yichen Zhu · Chen Liang · Junzhong Miao · Tao Jin · Zhou Zhao · Fei Wu · Shuicheng YAN · Hanwang Zhang

How Learning by Reconstruction Produces Uninformative Features For Perception

Randall Balestriero · Yann LeCun

Graph Generation with Diffusion Mixture

Jaehyeong Jo · Dongki Kim · Sung Ju Hwang

Self-Correcting Self-Consuming Loops for Generative Model Training

Nate Gillman · Michael Freeman · Daksh Aggarwal · Chia-Hong HSU · Calvin Luo · Yonglong Tian · Chen Sun

Cross-view Masked Diffusion Transformers for Person Image Synthesis

Trung Pham · Kang Zhang · Chang Yoo

SMaRt: Improving GANs with Score Matching Regularity

Mengfei Xia · Yujun Shen · Ceyuan Yang · Ran Yi · Wenping Wang · Yong-Jin Liu

E$^2$GAN: Efficient Training of Efficient GANs for Image-to-Image Translation

Yifan Gong · Zheng Zhan · Qing Jin · Yanyu Li · Yerlan Idelbayev · Xian Liu · Andrey Zharkov · Kfir Aberman · Sergey Tulyakov · Yanzhi Wang · Jian Ren

Interpreting and Improving Diffusion Models from an Optimization Perspective

Frank Permenter · Chenyang Yuan

Disentanglement Learning via Topology

Nikita Balabin · Daria Voronkova · Ilya Trofimov · Evgeny Burnaev · Serguei Barannikov

Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases

Ziyi Zhang · Sen Zhang · Yibing Zhan · Yong Luo · Yonggang Wen · Dacheng Tao

What’s the score? Automated Denoising Score Matching for Nonlinear Diffusions

raghav singhal · Mark Goldstein · Rajesh Ranganath

Estimating Barycenters of Distributions with Neural Optimal Transport

Alexander Kolesov · Petr Mokrov · Igor Udovichenko · Milena Gazdieva · Gudmund Pammer · Evgeny Burnaev · Alexander Korotin

GALA3D: Towards Text-to-3D Complex Scene Generation via Layout-guided Generative Gaussian Splatting

Xiaoyu Zhou · Xingjian Ran · Yajiao Xiong · Jinlin He · Zhiwei Lin · Yongtao Wang · Deqing Sun · Ming-Hsuan Yang

Graph Attention Retrospective

Kimon Fountoulakis · Amit Levi · Shenghao Yang · Aseem Baranwal · Aukosh Jagannath

PhAST: Physics-Aware, Scalable, and Task-Specific GNNs for Accelerated Catalyst Design

Alexandre Duval · Victor Schmidt · Santiago Miret · Yoshua Bengio · Alex Hernandez-Garcia · David Rolnick

On the Role of Edge Dependency in Graph Generative Models

Sudhanshu Chanpuriya · Cameron Musco · Konstantinos Sotiropoulos · Charalampos Tsourakakis

Compositional Capabilities of Autoregressive Transformers: A Study on Synthetic, Interpretable Tasks

Rahul Ramesh · Ekdeep Singh Lubana · Mikail Khona · Robert Dick · Hidenori Tanaka

WAVES: Benchmarking the Robustness of Image Watermarks

Bang An · Mucong Ding · Tahseen Rabbani · Aakriti Agrawal · Yuancheng Xu · Chenghao Deng · Sicheng Zhu · Abdirisak Mohamed · Yuxin Wen · Tom Goldstein · Furong Huang

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

Zechun Liu · Changsheng Zhao · Forrest Iandola · Chen Lai · Yuandong Tian · Igor Fedorov · Yunyang Xiong · Ernie Chang · Yangyang Shi · Raghuraman Krishnamoorthi · Liangzhen Lai · Vikas Chandra

How Well Can LLMs Negotiate? NegotiationArena Platform and Analysis

Federico Bianchi · Patrick John Chia · Mert Yuksekgonul · Jacopo Tagliabue · Dan Jurafsky · James Zou

Interpreting and Improving Large Language Models in Arithmetic Calculation

Wei Zhang · Wan Chaoqun · Yonggang Zhang · Yiu Ming Cheung · Xinmei Tian · Xu Shen · Jieping Ye

Do Models Explain Themselves? Counterfactual Simulatability of Natural Language Explanations

Yanda Chen · Ruiqi Zhong · Narutatsu Ri · Chen Zhao · He He · Jacob Steinhardt · Zhou Yu · Kathleen McKeown

Multicalibration for Confidence Scoring in LLMs

Gianluca Detommaso · Martin A Bertran · Riccardo Fogliato · Aaron Roth

Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation

Haoran Xu · Amr Sharaf · Yunmo Chen · Weiting Tan · Lingfeng Shen · Benjamin Van Durme · Kenton Murray · Young Jin Kim

In-Context Language Learning: Architectures and Algorithms

Ekin Akyürek · Bailin Wang · Yoon Kim · Jacob Andreas

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Wei-Lin Chiang · Lianmin Zheng · Ying Sheng · Anastasios Angelopoulos · Tianle Li · Dacheng Li · Banghua Zhu · Hao Zhang · Michael Jordan · Joseph E Gonzalez · Ion Stoica

Whispering Experts: Neural Interventions for Toxicity Mitigation in Language Models

Xavi Suau · Pieter Delobelle · Katherine Metcalf · Armand Joulin · Nicholas Apostoloff · Luca Zappella · Pau Rodriguez

Sparse is Enough in Fine-tuning Pre-trained Large Language Models

Weixi Song · Zuchao Li · Lefei Zhang · hai zhao · Bo Du

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning

Hao Zhao · Maksym Andriushchenko · Francesco Croce · Nicolas Flammarion

Coactive Learning for Large Language Models using Implicit User Feedback

Aaron D. Tucker · Kianté Brantley · Adam Cahall · Thorsten Joachims

Unsupervised Parameter-free Simplicial Representation Learning with Scattering Transforms

Hiren Madhu · Sravanthi Gurugubelli · Sundeep Prabhakar Chepuri

Feature Distribution on Graph Topology Mediates the Effect of Graph Convolution: Homophily Perspective

Soo Yong Lee · Sunwoo Kim · Fanchen Bu · Jaemin Yoo · Jiliang Tang · Kijung Shin

On dimensionality of feature vectors in MPNNs

César Bravo · Alexander Kozachinskiy · Cristobal Rojas

GATE: How to Keep Out Intrusive Neighbors

Nimrah Mustafa · Rebekka Burkholz

Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion Bridge

Yufei Huang · Odin Zhang · Lirong Wu · Cheng Tan · Haitao Lin · Zhangyang Gao · Siyuan Li · Stan Z Li

Position: Key Claims in LLM Research Have a Long Tail of Footnotes

Anna Rogers · Sasha Luccioni

A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts

Kuang-Huei Lee · Xinyun Chen · Hiroki Furuta · John Canny · Ian Fischer

InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining

Boxin Wang · Wei Ping · Lawrence McAfee · Peng Xu · Bo Li · Mohammad Shoeybi · Bryan Catanzaro

ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimodal Models

Rohan Wadhawan · Hritik Bansal · Kai-Wei Chang · Nanyun Peng

MMT-Bench: A Comprehensive Multimodal Benchmark for Evaluating Large Vision-Language Models Towards Multitask AGI

Kaining Ying · Fanqing Meng · Jin Wang · Zhiqian Li · Han Lin · Yue Yang · Hao Zhang · Wenbo Zhang · Yuqi Lin · Shuo Liu · jiayi lei · Quanfeng Lu · Runjian Chen · Peng Xu · Renrui Zhang · Haozhe Zhang · Peng Gao · Yali Wang · Yu Qiao · Ping Luo · Kaipeng Zhang · WENQI SHAO

Stay on Topic with Classifier-Free Guidance

Guillaume Sanchez · Alexander Spangher · Honglu Fan · Elad Levi · Stella Biderman

Tandem Transformers for Inference Efficient LLMs

Aishwarya P S · Pranav Nair · Yashas Samaga · Toby Boyd · Sanjiv Kumar · Prateek Jain · Praneeth Kumar Netrapalli

Random Masking Finds Winning Tickets for Parameter Efficient Fine-tuning

Jing Xu · Jingzhao Zhang

Watermark Stealing in Large Language Models

Nikola Jovanović · Robin Staab · Martin Vechev

Online Cascade Learning for Efficient Inference over Streams

Lunyiu Nie · Zhimin Ding · Erdong Hu · Christopher Jermaine · Swarat Chaudhuri

Federated Full-Parameter Tuning of Billion-Sized Language Models with Communication Cost under 18 Kilobytes

Zhen Qin · Daoyuan Chen · Bingchen Qian · Bolin Ding · Yaliang Li · Shuiguang Deng

Understanding Reasoning Ability of Language Models From the Perspective of Reasoning Paths Aggregation

Xinyi Wang · Alfonso Amayuelas · Kexun Zhang · Liangming Pan · Wenhu Chen · William Wang

Improving Instruction Following in Language Models through Proxy-Based Uncertainty Estimation

JoonHo Lee · Jae Oh Woo · Juree Seok · Parisa Hassanzadeh · Wooseok Jang · JuYoun Son · Sima Didari · Baruch Gutow · Heng Hao · Hankyu Moon · Wenjun Hu · Yeong-Dae Kwon · Taehee Lee · Seungjai Min

Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo

Stephen Zhao · Rob Brekelmans · Alireza Makhzani · Roger Grosse

SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks

Jiwon Song · Kyungseok Oh · Taesu Kim · Hyungjun Kim · Yulhwa Kim · jae-joon kim

Evaluation of LLMs on Syntax-Aware Code Fill-in-the-Middle Tasks

Linyuan Gong · Sida Wang · Mostafa Elhoushi · Alvin Cheung

Conditional Language Learning with Context

Xiao Zhang · Miao Li · Ji Wu

Improving Accuracy-robustness Trade-off via Pixel Reweighted Adversarial Training

Jiacheng Zhang · Feng Liu · Dawei Zhou · Jingfeng ZHANG · Tongliang Liu

Measuring Stochastic Data Complexity with Boltzmann Influence Functions

Nathan Ng · Roger Grosse · Marzyeh Ghassemi

Learning to Predict Mutational Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning

Lirong Wu · Yijun Tian · Haitao Lin · Yufei Huang · Siyuan Li · Nitesh Chawla · Stan Z Li

Decoupling Feature Extraction and Classification Layers for Calibrated Neural Networks

Mikkel Jordahn · Pablo Olmos

Collective Certified Robustness against Graph Injection Attacks

Yuni Lai · Bailin PAN · kaihuang CHEN · Yancheng Yuan · Kai Zhou

Attack-free Evaluating and Enhancing Adversarial Robustness on Categorical Data

Yujun Zhou · Yufei Han · Haomin Zhuang · Hongyan Bao · Xiangliang Zhang

Towards Efficient Training and Evaluation of Robust Models against $l_0$ Bounded Adversarial Perturbations

Xuyang Zhong · Yixiao HUANG · Chen Liu

Extending Adversarial Attacks to Produce Adversarial Class Probability Distributions

Jon Vadillo · Roberto Santana · Jose A Lozano

From Neurons to Neutrons: A Case Study in Interpretability

Ouail Kitouni · Niklas Nolte · Víctor Samuel Pérez-Díaz · Sokratis Trifinopoulos · Mike Williams

USTAD: Unified Single-model Training Achieving Diverse Scores for Information Retrieval

Seungyeon Kim · Ankit Singh Rawat · Manzil Zaheer · Wittawat Jitkrittum · Veeranjaneyulu Sadhanala · Sadeep Jayasumana · Aditya Menon · Rob Fergus · Sanjiv Kumar

Prototypical Transformer As Unified Motion Learners

Cheng Han · Yawen Lu · Guohao Sun · James Liang · Zhiwen Cao · Qifan Wang · Qiang Guan · Sohail Dianat · Raghuveer Rao · Tong Geng · ZHIQIANG TAO · Dongfang Liu

Improving Factuality and Reasoning in Language Models through Multiagent Debate

Yilun Du · Shuang Li · Antonio Torralba · Josh Tenenbaum · Igor Mordatch

Agent Instructs Large Language Models to be General Zero-Shot Reasoners

Nicholas Crispino · Kyle Montgomery · Fankun Zeng · Dawn Song · Chenguang Wang

Provably Robust DPO: Aligning Language Models with Noisy Feedback

Sayak Ray Chowdhury · Anush Kini · Nagarajan Natarajan

Distinguishing the Knowable from the Unknowable with Language Models

Gustaf Ahdritz · Tian Qin · Nikhil Vyas · Boaz Barak · Benjamin Edelman

Better & Faster Large Language Models via Multi-token Prediction

Fabian Gloeckle · Badr Youbi Idrissi · Baptiste Roziere · David Lopez-Paz · Gabriel Synnaeve

Decoding-time Realignment of Language Models

Tianlin Liu · Shangmin Guo · Leonardo Martins Bianco · Daniele Calandriello · Quentin Berthet · Felipe Llinares-Lopez · Jessica Hoffmann · Lucas Dixon · Michal Valko · Mathieu Blondel

BBox-Adapter: Lightweight Adapting for Black-Box Large Language Models

Haotian Sun · Yuchen Zhuang · Wei Wei · Chao Zhang · Bo Dai

Go to Event Page

Poster

Poster Session 4

1:30 PM - 3:00 PM

432 Events in this session

Statistical Inference Under Constrained Selection Bias

Santiago Cortes-Gomez · Mateo Dulce Rubio · Carlos Miguel Patiño · Bryan Wilder

Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling

Raunaq Bhirangi · Chenyu Wang · Venkatesh Pattabiraman · Carmel Majidi · Abhinav Gupta · Tess Hellebrekers · Lerrel Pinto

Premise Order Matters in Reasoning with Large Language Models

Xinyun Chen · Ryan Chi · Xuezhi Wang · Denny Zhou

Balanced Resonate-and-Fire Neurons

Saya Higuchi · Sebastian Kairat · Sander Bohte · Sebastian Otte

Stability-Informed Initialization of Neural Ordinary Differential Equations

Theodor Westny · Arman Mohammadi · Daniel Jung · Erik Frisk

Doubly Robust Causal Effect Estimation under Networked Interference via Targeted Learning

Weilin Chen · Ruichu Cai · Zeqin Yang · Jie Qiao · Yuguang Yan · Zijian Li · Zhifeng Hao

Experts Don't Cheat: Learning What You Don't Know By Predicting Pairs

Daniel D. Johnson · Daniel Tarlow · David Duvenaud · Chris Maddison

Extending Test-Time Augmentation with Metamorphic Relations for Combinatorial Problems

Siwei Wei · Xudong Zhang · Zhiyang Zhou · Yan Cai

Towards Causal Foundation Model: on Duality between Optimal Balancing and Attention

Jiaqi Zhang · Joel Jennings · Agrin Hilmkil · Nick Pawlowski · Cheng Zhang · Chao Ma

Towards Efficient Spiking Transformer: a Token Sparsification Framework for Training and Inference Acceleration

Zhengyang Zhuge · Peisong Wang · Xingting Yao · Jian Cheng

CLIF: Complementary Leaky Integrate-and-Fire Neuron for Spiking Neural Networks

Yulong Huang · Xiaopeng LIN · Hongwei Ren · Haotian FU · Yue Zhou · Zunchang LIU · biao pan · Bojun Cheng

Multi-Factor Adaptive Vision Selection for Egocentric Video Question Answering

Haoyu Zhang · Meng Liu · Zixin Liu · Xuemeng Song · Yaowei Wang · Liqiang Nie

No Wrong Turns: The Simple Geometry Of Neural Networks Optimization Paths

Charles Guille-Escuret · Hiroki Naganuma · Kilian Fatras · Ioannis Mitliagkas

Learning-Rate-Free Stochastic Optimization over Riemannian Manifolds

Daniel Dodd · Louis Sharrock · Chris Nemeth

Understanding the Training Speedup from Sampling with Approximate Losses

Rudrajit Das · Xi Chen · Bertram Ieong · Parikshit Bansal · Sujay Sanghavi

Optimal Hessian/Jacobian-Free Nonconvex-PL Bilevel Optimization

Feihu Huang

Convergence of Some Convex Message Passing Algorithms to a Fixed Point

Václav Voráček · Tomáš Werner

Optimal Acceleration for Minimax and Fixed-Point Problems is Not Unique

TaeHo Yoon · Jaeyeon (Jay) Kim · Jaewook Suh · Ernest Ryu

Dynamic Correlation Clustering in Sublinear Update Time

Vincent Cohen-Addad · Silvio Lattanzi · Andreas Maggiori · Nikos Parotsidis

Tackling Prevalent Conditions in Unsupervised Combinatorial Optimization: Cardinality, Minimum, Covering, and More

Fanchen Bu · Hyeonsoo Jo · Soo Yong Lee · Sungsoo Ahn · Kijung Shin

DRCT: Diffusion Reconstruction Contrastive Training towards Universal Detection of Diffusion Generated Images

Baoying Chen · Jishen Zeng · Jianquan Yang · Rui Yang

ERQ: Error Reduction for Post-Training Quantization of Vision Transformers

Yunshan Zhong · Jiawei Hu · You Huang · Yuxin Zhang · Rongrong Ji

Discrete Latent Perspective Learning for Segmentation and Detection

Deyi Ji · Feng Zhao · Lanyun Zhu · Wenwei Jin · Hongtao Lu · Jieping Ye

ESNet: Evolution and Succession Network for High-Resolution Salient Object Detection

Hongyu Liu · Runmin Cong · Hua Li · Qianqian Xu · Qingming Huang · Wei Zhang

Position: Mission Critical – Satellite Data is a Distinct Modality in Machine Learning

Esther Rolf · Konstantin Klemmer · Caleb Robinson · Hannah Kerner

Q-Align: Teaching LMMs for Visual Scoring via Discrete Text-Defined Levels

Haoning Wu · Zicheng Zhang · Weixia Zhang · Chaofeng Chen · Liang Liao · Chunyi Li · Yixuan Gao · Annan Wang · Erli Zhang · Wenxiu Sun · Qiong Yan · Xiongkuo Min · Guangtao Zhai · Weisi Lin

Visual-Text Cross Alignment: Refining the Similarity Score in Vision-Language Models

Jinhao Li · Haopeng Li · Sarah Erfani · Lei Feng · James Bailey · Feng Liu

Compress Clean Signal from Noisy Raw Image: A Self-Supervised Approach

Zhihao Li · Yufei Wang · Alex Kot · Bihan Wen

See More Details: Efficient Image Super-Resolution by Experts Mining

Eduard Zamfir · Zongwei Wu · Nancy Mehta · Yulun Zhang · Radu Timofte

Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning

Michal Nauman · Michał Bortkiewicz · Piotr Milos · Tomasz Trzcinski · Mateusz Ostaszewski · Marek Cygan

Geometric Active Exploration in Markov Decision Processes: the Benefit of Abstraction

Riccardo De Santi · Federico Arangath Joseph · Noah Liniger · Mirco Mutti · Andreas Krause

LQER: Low-Rank Quantization Error Reconstruction for LLMs

Cheng Zhang · Jianyi Cheng · George Constantinides · Yiren Zhao

Federated Optimization with Doubly Regularized Drift Correction

Xiaowen Jiang · Anton Rodomanov · Sebastian Stich

Riemannian Accelerated Zeroth-order Algorithm: Improved Robustness and Lower Query Complexity

Chang He · Zhaoye Pan · Xiao Wang · Bo Jiang

Position: Leverage Foundational Models for Black-Box Optimization

Xingyou Song · Yingtao Tian · Robert Lange · Chansoo Lee · Yujin Tang · Yutian Chen

Principled Preferential Bayesian Optimization

Wenjie Xu · Wenbin Wang · Yuning Jiang · Bratislav Svetozarevic · Colin Jones

Posterior Sampling-Based Bayesian Optimization with Tighter Bayesian Regret Bounds

Shion Takeno · Yu Inatsu · Masayuki Karasuyama · Ichiro Takeuchi

Demystifying SGD with Doubly Stochastic Gradients

Kyurae Kim · Joohwan Ko · Yian Ma · Jacob Gardner

Projection-Free Variance Reduction Methods for Stochastic Constrained Multi-Level Compositional Optimization

Wei Jiang · Sifan Yang · Wenhao Yang · Yibo Wang · Yuanyu Wan · Lijun Zhang

Improving Antibody Humanness Prediction using Patent Data

Talip Ucar · Aubin Ramon · Dino Oglic · Rebecca Croasdale-Wood · Tom Diethe · Pietro Sormanni

Mean-field Underdamped Langevin Dynamics and its Spacetime Discretization

Qiang Fu · Ashia Wilson

Non-clairvoyant Scheduling with Partial Predictions

Ziyad Benomar · Vianney Perchet

Differentiability and Optimization of Multiparameter Persistent Homology

Luis Scoccola · Siddharth Setlur · David Loiseaux · Mathieu Carrière · Steve Oudot

Understanding Adam Optimizer via Online Learning of Updates: Adam is FTRL in Disguise

Kwangjun Ahn · Zhiyu Zhang · Yunbum Kook · Yan Dai

Zeroth-Order Methods for Constrained Nonconvex Nonsmooth Stochastic Optimization

Zhuanghua Liu · Cheng Chen · Luo Luo · Bryan Kian Hsiang Low

Convergence and Complexity Guarantee for Inexact First-order Riemannian Optimization Algorithms

Yuchen Li · Laura Balzano · Deanna Needell · Hanbaek Lyu

Measures of diversity and space-filling designs for categorical data

AstraZeneca Pharmaceutica · Emilio Domínguez-Sánchez · Merwan Barlier · Igor Colin · Haitham Bou Ammar · Tom Diethe

Combinatorial Approximations for Cluster Deletion: Simpler, Faster, and Better

Vicente Balmaseda · Ying Xu · Yixin Cao · Nate Veldt

Surface-VQMAE: Vector-quantized Masked Auto-encoders on Molecular Surfaces

Fang Wu · Stan Z Li

Representing Molecules as Random Walks Over Interpretable Grammars

Michael Sun · Minghao Guo · Weize Yuan · Veronika Thost · Crystal Owens · Aristotle Grosz · Sharvaa Selvan · Katelyn Zhou · Hassan Mohiuddin · Benjamin Pedretti · Zachary Smith · Jie Chen · Wojciech Matusik

A Sober Look at LLMs for Material Discovery: Are They Actually Good for Bayesian Optimization Over Molecules?

Agustinus Kristiadi · Felix Strieth-Kalthoff · Marta Skreta · Pascal Poupart · Alan Aspuru-Guzik · Geoff Pleiss

UniCorn: A Unified Contrastive Learning Approach for Multi-view Molecular Representation Learning

Shikun Feng · Yuyan Ni · Li · Yanwen Huang · Zhiming Ma · Wei-Ying Ma · Yanyan Lan

Advancing DRL Agents in Commercial Fighting Games: Training, Integration, and Agent-Human Alignment

Chen Zhang · Qiang HE · Yuan Zhou · Elvis S. Liu · Hong Wang · Jian Zhao · Yang Wang

Position: Data-driven Discovery with Large Generative Models

Bodhisattwa Prasad Majumder · Harshit Surana · Dhruv Agarwal · Sanchaita Hazra · Ashish Sabharwal · Peter Clark

PcLast: Discovering Plannable Continuous Latent States

ANURAG KOUL · Shivakanth Sujit · Shaoru Chen · Benjamin Evans · Lili Wu · Byron Xu · Rajan Chari · Riashat Islam · Raihan Seraj · Yonathan Efroni · Lekan Molu · Miroslav Dudik · John Langford · Alex Lamb

Uncertainty-Aware Reward-Free Exploration with General Function Approximation

Junkai Zhang · Weitong Zhang · Dongruo Zhou · Quanquan Gu

Mollification Effects of Policy Gradient Methods

Tao Wang · Sylvia Herbert · Sicun Gao

MusicRL: Aligning Music Generation to Human Preferences

Geoffrey Cideron · Sertan Girgin · Mauro Verzetti · Damien Vincent · Matej Kastelic · Zalán Borsos · Brian McWilliams · Victor Ungureanu · Olivier Bachem · Olivier Pietquin · Matthieu Geist · Léonard Hussenot · Neil Zeghidour · Andrea Agostinelli

Planning, Fast and Slow: Online Reinforcement Learning with Action-Free Offline Data via Multiscale Planners

Chengjie Wu · Hao Hu · yiqin yang · Ning Zhang · Chongjie Zhang

Efficient Value Iteration for s-rectangular Robust Markov Decision Processes

Navdeep Kumar · Kaixin Wang · Kfir Levy · Shie Mannor

An Information Theoretic Approach to Interaction-Grounded Learning

Xiaoyan Hu · Farzan Farnia · Ho-fung Leung

Tackling Non-Stationarity in Reinforcement Learning via Causal-Origin Representation

Wanpeng Zhang · Yilin Li · Boyu Yang · Zongqing Lu

ArCHer: Training Language Model Agents via Hierarchical Multi-Turn RL

Yifei Zhou · Andrea Zanette · Jiayi Pan · Sergey Levine · Aviral Kumar

Policy-conditioned Environment Models are More Generalizable

Ruifeng Chen · Xiong-Hui Chen · Yihao Sun · Siyuan Xiao · Minhui Li · Yang Yu

Robust Inverse Constrained Reinforcement Learning under Model Misspecification

Sheng Xu · Guiliang Liu

Provably Efficient Reinforcement Learning for Adversarial Restless Multi-Armed Bandits with Unknown Transitions and Bandit Feedback

GUOJUN XIONG · Jian Li

Model-based Reinforcement Learning for Parameterized Action Spaces

Renhao Zhang · Haotian Fu · Yilin Miao · George Konidaris

Sequential Asynchronous Action Coordination in Multi-Agent Systems: A Stackelberg Decision Transformer Approach

Bin Zhang · Hangyu Mao · Lijuan Li · Zhiwei Xu · dapeng Li · Rui Zhao · Guoliang Fan

Optimal Batched Linear Bandits

Xuanfei Ren · Tianyuan Jin · Pan Xu

Model-based Reinforcement Learning for Confounded POMDPs

Mao Hong · Zhengling Qi · Yanxun Xu

Scalable Safe Policy Improvement for Factored Multi-Agent MDPs

Federico Bianchi · Edoardo Zorzi · Alberto Castellini · Thiago Simão · Matthijs T. J. Spaan · Alessandro Farinelli

Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning

Xiaoyu Wen · Chenjia Bai · Kang Xu · Xudong Yu · Yang Zhang · Xuelong Li · Zhen Wang

FuRL: Visual-Language Models as Fuzzy Rewards for Reinforcement Learning

Yuwei Fu · Haichao Zhang · di wu · Wei Xu · Benoit Boulet

Position: Evolving AI Collectives Enhance Human Diversity and Enable Self-Regulation

Shiyang Lai · Yujin Potter · Junsol Kim · Richard Zhuang · Dawn Song · James Evans

Detecting Influence Structures in Multi-Agent Reinforcement Learning

Fabian Raoul Pieroth · Katherine Fitch · Lenz Belzner

Multi-Agent Reinforcement Learning with Hierarchical Coordination for Emergency Responder Stationing

Amutheezan Sivagnanam · Ava Pettet · Hunter Lee · Ayan Mukhopadhyay · Abhishek Dubey · Aron Laszka

Imitation Learning from Purified Demonstrations

Yunke Wang · Minjing Dong · Yukun Zhao · Bo Du · Chang Xu

A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedback

Kihyun Kim · Jiawei Zhang · Asuman Ozdaglar · Pablo A. Parrilo

Confidence Aware Inverse Constrained Reinforcement Learning

Sriram Ganapathi Subramanian · Guiliang Liu · Mohammed Elmahgiubi · Kasra Rezaee · Pascal Poupart

Rate-Optimal Policy Optimization for Linear Markov Decision Processes

Uri Sherman · Alon Cohen · Tomer Koren · Yishay Mansour

In value-based deep reinforcement learning, a pruned network is a good network

Johan Obando Ceron · Aaron Courville · Pablo Samuel Castro

In-Context Reinforcement Learning for Variable Action Spaces

Viacheslav Sinii · Alexander Nikulin · Vladislav Kurenkov · Ilya Zisman · Sergey Kolesnikov

Craftax: A Lightning-Fast Benchmark for Open-Ended Reinforcement Learning

Michael Matthews · Michael Beukman · Benjamin Ellis · Mikayel Samvelyan · Matthew T Jackson · Samuel Coward · Jakob Foerster

Stop Regressing: Training Value Functions via Classification for Scalable Deep RL

Jesse Farebrother · Jordi Orbay · Quan Vuong · Adrien Ali Taiga · Yevgen Chebotar · Ted Xiao · Alexander Irpan · Sergey Levine · Pablo Samuel Castro · Aleksandra Faust · Aviral Kumar · Rishabh Agarwal

VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling

Siyuan Li · Zedong Wang · Zicheng Liu · Di Wu · Cheng Tan · Jiangbin Zheng · Yufei Huang · Stan Z Li

Quality-Diversity with Limited Resources

Ren-Jian Wang · Ke Xue · Cong Guan · Chao Qian

SAPG: Split and Aggregate Policy Gradients

Jayesh Singla · Ananye Agarwal · Deepak Pathak

Learning a Diffusion Model Policy from Rewards via Q-Score Matching

Michael Psenka · Alejandro Escontrela · Pieter Abbeel · Yi Ma

Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulation

Ignat Georgiev · Krishnan Srinivasan · Jie Xu · Eric Heiden · Animesh Garg

INViT: A Generalizable Routing Problem Solver with Invariant Nested View Transformer

Han Fang · Zhihao Song · Paul Weng · Yutong Ban

A Bayesian Approach to Online Planning

Nir Greshler · David Ben Eli · Carmel Rabinovitz · Gabi Guetta · Liran Gispan · Guy Zohar · Aviv Tamar

Highway Value Iteration Networks

Yuhui Wang · Weida Li · Francesco Faccio · Qingyuan Wu · Jürgen Schmidhuber

Accelerated Policy Gradient for s-rectangular Robust MDPs with Large State Spaces

Ziyi Chen · Heng Huang

Reinforcement Learning from Reachability Specifications: PAC Guarantees with Expected Conditional Distance

Jakub Svoboda · Suguman Bansal · Krishnendu Chatterjee

To the Max: Reinventing Reward in Reinforcement Learning

Grigorii Veviurko · Wendelin Boehmer · Mathijs de Weerdt

A Distributional Analogue to the Successor Representation

Harley Wiltzer · Jesse Farebrother · Arthur Gretton · Yunhao Tang · Andre Barreto · Will Dabney · Marc Bellemare · Mark Rowland

Estimating Unknown Population Sizes Using the Hypergeometric Distribution

Liam Hodgson · Danilo Bzdok

Random matrix theory improved Fréchet mean of symmetric positive definite matrices

Florent Bouchard · Ammar Mian · Malik TIOMOKO · Guillaume GINOLHAC · Frederic Pascal

A Computational Framework for Solving Wasserstein Lagrangian Flows

Kirill Neklyudov · Rob Brekelmans · Alexander Tong · Lazar Atanackovic · qiang liu · Alireza Makhzani

Nonlinear Filtering with Brenier Optimal Transport Maps

Mohammad Al-Jarrah · Niyizhen Jin · Bamdad Hosseini · Amirhossein Taghvaei

Deep Functional Factor Models: Forecasting High-Dimensional Functional Time Series via Bayesian Nonparametric Factorization

Yirui Liu · Xinghao Qiao · Yulong Pei · Liying Wang

Connecting the Dots: Is Mode-Connectedness the Key to Feasible Sample-Based Inference in Bayesian Neural Networks?

Emanuel Sommer · Lisa Wimmer · Theodore Papamarkou · Ludwig Bothmann · Bernd Bischl · David Rügamer

Exact Soft Analytical Side-Channel Attacks using Tractable Circuits

Thomas Wedenig · Rishub Nagpal · Gaëtan Cassiers · Stefan Mangard · Robert Peharz

A connection between Tempering and Entropic Mirror Descent

Nicolas Chopin · Francesca R Crucinio · Anna Korba

Improving Gradient-Guided Nested Sampling for Posterior Inference

Pablo Lemos · Nikolay Malkin · Will Handley · Yoshua Bengio · Yashar Hezaveh · Laurence Perreault-Levasseur

Iterated Denoising Energy Matching for Sampling from Boltzmann Densities

Tara Akhound-Sadegh · Jarrid Rector-Brooks · Joey Bose · Sarthak Mittal · Pablo Lemos · Chenghao Liu · Marcin Sendera · Siamak Ravanbakhsh · Gauthier Gidel · Yoshua Bengio · Nikolay Malkin · Alexander Tong

Sampling in Unit Time with Kernel Fisher-Rao Flow

Aimee Maurais · Youssef Marzouk

Multi-Fidelity Residual Neural Processes for Scalable Surrogate Modeling

Brooks(Ruijia) Niu · Dongxia Wu · Kai Kim · Yian Ma · Duncan Watson-Parris · Rose Yu

Implicit Bias of Policy Gradient in Linear Quadratic Control: Extrapolation to Unseen Initial States

Noam Razin · Yotam Alexander · Edo Cohen-Karlik · Raja Giryes · Amir Globerson · Nadav Cohen

Universal Consistency of Wide and Deep ReLU Neural Networks and Minimax Optimal Convergence Rates for Kolmogorov-Donoho Optimal Function Classes

Hyunouk Ko · Xiaoming Huo

Understanding Unimodal Bias in Multimodal Deep Linear Networks

Yedi Zhang · Peter Latham · Andrew Saxe

Hyperbolic Active Learning for Semantic Segmentation under Domain Shift

Luca Franco · Paolo Mandica · Konstantinos Kallidromitis · Devin Guillory · Yu-Teng Li · Trevor Darrell · Fabio Galasso

O$n$ Learning Deep O($n$)-Equivariant Hyperspheres

Pavlo Melnyk · Michael Felsberg · Mårten Wadenbäck · Andreas Robinson · Cuong Le

Online Learning and Information Exponents: The Importance of Batch size & Time/Complexity Tradeoffs

Luca Arnaboldi · Yatin Dandi · FLORENT KRZAKALA · Bruno Loureiro · Luca Pesce · Ludovic Stephan

Winner-takes-all learners are geometry-aware conditional density estimators

Victor Letzelter · David Perera · C√©dric Rommel · Mathieu Fontaine · Slim Essid · Gaël Richard · Patrick Perez

Sobolev Space Regularised Pre Density Models

Mark Kozdoba · Binyamin Perets · Shie Mannor

Reparameterized Importance Sampling for Robust Variational Bayesian Neural Networks

Yunfei Long · Zilin Tian · Liguo Zhang · Huosheng Xu

How Transformers Learn Causal Structure with Gradient Descent

Eshaan Nichani · Alex Damian · Jason Lee

Learning High-Frequency Functions Made Easy with Sinusoidal Positional Encoding

Chuanhao Sun · Zhihang Yuan · Kai Xu · Luo Mai · Siddharth N · Shuo Chen · Mahesh Marina

One Size Fits All for Semantic Shifts: Adaptive Prompt Tuning for Continual Learning

Doyoung Kim · Susik Yoon · Dongmin Park · Youngjun Lee · Hwanjun Song · Jihwan Bang · Jae-Gil Lee

Graphon Mean Field Games with a Representative Player: Analysis and Learning Algorithm

Fuzhong Zhou · Chenyu Zhang · Xu Chen · Xuan Di

Algorithmic Stability Unleashed: Generalization Bounds with Unbounded Losses

Shaojie Li · Bowei Zhu · Yong Liu

On the Asymptotic Distribution of the Minimum Empirical Risk

Jacob Westerhout · TrungTin Nguyen · Xin Guo · Hien Nguyen

Characterizing Overfitting in Kernel Ridgeless Regression Through the Eigenspectrum

Tin Sum Cheng · Aurelien Lucchi · Anastasis Kratsios · David Belius

Stability and Generalization for Stochastic Recursive Momentum-based Algorithms for (Strongly-)Convex One to $K$-Level Stochastic Optimizations

Xiaokang Pan · Xingyu Li · Jin Liu · Tao Sun · Kai Sun · Lixing Chen · Zhe Qu

No Double Descent in Principal Component Regression: A High-Dimensional Analysis

Daniel Gedon · Antonio Ribeiro · Thomas Schön

Online Learning with Bounded Recall

Jon Schneider · Kiran Vodrahalli

Faster Streaming and Scalable Algorithms for Finding Directed Dense Subgraphs in Large Graphs

Slobodan Mitrovic · Theodore Pan

Characterizing ResNet's Universal Approximation Capability

Chenghao Liu · Enming Liang · Minghua Chen

$H$-Consistency Guarantees for Regression

Anqi Mao · Mehryar Mohri · Yutao Zhong

Agnostic Learning of Mixed Linear Regressions with EM and AM Algorithms

Avishek Ghosh · Arya Mazumdar

Is Temperature Sample Efficient for Softmax Gaussian Mixture of Experts?

Huy Nguyen · Pedram Akbarian · Nhat Ho

Understanding the Impact of Introducing Constraints at Inference Time on Generalization Error

Masaaki Nishino · Kengo Nakamura · Norihito Yasuda

Unveiling the Cycloid Trajectory of EM Iterations in Mixed Linear Regression

Zhankun Luo · Abolfazl Hashemi

Generalization Analysis for Multi-Label Learning

Yi-Fan Zhang · Min-Ling Zhang

Factored-Reward Bandits with Intermediate Observations

Marco Mussi · Simone Drago · Marcello Restelli · Alberto Maria Metelli

Nash Incentive-compatible Online Mechanism Learning via Weakly Differentially Private Online Learning

Joon Suk Huh · Kirthevasan Kandasamy

Projection-Free Online Convex Optimization with Time-Varying Constraints

Dan Garber · Ben Kretzu

Noise-Adaptive Confidence Sets for Linear Bandits and Application to Bayesian Optimization

Kwang-Sung Jun · Jungtaek Kim

Online Learning under Budget and ROI Constraints via Weak Adaptivity

Matteo Castiglioni · Andrea Celli · Christian Kroer

Finite Time Logarithmic Regret Bounds for Self-Tuning Regulation

Rahul Singh · Akshay Mete · Avik Kar · P. R. Kumar

Randomized Confidence Bounds for Stochastic Partial Monitoring

Maxime Heuillet · Ola Ahmad · Audrey Durand

Revitalizing Multivariate Time Series Forecasting: Learnable Decomposition with Inter-Series Dependencies and Intra-Series Variations Modeling

Guoqi Yu · Jing Zou · Xiaowei Hu · Angelica I Aviles-Rivero · Jing Qin · Shujun Wang

Performance Bounds for Active Binary Testing with Information Maximization

Aditya Chattopadhyay · Benjamin Haeffele · Rene Vidal · Donald Geman

Reducing Balancing Error for Causal Inference via Optimal Transport

Yuguang Yan · Hao Zhou · Zeqin Yang · Weilin Chen · Ruichu Cai · Zhifeng Hao

Jacobian Regularizer-based Neural Granger Causality

Wanqi Zhou · Shuanghao Bai · Shujian Yu · Qibin Zhao · Badong Chen

Causal Effect Identification in LiNGAM Models with Latent Confounders

Daniele Tramontano · Yaroslav Kivva · Saber Salehkaleybar · Mathias Drton · Negar Kiyavash

Effect-Invariant Mechanisms for Policy Generalization

Sorawit Saengkyongam · Niklas Pfister · Predag Klasnja · Susan Murphy · Jonas Peters

Balancing Feature Similarity and Label Variability for Optimal Size-Aware One-shot Subset Selection

Abhinab Acharya · Dayou Yu · Qi Yu · Xumin Liu

Reweighted Solutions for Weighted Low Rank Approximation

David Woodruff · Taisuke Yasuda

Efficient Exploration in Average-Reward Constrained Reinforcement Learning: Achieving Near-Optimal Regret With Posterior Sampling

Danil Provodin · Maurits Kaptein · Mykola Pechenizkiy

A Primal-Dual Algorithm for Offline Constrained Reinforcement Learning with Linear MDPs

Kihyuk Hong · Ambuj Tewari

Run-Time Task Composition with Safety Semantics

Kevin Leahy · Makai Mann · Zachary Serlin

$\bf{\Phi}_\textrm{Flow}$: Differentiable Simulations for PyTorch, TensorFlow and Jax

Philipp Holl · Nils Thuerey

Causal Customer Churn Analysis with Low-rank Tensor Block Hazard Model

Chenyin Gao · ZHIMING ZHANG · Shu Yang

Off-policy Evaluation Beyond Overlap: Sharp Partial Identification Under Smoothness

Samir Khan · Martin Saveski · Johan Ugander

Meta-Learners for Partially-Identified Treatment Effects Across Multiple Environments

Jonas Schweisthal · Dennis Frauen · M van der Schaar · Stefan Feuerriegel

Interplay of ROC and Precision-Recall AUCs: Theoretical Limits and Practical Implications in Binary Classification

Martin Mihelich · François Castagnos · Charles Dognin

CurBench: Curriculum Learning Benchmark

Yuwei Zhou · Zirui Pan · Xin Wang · Hong Chen · Haoyang Li · Yanwen Huang · Zhixiao Xiong · Fangzhou Xiong · Peiyang Xu · Shengnan liu · Wenwu Zhu

COPAL: Continual Pruning in Large Language Generative Models

Srikanth Malla · Joon Hee Choi · Chiho Choi

Socialized Learning: Making Each Other Better Through Multi-Agent Collaboration

Xinjie Yao · Yu Wang · Pengfei Zhu · Wanyu LIN · Li Jialu · Weihao Li · Qinghua Hu

Mind the Boundary: Coreset Selection via Reconstructing the Decision Boundary

Shuo Yang · Zhe Cao · Sheng Guo · Ruiheng Zhang · Ping Luo · Shengping Zhang · Liqiang Nie

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Shengchao Hu · Ziqing Fan · Li Shen · Ya Zhang · Yanfeng Wang · Dacheng Tao

Towards a Self-contained Data-driven Global Weather Forecasting Framework

Yi Xiao · LEI BAI · Wei Xue · Hao Chen · Kun Chen · kang chen · Tao Han · Wanli Ouyang

Using Uncertainty Quantification to Characterize and Improve Out-of-Domain Learning for PDEs

Chandra Mouli Sekar · Danielle Robinson · Shima Alizadeh · Gaurav Gupta · Andrew Stuart · Michael Mahoney · Yuyang Wang

Equivariant Graph Neural Operator for Modeling 3D Dynamics

Minkai Xu · Jiaqi Han · Aaron Lou · Jean Kossaifi · Arvind Ramanathan · Kamyar Azizzadenesheli · Jure Leskovec · Stefano Ermon · Anima Anandkumar

3D-VLA: A 3D Vision-Language-Action Generative World Model

Haoyu Zhen · Xiaowen Qiu · Peihao Chen · Jincheng Yang · Xin Yan · Yilun Du · Yining Hong · Chuang Gan

Position: Scaling Simulation is Neither Necessary Nor Sufficient for In-the-Wild Robot Manipulation

Homanga Bharadhwaj

Learning Reward for Robot Skills Using Large Language Models via Self-Alignment

Yuwei Zeng · Yao Mu · Lin Shao

CATS: Enhancing Multivariate Time Series Forecasting by Constructing Auxiliary Time Series as Exogenous Variables

Jiecheng Lu · Xu Han · Sun · Shihao Yang

Learning Optimal Projection for Forecast Reconciliation of Hierarchical Time Series

Asterios Tsiourvas · Wei Sun · Georgia Perakis · Pin-Yu Chen · Yada Zhu

MF-CLR: Multi-Frequency Contrastive Learning Representation for Time Series

Jufang Duan · Wei Zheng · Yangzhou Du · Wenfa Wu · Haipeng Jiang · Hongsheng Qi

A decoder-only foundation model for time-series forecasting

Abhimanyu Das · Weihao Kong · Rajat Sen · Yichen Zhou

Language-Driven Cross-Modal Classifier for Zero-Shot Multi-Label Image Recognition

Yicheng Liu · Jie Wen · Chengliang Liu · xiaozhao fang · Zuoyong Li · Yong Xu · Zheng Zhang

Multi-Source Conformal Inference Under Distribution Shift

Yi Liu · Alexander Levis · Sharon-Lise Normand · Larry Han

Meta-Reinforcement Learning Robust to Distributional Shift Via Performing Lifelong In-Context Learning

TengYe Xu · Zihao Li · Qinyuan Ren

Towards the Theory of Unsupervised Federated Learning: Non-asymptotic Analysis of Federated EM Algorithms

Ye Tian · Haolei Weng · Yang Feng

Enhancing Cross-Modal Fine-Tuning with Gradually Intermediate Modality Generation

Lincan Cai · Shuang Li · Wenxuan Ma · Jingxuan Kang · Binhui Xie · Zixun Sun · Chengwei Zhu

Pseudo-Calibration: Improving Predictive Uncertainty Estimation in Unsupervised Domain Adaptation

Dapeng Hu · Jian Liang · Xinchao Wang · Chuan-Sheng Foo

Non-parametric Online Change Point Detection on Riemannian Manifolds

Xiuheng Wang · Ricardo Borsoi · Cédric Richard

Federated Combinatorial Multi-Agent Multi-Armed Bandits

Fares Fourati · Mohamed-Slim Alouini · Vaneet Aggarwal

Positive and Unlabeled Learning with Controlled Probability Boundary Fence

Changchun Li · Yuanchao Dai · Lei Feng · Ximing Li · Bing Wang · Jihong Ouyang

Erasing the Bias: Fine-Tuning Foundation Models for Semi-Supervised Learning

Kai Gan · Tong Wei

Modelling Microbial Communities with Graph Neural Networks

Albane Ruaud · Cansu Sancaktar · Marco Bagatella · Christoph Ratzke · Georg Martius

MC-GTA: Metric-Constrained Model-Based Clustering using Goodness-of-fit Tests with Autocorrelations

Zhangyu Wang · Gengchen Mai · Krzysztof Janowicz · Ni Lao

Diffusion-based Missing-view Generation With the Application on Incomplete Multi-view Clustering

Jie Wen · Shijie Deng · Waikeung Wong · Guoqing Chao · Chao Huang · Lunke Fei · Yong Xu

Long-Tail Learning with Foundation Model: Heavy Fine-Tuning Hurts

Jiang-Xin Shi · Tong Wei · Zhi Zhou · Jie-Jing Shao · Xin-Yan Han · Yu-Feng Li

Implicit Representations for Constrained Image Segmentation

Jan Philipp Schneider · Mishal Fatima · Jovita Lukasik · Andreas Kolb · Margret Keuper · Michael Moeller

Neural-Kernel Conditional Mean Embeddings

Eiki Shimizu · Kenji Fukumizu · Dino Sejdinovic

Adaptive Learning of Density Ratios in RKHS

Werner Zellinger · Stefan Kindermann · Sergei V. Pereverzyev

Ambiguity-Aware Abductive Learning

Hao-Yuan He · Hui Sun · Zheng Xie · Ming Li

Operator SVD with Neural Networks via Nested Low-Rank Approximation

Jongha (Jon) Ryu · Xiangxiang Xu · Hasan Sabri Melihcan Erol · Yuheng Bu · Lizhong Zheng · Gregory Wornell

Speech Self-Supervised Learning Using Diffusion Model Synthetic Data

Heting Gao · Kaizhi Qian · Junrui Ni · Chuang Gan · Mark Hasegawa-Johnson · Shiyu Chang · Yang Zhang

LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery

Pingchuan Ma · Johnson Tsun-Hsuan Wang · Minghao Guo · Zhiqing Sun · Josh Tenenbaum · Daniela Rus · Chuang Gan · Wojciech Matusik

Efficient and Effective Time-Series Forecasting with Spiking Neural Networks

Changze Lv · Yansen Wang · Dongqi Han · Xiaoqing Zheng · Xuanjing Huang · Dongsheng Li

Predictive Coding beyond Correlations

Tommaso Salvatori · Luca Pinchetti · Amine M'Charrak · Beren Millidge · Thomas Lukasiewicz

AutoOS: Make Your OS More Powerful by Exploiting Large Language Models

Huilai Chen · Yuanbo Wen · Limin Cheng · Shouxu Kuang · Yumeng Liu · Weijia Li · Ling Li · Rui Zhang · Xinkai Song · Wei Li · Qi Guo · Yunji Chen

A Unified Adaptive Testing System Enabled by Hierarchical Structure Search

Junhao Yu · Yan Zhuang · Zhenya Huang · Qi Liu · Xin Li · Rui Li · Enhong Chen

On the Origins of Linear Representations in Large Language Models

Yibo Jiang · Goutham Rajendran · Pradeep Ravikumar · Bryon Aragam · Victor Veitch

Position: Why We Must Rethink Empirical Research in Machine Learning

Moritz Herrmann · F. Julian D. Lange · Katharina Eggensperger · Giuseppe Casalicchio · Marcel Wever · Matthias Feurer · David Rügamer · Eyke Hüllermeier · Anne-Laure Boulesteix · Bernd Bischl

The Role of Learning Algorithms in Collective Action

Omri Ben-Dov · Jake Fawkes · Samira Samadi · Amartya Sanyal

Locally Estimated Global Perturbations are Better than Local Perturbations for Federated Sharpness-aware Minimization

Ziqing Fan · Shengchao Hu · Jiangchao Yao · Gang Niu · Ya Zhang · Masashi Sugiyama · Yanfeng Wang

Delving into Differentially Private Transformer

Youlong Ding · Xueyang Wu · Yining meng · Yonggang Luo · Hao Wang · Pan Weike

The Fundamental Limits of Least-Privilege Learning

Theresa Stadler · Bogdan Kulynych · Michael Gastpar · Nicolas Papernot · Carmela Troncoso

Trained Random Forests Completely Reveal your Dataset

Julien Ferry · Ricardo Fukasawa · Timothée Pascal · Thibaut Vidal

Mean Estimation in the Add-Remove Model of Differential Privacy

Alex Kulesza · Ananda Suresh · Yuyan Wang

Differentially Private Bias-Term Fine-tuning of Foundation Models

Zhiqi Bu · Yu-Xiang Wang · Sheng Zha · George Karypis

Beyond the Calibration Point: Mechanism Comparison in Differential Privacy

Georgios Kaissis · Stefan Kolek · Borja de Balle Pigem · Jamie Hayes · Daniel Rueckert

PriorBoost: An Adaptive Algorithm for Learning from Aggregate Responses

Adel Javanmard · Matthew Fahrbach · Vahab Mirrokni

Low-Cost High-Power Membership Inference Attacks

Sajjad Zarifzadeh · Philippe Liu · Reza Shokri

Differentially Private Sum-Product Networks

Xenia Heilmann · Mattia Cerrato · Ernst Althaus

PID: Prompt-Independent Data Protection Against Latent Diffusion Models

Ang Li · Yichuan Mo · Mingjie Li · Yisen Wang

PerceptAnon: Exploring the Human Perception of Image Anonymization Beyond Pseudonymization for GDPR

Kartik Patwari · Chen-Nee Chuah · Lingjuan Lyu · Vivek Sharma

Conformal Prediction Sets Improve Human Decision Making

Jesse Cresswell · yi sui · Bhargava Kumar · Noël Vouitsis

Tilt and Average : Geometric Adjustment of the Last Layer for Recalibration

Gyusang Cho · Chan-Hyun Youn

How do Large Language Models Navigate Conflicts between Honesty and Helpfulness?

Ryan Liu · Theodore R Sumers · Ishita Dasgupta · Thomas Griffiths

Extracting Training Data From Document-Based VQA Models

Francesco Pinto · Nathalie Rauschmayr · Florian Tramer · Phil Torr · Federico Tombari

TERD: A Unified Framework for Safeguarding Diffusion Models Against Backdoors

Yichuan Mo · Hui Huang · Mingjie Li · Ang Li · Yisen Wang

Intersecting-Boundary-Sensitive Fingerprinting for Tampering Detection of DNN Models

Xiaofan Bai · Chaoxiang He · Xiaojing Ma · Bin Zhu · Hai Jin

Score-Based Causal Discovery of Latent Variable Causal Models

Ignavier Ng · Xinshuai Dong · Haoyue Dai · Biwei Huang · Peter Spirtes · Kun Zhang

AI Alignment with Changing and Influenceable Reward Functions

Micah Carroll · Davis Foote · Anand Siththaranjan · Stuart Russell · Anca Dragan

Progressive Inference: Explaining Decoder-Only Sequence Classification Models Using Intermediate Predictions

Sanjay Kariyappa · Freddy Lecue · Saumitra Mishra · Christopher Pond · Daniele Magazzeni · Manuela Veloso

Deletion-Anticipative Data Selection with a Limited Budget

Rachael Hwee Ling Sim · Jue Fan · Xiao Tian · Patrick Jaillet · Bryan Kian Hsiang Low

Stability and Multigroup Fairness in Ranking with Uncertain Predictions

Siddartha Devic · Aleksandra Korolova · David Kempe · Vatsal Sharan

Stealing part of a production language model

Nicholas Carlini · Daniel Paleka · Krishnamurthy Dvijotham · Thomas Steinke · Jonathan Hayase · A. Feder Cooper · Katherine Lee · Matthew Jagielski · Milad Nasr · Arthur Conmy · Eric Wallace · David Rolnick · Florian Tramer

A Theoretical Analysis of Backdoor Poisoning Attacks in Convolutional Neural Networks

Boqi Li · Weiwei Liu

Robust Universal Adversarial Perturbations

Changming Xu · Gagandeep Singh

Structure Your Data: Towards Semantic Graph Counterfactuals

Angeliki Dimitriou · Maria Lymperaiou · Giorgos Filandrianos · Konstantinos Thomas · Giorgos Stamou

Compact Optimality Verification for Optimization Proxies

Wenbo Chen · Haoruo Zhao · Mathieu Tanneau · Pascal Van Hentenryck

Robust Yet Efficient Conformal Prediction Sets

Soroush H. Zargarbashi · Mohammad Sadegh Akhondzadeh · Aleksandar Bojchevski

Agent Smith: A Single Image Can Jailbreak One Million Multimodal LLM Agents Exponentially Fast

Xiangming Gu · Xiaosen Zheng · Tianyu Pang · Chao Du · Qian Liu · Ye Wang · Jing Jiang · Min Lin

DISCRET: Synthesizing Faithful Explanations For Treatment Effect Estimation

Yinjun Wu · Mayank Keoliya · Kan Chen · Neelay Velingker · Ziyang Li · Emily Getzen · Qi Long · Mayur Naik · Ravi Parikh · Eric Wong

Augmenting Decision with Hypothesis in Reinforcement Learning

Nguyen Minh Quang · Hady Lauw

Fair Federated Learning via the Proportional Veto Core

Bhaskar Ray Chaudhury · Aniket Murhekar · Zhuowen Yuan · Bo Li · Ruta Mehta · Ariel Procaccia

TimeX++: Learning Time-Series Explanations with Information Bottleneck

Zichuan Liu · Tianchun Wang · Jimeng Shi · Xu Zheng · Zhuomin Chen · Lei Song · Wenqian Dong · Jayantha Obeysekera · Farhad Shirani · Dongsheng Luo

Performative Prediction with Bandit Feedback: Learning through Reparameterization

Yatong Chen · Wei Tang · Chien-Ju Ho · Yang Liu

SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decoding

Chanho Park · Namyoon Lee

Hidden Traveling Waves bind Working Memory Variables in Recurrent Neural Networks

Arjun Karuvally · Terrence Sejnowski · Hava Siegelmann

Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion

Ishaan Rawal · Alexander Matyasko · Shantanu Jaiswal · Basura Fernando · Cheston Tan

Interpretability Illusions in the Generalization of Simplified Models

Dan Friedman · Andrew Lampinen · Lucas Dixon · Danqi Chen · Asma Ghandeharioun

On the Tractability of SHAP Explanations under Markovian Distributions

Reda Marzouk · De la Higuera

A Multimodal Automated Interpretability Agent

Tamar Rott Shaham · Sarah Schwettmann · Franklin Wang · Achyuta Rajaram · Evan Hernandez · Jacob Andreas · Antonio Torralba

Manifold Integrated Gradients: Riemannian Geometry for Feature Attribution

Eslam Zaher · Maciej Trzaskowski · Quan Nguyen · Fred Roosta

MD tree: a model-diagnostic tree grown on loss landscape

Yefan Zhou · Jianlong Chen · Qinxue Cao · Konstantin Schürholt · Yaoqing Yang

Local vs. Global Interpretability: A Computational Complexity Perspective

Shahaf Bassan · Guy Amir · Guy Katz

Attention Meets Post-hoc Interpretability: A Mathematical Perspective

Gianluigi Lopardo · Frederic Precioso · Damien Garreau

Remembering to Be Fair: Non-Markovian Fairness in Sequential Decision Making

Parand A. Alamdari · Toryn Q. Klassen · Elliot Creager · Sheila McIlraith

Monotone Individual Fairness

Yahav Bechavod

MaxMin-RLHF: Alignment with Diverse Human Preferences

Souradip Chakraborty · Jiahao Qiu · Hui Yuan · Alec Koppel · Dinesh Manocha · Furong Huang · Amrit Singh Bedi · Mengdi Wang

Centralized Selection with Preferences in the Presence of Biases

L. Elisa Celis · Amit Kumar · Nisheeth K. Vishnoi · Shangyu Andrew Xu

Intersectional Unfairness Discovery

Gezheng Xu · Qi CHEN · Charles X. Ling · Boyu Wang · Changjian Shui

AI Control: Improving Safety Despite Intentional Subversion

Ryan Greenblatt · Buck Shlegeris · Kshitij Sachan · Fabien Roger

Orthogonal Bootstrap: Efficient Simulation of Input Uncertainty

Kaizhao Liu · Jose Blanchet · Lexing Ying · Yiping Lu

Retrieval Across Any Domains via Large-scale Pre-trained Model

Jiexi Yan · Zhihui Yin · Chenghao Xu · Cheng Deng · Heng Huang

Learning Pseudo-Contractive Denoisers for Inverse Problems

Deliang Wei · Peng Chen · Fang Li

Detecting and Identifying Selection Structure in Sequential Data

Yujia Zheng · Zeyu Tang · Yiwen Qiu · Bernhard Schölkopf · Kun Zhang

Bespoke Non-Stationary Solvers for Fast Sampling of Diffusion and Flow Models

Neta Shaul · Uriel Singer · Ricky T. Q. Chen · Matthew Le · Ali Thabet · Albert Pumarola · Yaron Lipman

Compute Better Spent: Replacing Dense Layers with Structured Matrices

Shikai Qiu · Andres Potapczynski · Marc Finzi · Micah Goldblum · Andrew Wilson

Learning Latent Dynamic Robust Representations for World Models

Ruixiang Sun · Hongyu Zang · Xin Li · Riashat Islam

Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines

Yuchen Li · Alexandre Kirchmeyer · Aashay Mehta · Yilong Qin · Boris Dadachev · Kishore Papineni · Sanjiv Kumar · Andrej Risteski

A Space Group Symmetry Informed Network for O(3) Equivariant Crystal Tensor Prediction

Keqiang Yan · Alexandra Saxton · Xiaofeng Qian · Xiaoning Qian · Shuiwang Ji

A Geometric Decomposition of Finite Games: Convergence vs. Recurrence under Exponential Weights

Davide Legacci · Panayotis Mertikopoulos · Bary Pradelski

Kepler codebook

Junrong Lian · Ziyue Dong · Pengxu Wei · Wei Ke · Chang Liu · Qixiang Ye · Xiangyang Ji · Liang Lin

High-dimensional Linear Bandits with Knapsacks

Wanteng Ma · Dong Xia · Jiashuo Jiang

Certifiably Byzantine-Robust Federated Conformal Prediction

Mintong Kang · Zhen Lin · Jimeng Sun · Cao Xiao · Bo Li

On the Nonlinearity of Layer Normalization

Yunhao Ni · Yuxin Guo · Junlong Jia · Lei Huang

On the Calibration of Human Pose Estimation

Kerui Gu · Rongyu Chen · Xuanlong Yu · Angela Yao

Large Scale Dataset Distillation with Domain Shift

Noel Loo · Alaa Maalouf · Ramin Hasani · Mathias Lechner · Alexander Amini · Daniela Rus

Position: Intent-aligned AI Systems Must Optimize for Agency Preservation

Catalin Mitelut · Benjamin Smith · Peter Vamplew

Position: Fundamental Limitations of LLM Censorship Necessitate New Approaches

David Glukhov · Ilia Shumailov · Yarin Gal · Nicolas Papernot · Vardan Papyan

Training-Free Long-Context Scaling of Large Language Models

Chenxin An · Fei Huang · Jun Zhang · Shansan Gong · Xipeng Qiu · Chang Zhou · Lingpeng Kong

Disentangled 3D Scene Generation with Layout Learning

Dave Epstein · Ben Poole · Ben Mildenhall · Alexei Efros · Aleksander Holynski

SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation

Danni Yang · Jiayi Ji · Yiwei Ma · Tianyu Guo · Haowei Wang · Xiaoshuai Sun · Rongrong Ji

LoRA+: Efficient Low Rank Adaptation of Large Models

Soufiane Hayou · Nikhil Ghosh · Bin Yu

Learning 1-Bit Tiny Object Detector with Discriminative Feature Refinement

Sheng Xu · Mingze Wang · Yanjing Li · Mingbao Lin · Baochang Zhang · David Doermann · Xiao Sun

DetKDS: Knowledge Distillation Search for Object Detectors

Lujun Li · Yufan Bao · Peijie Dong · Chuanguang Yang · Anggeng Li · Wenhan Luo · Qifeng Liu · Wei Xue · Yike Guo

Gaussian Plane-Wave Neural Operator for Electron Density Estimation

Seongsu Kim · Sungsoo Ahn

How to Trace Latent Generative Model Generated Images without Artificial Watermark?

Zhenting Wang · Vikash Sehwag · Chen Chen · Lingjuan Lyu · Dimitris Metaxas · Shiqing Ma

Explain Temporal Black-Box Models via Functional Decomposition

Linxiao Yang · Yunze Tong · Xinyue Gu · Liang Sun

Simplicity Bias via Global Convergence of Sharpness Minimization

Khashayar Gatmiry · Zhiyuan Li · Sashank J. Reddi · Stefanie Jegelka

BAGEL: Bootstrapping Agents by Guiding Exploration with Language

Shikhar Murty · Christopher Manning · Peter Shaw · Mandar Joshi · Kenton Lee

Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF

Banghua Zhu · Michael Jordan · Jiantao Jiao

Position: Do pretrained Transformers Learn In-Context by Gradient Descent?

Lingfeng Shen · Aayush Mishra · Daniel Khashabi

Generalization Analysis of Stochastic Weight Averaging with General Sampling

Wang Peng · Li Shen · Zerui Tao · Shuaida He · Dacheng Tao

What Can Transformer Learn with Varying Depth? Case Studies on Sequence Learning Tasks

Xingwu Chen · Difan Zou

Two Fists, One Heart: Multi-Objective Optimization Based Strategy Fusion for Long-tailed Learning

Zhe Zhao · Pengkun Wang · HaiBin Wen · Wei Xu · LAI Song · Qingfu Zhang · Yang Wang

Outlier Weighed Layerwise Sparsity (OWL): A Missing Secret Sauce for Pruning LLMs to High Sparsity

Lu Yin · You Wu · Zhenyu Zhang · Cheng-Yu Hsieh · Yaqing Wang · Yiling Jia · Gen Li · Ajay Jaiswal · Mykola Pechenizkiy · Yi Liang · Michael Bendersky · Zhangyang “Atlas” Wang · Shiwei Liu

Graph As Point Set

Xiyuan Wang · Pan Li · Muhan Zhang

DiffAug: Enhance Unsupervised Contrastive Learning with Domain-Knowledge-Free Diffusion-based Data Augmentation

Zelin Zang · Hao Luo · Kai Wang · Panpan Zhang · Fan Wang · Stan Z Li · Yang You

A Minimaximalist Approach to Reinforcement Learning from Human Feedback

Gokul Swamy · Christoph Dann · Rahul Kidambi · Steven Wu · Alekh Agarwal

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Tri Dao · Albert Gu

Flexible Residual Binarization for Image Super-Resolution

Yulun Zhang · Haotong Qin · Zixiang Zhao · Xianglong Liu · Martin Danelljan · Fisher Yu

Graph Neural Stochastic Diffusion for Estimating Uncertainty in Node Classification

Xixun Lin · Wenxiao Zhang · Fengzhao Shi · Chuan Zhou · Lixin Zou · Xiangyu Zhao · Dawei Yin · Shirui Pan · Yanan Cao

Understanding Heterophily for Graph Neural Networks

Junfu Wang · Yuanfang Guo · Liang Yang · Yunhong Wang

Flora: Low-Rank Adapters Are Secretly Gradient Compressors

Yongchang Hao · Yanshuai Cao · Lili Mou

Offline Actor-Critic Reinforcement Learning Scales to Large Models

Jost Tobias Springenberg · Abbas Abdolmaleki · Jingwei Zhang · Oliver M Groth · Michael Bloesch · Thomas Lampe · Philemon Brakel · Sarah Bechtle · Steven Kapturowski · Roland Hafner · Nicolas Heess · Martin Riedmiller

IM-3D: Iterative Multiview Diffusion and Reconstruction for High-Quality 3D Generation

Luke Melas-Kyriazi · Iro Laina · Christian Rupprecht · Natalia Neverova · Andrea Vedaldi · Oran Gafni · Filippos Kokkinos

Early Time Classification with Accumulated Accuracy Gap Control

Liran Ringel · Regev Cohen · Daniel Freedman · Michael Elad · Yaniv Romano

Double Stochasticity Gazes Faster: Snap-Shot Decentralized Stochastic Gradient Tracking Methods

Hao Di · Haishan Ye · Xiangyu Chang · Guang Dai · Ivor Tsang

Data-free Distillation of Diffusion Models with Bootstrapping

Jiatao Gu · Chen Wang · Shuangfei Zhai · Yizhe Zhang · Lingjie Liu · Joshua M Susskind

Q-value Regularized Transformer for Offline Reinforcement Learning

Shengchao Hu · Ziqing Fan · Chaoqin Huang · Li Shen · Ya Zhang · Yanfeng Wang · Dacheng Tao

Prompting is a Double-Edged Sword: Improving Worst-Group Robustness of Foundation Models

Amrith Setlur · Saurabh Garg · Virginia Smith · Sergey Levine

Fast Decision Boundary based Out-of-Distribution Detector

Litian Liu · Yao Qin

Scalable Pre-training of Large Autoregressive Image Models

Alaaeldin Ali · Michal Klein · Shuangfei Zhai · Miguel Angel Bautista Martin · Vaishaal Shankar · Alexander Toshev · Joshua M Susskind · Armand Joulin

A3S: A General Active Clustering Method with Pairwise Constraints

Xun Deng · Junlong Liu · Han Zhong · Fuli Feng · Chen Shen · Xiangnan He · Jieping Ye · Zheng Wang

Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective

Cheng Tan · Zhangyang Gao · Hanqun CAO · Xingran Chen · Wang Ge · Lirong Wu · Jun Xia · Jiangbin Zheng · Stan Z Li

QUEST: Query-Aware Sparsity for Efficient Long-Context LLM Inference

Jiaming Tang · Yilong Zhao · Kan Zhu · Guangxuan Xiao · Baris Kasikci · Song Han

Self-Attention through Kernel-Eigen Pair Sparse Variational Gaussian Processes

Yingyi Chen · Qinghua Tao · Francesco Tonin · Johan Suykens

Learning Decision Policies with Instrumental Variables through Double Machine Learning

Bill Daqian Shao · Ashkan Soleymani · Francesco Quinzan · Marta Kwiatkowska

Plug-and-Play image restoration with Stochastic deNOising REgularization

Marien Renaud · Jean Prost · Arthur Leclaire · Nicolas Papadakis

Memorization Through the Lens of Curvature of Loss Function Around Samples

Isha Garg · Deepak Ravikumar · Kaushik Roy

Wasserstein Wormhole: Scalable Optimal Transport Distance with Transformer

Doron Haviv · Russell Kunes · Thomas Dougherty · Cassandra Burdziak · Tal Nawy · Anna C. Gilbert · Dana Pe'er

Feature Attribution with Necessity and Sufficiency via Dual-stage Perturbation Test for Causal Explanation

Xuexin Chen · Ruichu Cai · Zhengting Huang · Yuxuan Zhu · Julien Horwood · Zhifeng Hao · Zijian Li · Jose Miguel Hernandez-Lobato

Beyond Implicit Bias: The Insignificance of SGD Noise in Online Learning

Nikhil Vyas · Depen Morwani · Rosie Zhao · Gal Kaplun · Sham Kakade · Boaz Barak

Deep Fusion: Efficient Network Training via Pre-trained Initializations

Hanna Mazzawi · Xavi Gonzalvo · Michael Wunder · Sammy Jerome · Benoit Dherin

InfoNet: Neural Estimation of Mutual Information without Test-Time Optimization

Zhengyang Hu · Song Kang · Qunsong Zeng · Kaibin Huang · Yanchao Yang

Latent Space Symmetry Discovery

Jianke Yang · Nima Dehmamy · Robin Walters · Rose Yu

Discovering Features with Synergistic Interactions in Multiple Views

Chohee Kim · M van der Schaar · Changhee Lee

VisionGraph: Leveraging Large Multimodal Models for Graph Theory Problems in Visual Context

yunxin li · Baotian Hu · Haoyuan Shi · Wei Wang · Longyue Wang · Min Zhang

Harnessing Hierarchical Label Distribution Variations in Test Agnostic Long-tail Recognition

Zhiyong Yang · Qianqian Xu · Zitai Wang · Sicong Li · Boyu Han · Shilong Bao · Xiaochun Cao · Qingming Huang

An Embodied Generalist Agent in 3D World

Jiangyong Huang · Silong Yong · Xiaojian Ma · Xiongkun Linghu · Puhao Li · Yan Wang · Qing Li · Song-Chun Zhu · Baoxiong Jia · Siyuan Huang

Indirectly Parameterized Concrete Autoencoders

Alfred Nilsson · Klas Wijk · Sai bharath chandra Gutha · Erik Englesson · Alexandra Hotti · Carlo Saccardi · Oskar Kviman · Jens Lagergren · Ricardo Vinuesa · Hossein Azizpour

Revisiting the Power of Prompt for Visual Tuning

Yuzhu Wang · Lechao Cheng · Chaowei Fang · Dingwen Zhang · Manni Duan · Meng Wang

Breaking through the learning plateaus of in-context learning in Transformer

Jingwen Fu · Tao Yang · Yuwang Wang · Yan Lu · Nanning Zheng

Transformers, parallel computation, and logarithmic depth

Clayton Sanford · Daniel Hsu · Matus Telgarsky

Short-Long Convolutions Help Hardware-Efficient Linear Attention to Focus on Long Sequences

Zicheng Liu · Siyuan Li · Li Wang · Zedong Wang · Yunfan Liu · Stan Z Li

LeaPformer: Enabling Linear Transformers for Autoregressive and Simultaneous Tasks via Learned Proportions

Victor Agostinelli III · Sanghyun Hong · Lizhong Chen

Self-attention Networks Localize When QK-eigenspectrum Concentrates

Han Bao · Ryuichiro Hataya · Ryo Karakida

Simple linear attention language models balance the recall-throughput tradeoff

Simran Arora · Sabri Eyuboglu · Michael Zhang · Aman Timalsina · Silas Alberti · James Zou · Atri Rudra · Christopher Re

Algorithm and Hardness for Dynamic Attention Maintenance in Large Language Models

Jan van den Brand · Zhao Song · Tianyi Zhou

Transformers Provably Learn Sparse Token Selection While Fully-Connected Nets Cannot

Zixuan Wang · Stanley Wei · Daniel Hsu · Jason Lee

Memory Efficient Neural Processes via Constant Memory Attention Block

Leo Feng · Frederick Tung · Hossein Hajimirsadeghi · Yoshua Bengio · Mohamed Osama Ahmed

The Surprising Effectiveness of Skip-Tuning in Diffusion Sampling

Jiajun Ma · Shuchen Xue · Tianyang Hu · Wenjia Wang · Zhaoqiang Liu · Zhenguo Li · Zhiming Ma · Kenji Kawaguchi

Compositional Image Decomposition with Diffusion Models

Jocelin Su · Nan Liu · Yanbo Wang · Josh Tenenbaum · Yilun Du

CCM: Real-Time Controllable Visual Content Creation Using Text-to-Image Consistency Models

Jie Xiao · Kai Zhu · Han Zhang · Zhiheng Liu · Yujun Shen · Zhantao Yang · Ruili Feng · Yu Liu · Xueyang Fu · Zheng-Jun Zha

GenCO: Generating Diverse Designs with Combinatorial Constraints

Aaron Ferber · Arman Zharmagambetov · Taoan Huang · Bistra Dilkina · Yuandong Tian

A Simple Early Exiting Framework for Accelerated Sampling in Diffusion Models

Taehong Moon · Moonseok Choi · EungGu Yun · Jongmin Yoon · Gayoung Lee · Jaewoong Cho · Juho Lee

Improving Adversarial Energy-Based Model via Diffusion Process

Cong Geng · Tian Han · Peng-Tao Jiang · Hao Zhang · Jinwei Chen · Søren Hauberg · Bo Li

Guidance with Spherical Gaussian Constraint for Conditional Diffusion

Lingxiao Yang · Shutong Ding · Yifan Cai · Jingyi Yu · Jingya Wang · Ye Shi

Feedback Efficient Online Fine-Tuning of Diffusion Models

Masatoshi Uehara · Yulai Zhao · Kevin Black · Ehsan Hajiramezanali · Gabriele Scalia · Nathaniel Diamant · Alex Tseng · Sergey Levine · Tommaso Biancalani

On Mechanistic Knowledge Localization in Text-to-Image Generative Models

Samyadeep Basu · Keivan Rezaei · Priyatham Kattakinda · Vlad Morariu · Nanxuan Zhao · Ryan A Rossi · Varun Manjunatha · Soheil Feizi

Nearest Neighbour Score Estimators for Diffusion Generative Models

Matthew Niedoba · Dylan Green · Saeid Naderiparizi · Vasileios Lioutas · Jonathan Lavington · Xiaoxuan Liang · Yunpeng Liu · Ke Zhang · Setareh Dabiri · Adam Scibior · Berend Zwartsenberg · Frank Wood

Token-level Direct Preference Optimization

Yongcheng Zeng · Guoqing Liu · Weiyu Ma · Ning Yang · Haifeng Zhang · Jun Wang

MLAgentBench: Evaluating Language Agents on Machine Learning Experimentation

Qian Huang · Jian Vora · Percy Liang · Jure Leskovec

Position: Future Directions in the Theory of Graph Machine Learning

Christopher Morris · Fabrizio Frasca · Nadav Dym · Haggai Maron · Ismail Ceylan · Ron Levie · Derek Lim · Michael Bronstein · Martin Grohe · Stefanie Jegelka

Comparing Graph Transformers via Positional Encodings

Mitchell Black · Zhengchao Wan · Gal Mishne · Amir Nayyeri · Yusu Wang

Delaunay Graph: Addressing Over-Squashing and Over-Smoothing Using Delaunay Triangulation

Hugo Attali · Davide Buscaldi · Nathalie Pernelle

PAC-Bayesian Generalization Bounds for Knowledge Graph Representation Learning

Jaejun Lee · Minsung Hwang · Joyce Whang

What Improves the Generalization of Graph Transformers? A Theoretical Dive into the Self-attention and Positional Encoding

Hongkang Li · Meng Wang · Tengfei Ma · Sijia Liu · Zaixi Zhang · Pin-Yu Chen

Learning Divergence Fields for Shift-Robust Graph Representations

Qitian Wu · Fan Nie · Chenxiao Yang · Junchi Yan

Cooperative Graph Neural Networks

Ben Finkelshtein · Xingyue Huang · Michael Bronstein · Ismail Ceylan

Uncertainty for Active Learning on Graphs

Dominik Fuchsgruber · Tom Wollschläger · Bertrand Charpentier · Antonio Oroz · Stephan Günnemann

Graph2Tac: Online Representation Learning of Formal Math Concepts

Lasse Blaauwbroek · Mirek Olšák · Jason Rute · Fidel I. Schaposnik Massolo · Jelle Piepenbrock · Vasily Pestun

Equivariant Frames and the Impossibility of Continuous Canonicalization

Nadav Dym · Hannah Lawrence · Jonathan Siegel

Editing Partially Observable Networks via Graph Diffusion Models

Puja Trivedi · Ryan A Rossi · David Arbour · Tong Yu · Franck Dernoncourt · Sungchul Kim · Nedim Lipka · Namyong Park · Nesreen Ahmed · Danai Koutra

Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis

Juyeon Ko · Inho Kong · Dogyun Park · Hyunwoo Kim

Theory of Consistency Diffusion Models: Distribution Estimation Meets Fast Sampling

Zehao Dou · Minshuo Chen · Mengdi Wang · Zhuoran Yang

Layer-Aware Analysis of Catastrophic Overfitting: Revealing the Pseudo-Robust Shortcut Dependency

Runqi Lin · Chaojian Yu · Bo Han · Hang Su · Tongliang Liu

DiracDiffusion: Denoising and Incremental Reconstruction with Assured Data-Consistency

Zalan Fabian · Berk Tinaz · Mahdi Soltanolkotabi

Diffuse, Sample, Project: Plug-And-Play Controllable Graph Generation

Kartik Sharma · Srijan Kumar · Rakshit Trivedi

Prompting a Pretrained Transformer Can Be a Universal Approximator

Aleksandar Petrov · Phil Torr · Adel Bibi

Automated Evaluation of Retrieval-Augmented Language Models with Task-Specific Exam Generation

Gauthier Guinet · Behrooz Tehrani · Anoop Deoras · Laurent Callot

Bridging Data Gaps in Diffusion Models with Adversarial Noise-Based Transfer Learning

Xiyu Wang · Baijiong Lin · Daochang Liu · YINGCONG CHEN · Chang Xu

Image Hijacks: Adversarial Images can Control Generative Models at Runtime

Luke Bailey · Euan Ong · Stuart Russell · Scott Emmons

CLLMs: Consistency Large Language Models

Siqi Kou · Lanxiang Hu · Zhezhi He · Zhijie Deng · Hao Zhang

Flextron: Many-in-One Flexible Large Language Model

Ruisi Cai · Saurav Muralidharan · Greg Heinrich · Hongxu Yin · Zhangyang “Atlas” Wang · Jan Kautz · Pavlo Molchanov

Position: Stop Making Unscientific AGI Performance Claims

Patrick Altmeyer · Andrew Demetriou · Antony Bartlett · Cynthia C. S. Liem

NExT: Teaching Large Language Models to Reason about Code Execution

Ansong Ni · Miltiadis Allamanis · Arman Cohan · Yinlin Deng · Kensen Shi · Charles Sutton · Pengcheng Yin

Accelerating Iterative Retrieval-augmented Language Model Serving with Speculation

Zhihao Zhang · Alan Zhu · Lijie Yang · Yihua Xu · Lanting Li · Phitchaya Phothilimthana · Zhihao Jia

Evaluating Quantized Large Language Models

Shiyao Li · Xuefei Ning · Luning Wang · Tengxuan Liu · Xiangsheng Shi · Shengen Yan · Guohao Dai · Huazhong Yang · Yu Wang

Evolving Subnetwork Training for Large Language Models

hanqi li · Lu Chen · Da Ma · Zijian Wu · Su Zhu · Kai Yu

Modeling Language Tokens as Functionals of Semantic Fields

Zhengqi Pei · Anran Zhang · Shuhui Wang · Qingming Huang

To Each (Textual Sequence) Its Own: Improving Memorized-Data Unlearning in Large Language Models

George-Octavian Bărbulescu · Peter Triantafillou

Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT

Jon Saad-Falcon · Daniel Y Fu · Simran Arora · Neel Guha · Christopher Re

Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models

Bilgehan Sel · Ahmad Al-Tawaha · Vanshaj Khattar · Ruoxi Jia · Ming Jin

MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities

Weihao Yu · Zhengyuan Yang · Linjie Li · Jianfeng Wang · Kevin Lin · Zicheng Liu · Xinchao Wang · Lijuan Wang

Exact Conversion of In-Context Learning to Model Weights in Linearized-Attention Transformers

Brian Chen · Tianyang Hu · Hui Jin · Hwee Lee · Kenji Kawaguchi

Reason for Future, Act for Now: A Principled Architecture for Autonomous LLM Agents

Zhihan Liu · Hao Hu · Shenao Zhang · Hongyi Guo · Shuqi Ke · Boyi Liu · Zhaoran Wang

Repoformer: Selective Retrieval for Repository-Level Code Completion

Di Wu · Wasi Ahmad · Dejiao Zhang · Murali Krishna Ramanathan · Xiaofei Ma

Rethinking Optimization and Architecture for Tiny Language Models

Yehui Tang · Kai Han · Fangcheng Liu · Yunsheng Ni · Yuchuan Tian · Zheyuan Bai · Yi-Qi Hu · Sichao Liu · Shang-Ling Jui · Yunhe Wang

Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation

Xianghe Pang · shuo tang · Rui Ye · Yuxin Xiong · Bolun Zhang · Yanfeng Wang · Siheng Chen

TravelPlanner: A Benchmark for Real-World Planning with Language Agents

Jian Xie · Kai Zhang · Jiangjie Chen · Tinghui Zhu · Renze Lou · Yuandong Tian · Yanghua Xiao · Yu Su

ExCP: Extreme LLM Checkpoint Compression via Weight-Momentum Joint Shrinking

Wenshuo Li · Xinghao Chen · Han Shu · Yehui Tang · Yunhe Wang

Characterizing Large Language Model Geometry Helps Solve Toxicity Detection and Generation

Randall Balestriero · Romain Cosentino · Sarath Shekkizhar

Language Models are Super Mario: Absorbing Abilities from Homologous Models as a Free Lunch

Le Yu · Bowen Yu · Haiyang Yu · Fei Huang · Yongbin Li

MAGDi: Structured Distillation of Multi-Agent Interaction Graphs Improves Reasoning in Smaller Language Models

Justin Chih-Yao Chen · Swarnadeep Saha · Elias Stengel-Eskin · Mohit Bansal

Large Language Models Can Automatically Engineer Features for Few-Shot Tabular Learning

Sungwon Han · Jinsung Yoon · Sercan Arik · Tomas Pfister

Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression

Junyuan Hong · Jinhao Duan · Chenhui Zhang · Zhangheng Li · Chulin Xie · Kelsey Lieberman · James Diffenderfer · Brian Bartoldson · Ajay Jaiswal · Kaidi Xu · Bhavya Kailkhura · Dan Hendrycks · Dawn Song · Zhangyang “Atlas” Wang · Bo Li

In-context Vectors: Making In Context Learning More Effective and Controllable Through Latent Space Steering

Sheng Liu · Haotian Ye · Lei Xing · James Zou

AST-T5: Structure-Aware Pretraining for Code Generation and Understanding

Linyuan Gong · Mostafa Elhoushi · Alvin Cheung

SciBench: Evaluating College-Level Scientific Problem-Solving Abilities of Large Language Models

Xiaoxuan Wang · ziniu hu · Pan Lu · Yanqiao Zhu · Jieyu Zhang · Satyen Subramaniam · Arjun Loomba · Shichang Zhang · Yizhou Sun · Wei Wang

Few-Shot Character Understanding in Movies as an Assessment to Meta-Learning of Theory-of-Mind

Mo Yu · Qiujing Wang · Shunchi Zhang · Yisi Sang · Kangsheng Pu · Zekai Wei · Han Wang · Liyan Xu · Jing Li · Yue Yu · Jie Zhou

Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback

songyang gao · Qiming Ge · Wei Shen · Shihan Dou · Junjie Ye · Xiao Wang · Rui Zheng · Yicheng Zou · Zhi Chen · Hang Yan · Qi Zhang · Dahua Lin

CodeIt: Self-Improving Language Models with Prioritized Hindsight Replay

Natasha Butt · Blazej Manczak · Auke Wiggers · Corrado Rainone · David Zhang · Michaël Defferrard · Taco Cohen

Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment

Rui Yang · Xiaoman Pan · Feng Luo · Shuang Qiu · Han Zhong · Dong Yu · Jianshu Chen

CogBench: a large language model walks into a psychology lab

Julian Coda-Forno · Marcel Binz · Jane Wang · Eric Schulz

Soft Prompt Recovers Compressed LLMs, Transferably

Zhaozhuo Xu · Zirui Liu · Beidi Chen · Shaochen (Henry) Zhong · Yuxin Tang · Jue Wang · Kaixiong Zhou · Xia Hu · Anshumali Shrivastava

MEMORYLLM: Towards Self-Updatable Large Language Models

Yu Wang · Yifan Gao · Xiusi Chen · Haoming Jiang · Shiyang Li · Jingfeng Yang · Qingyu Yin · Zheng Li · Xian Li · Bing Yin · Jingbo Shang · Julian McAuley

Guiding LLMs The Right Way: Fast, Non-Invasive Constrained Generation

Luca Beurer-Kellner · Marc Fischer · Martin Vechev

GPT-4V(ision) is a Generalist Web Agent, if Grounded

Boyuan Zheng · Boyu Gou · Jihyung Kil · Huan Sun · Yu Su

Larimar: Large Language Models with Episodic Memory Control

Payel Das · Subhajit Chaudhury · Elliot Nelson · Igor Melnyk · Sarath Swaminathan · Sophie Dai · Aurelie Lozano · Georgios Kollias · Vijil Chenthamarakshan · Jiri Navratil · Soham Dan · Pin-Yu Chen

Language Models with Conformal Factuality Guarantees

Christopher Mohri · Tatsunori Hashimoto

On Prompt-Driven Safeguarding for Large Language Models

Chujie Zheng · Fan Yin · Hao Zhou · Fandong Meng · Jie Zhou · Kai-Wei Chang · Minlie Huang · Nanyun Peng

PICLe: Eliciting Diverse Behaviors from Large Language Models with Persona In-Context Learning

Hyeong Kyu Choi · Sharon Li

FrameQuant: Flexible Low-Bit Quantization for Transformers

Harshavardhan Adepu · Zhanpeng Zeng · Li Zhang · Vikas Singh

ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections

Massimo Bini · Karsten Roth · Zeynep Akata · Anna Khoreva

Lie Neurons: Adjoint-Equivariant Neural Networks for Semisimple Lie Algebras

Tzu-Yuan Lin · Minghan Zhu · Maani Ghaffari

SCoRe: Submodular Combinatorial Representation Learning

Anay Majee · Suraj Kothawade · Krishnateja Killamsetty · Rishabh Iyer

Learning Cognitive Maps from Transformer Representations for Efficient Planning in Partially Observed Environments

Antoine Dedieu · Wolfgang Lehrach · Guangyao Zhou · Dileep George · Miguel Lazaro-Gredilla

Bottleneck-Minimal Indexing for Generative Document Retrieval

Xin Du · Lixin Xiu · Kumiko Tanaka-Ishii

Causal Representation Learning Made Identifiable by Grouping of Observational Variables

Hiroshi Morioka · Aapo Hyvarinen

Graph Geometry-Preserving Autoencoders

Jungbin Lim · Jihwan Kim · Yonghyeon Lee · Cheongjae Jang · Frank Chongwoo Park

Harmony in Diversity: Merging Neural Networks with Canonical Correlation Analysis

Stefan Horoi · Albert Manuel Orozco Camacho · Eugene Belilovsky · Guy Wolf

Balanced Data, Imbalanced Spectra: Unveiling Class Disparities with Spectral Imbalance

Chiraag Kaushik · Ran Liu · Chi-Heng Lin · Amrit Khera · Matthew Jin · Wenrui Ma · Vidya Muthukumar · Eva Dyer

State-Free Inference of State-Space Models: The *Transfer Function* Approach

Rom N. Parnichkun · Stefano Massaroli · Alessandro Moro · Jimmy Smith · Ramin Hasani · Mathias Lechner · Qi An · Christopher Re · Hajime Asama · Stefano Ermon · Taiji Suzuki · Michael Poli · Atsushi Yamashita

Defining Neural Network Architecture through Polytope Structures of Datasets

Sangmin Lee · Abbas Mammadov · Jong Chul YE

When Representations Align: Universality in Representation Learning Dynamics

Loek van Rossem · Andrew Saxe

Keep the Momentum: Conservation Laws beyond Euclidean Gradient Flows

Sibylle Marcotte · Rémi Gribonval · Gabriel Peyré

Deeper or Wider: A Perspective from Optimal Generalization Error with Sobolev Loss

Yahong Yang · Juncai He

On the Weight Dynamics of Deep Normalized Networks

Christian H.X. Ali Mehmeti-Göpel · Michael Wand

Sliding Down the Stairs: How Correlated Latent Variables Accelerate Learning with Neural Networks

Lorenzo Bardone · Sebastian Goldt

How Uniform Random Weights Induce Non-uniform Bias: Typical Interpolating Neural Networks Generalize with Narrow Teachers

Gon Buzaglo · Itamar Harel · Mor Shpigel Nacson · Alon Brutzkus · Nati Srebro · Daniel Soudry

EVEREST: Efficient Masked Video Autoencoder by Removing Redundant Spatiotemporal Tokens

Sunil Hwang · Jaehong Yoon · Youngwan Lee · Sung Ju Hwang

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Kai Zhang · Yi Luan · Hexiang Hu · Kenton Lee · Siyuan Qiao · Wenhu Chen · Yu Su · Ming-Wei Chang

Rethinking Adversarial Robustness in the Context of the Right to be Forgotten

Chenxu Zhao · Wei Qian · Yangyi Li · Aobo Chen · Mengdi Huai

VNN: Verification-Friendly Neural Networks with Hard Robustness Guarantees

Anahita Baninajjar · Ahmed Rezine · Amir Aminifar

Not Just Pretty Pictures: Toward Interventional Data Augmentation Using Text-to-Image Generators

Jianhao Yuan · Francesco Pinto · Adam Davies · Phil Torr

BECoTTA: Input-dependent Online Blending of Experts for Continual Test-time Adaptation

Daeun Lee · Jaehong Yoon · Sung Ju Hwang

Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers

Johann Schmidt · Sebastian Stober

The Pitfalls and Promise of Conformal Inference Under Adversarial Attacks

Ziquan Liu · Yufei Cui · Yan Yan · Yi Xu · Xiangyang Ji · Xue Liu · Antoni Chan

Exploring Intrinsic Dimension for Vision-Language Model Pruning

Hanzhang Wang · Jiawen Zhang · Qingyuan Ma

xT: Nested Tokenization for Larger Context in Large Images

Ritwik Gupta · Shufan Li · Tyler Zhu · Jitendra Malik · Trevor Darrell · Karttikeya Mangalam

Go to Event Page

Invited Talk

Machine Learning Opportunities for the Next Generation of Particle Physics

Javier Duarte

3:00 PM - 4:00 PM

At the CERN Large Hadron Collider, protons collide 40 million times per second at the highest energies achievable in the lab, probing the microscopic nature of subatomic particles on the smallest length scales. These proton-proton collisions give rise to thousands of particles per collision, whose energy deposits and hits are measured by massive detectors and read out as hundreds of millions of data channels. By comparing this data to those predicted by theory through simulation, we can test the validity of our theory and search for the existence of new particles, like dark matter, or interactions, like the elusive Higgs boson self-interaction. This avalanche of data will continue to grow in the next generation of experiments, posing tremendous challenges. Machine learning (ML) methods are increasingly essential to analyze this data while overcoming these challenges. In this talk, I will cover several opportunities to apply ML to reconstruct particles from detector measurements, simulate collisions, filter collisions in real time, and perhaps even discover new physical laws or symmetries.

Bio: Javier Duarte is an Associate Professor of Physics at UC San Diego and a member of the CMS experiment at the CERN Large Hadron Collider. He leads a research group developing new artificial intelligence (AI) techniques for high-energy particle collisions to better measure the properties and interactions of elementary particles, like the Higgs boson, and search for new physics. Before joining UC San Diego, he was a Lederman postdoctoral fellow at Fermilab and received his Ph.D. in Physics at Caltech and his B.S. in Physics and Mathematics at MIT. Prof. Duarte has received the APS Henry Primakoff Award for Early-Career Particle Physics, Sloan Research Fellowship, RCSA Cottrell Scholar Award, DOE Early Career Award, and is a co-PI of the NSF HDR Institute for Accelerated AI Algorithms for Data-Driven Discovery (A3D3).

... more

Speaker Bio

Javier Duarte is an Associate Professor of Physics at UC San Diego and a member of the CMS experiment at the CERN Large Hadron Collider. He leads a research group developing new artificial intelligence (AI) techniques for high-energy particle collisions to better measure the properties and interactions of elementary particles, like the Higgs boson, and search for new physics. Before joining UC San Diego, he was a Lederman postdoctoral fellow at Fermilab and received his Ph.D. in Physics at Caltech and his B.S. in Physics and Mathematics at MIT. Prof. Duarte has received the APS Henry Primakoff Award for Early-Career Particle Physics, Sloan Research Fellowship, RCSA Cottrell Scholar Award, DOE Early Career Award, and is a co-PI of the NSF HDR Institute for Accelerated AI Algorithms for Data-Driven Discovery (A3D3).

... more

Town Hall

Town Hall / Business Meeting

4:00 PM - 4:30 PM

Not Live Streamed.

... more

Oral

Oral 4D Retrieval

4:30 PM - 5:30 PM

4 Events in this session

Automated Evaluation of Retrieval-Augmented Language Models with Task-Specific Exam Generation

Gauthier Guinet · Behrooz Tehrani · Anoop Deoras · Laurent Callot

MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions

Kai Zhang · Yi Luan · Hexiang Hu · Kenton Lee · Siyuan Qiao · Wenhu Chen · Yu Su · Ming-Wei Chang

Repoformer: Selective Retrieval for Repository-Level Code Completion

Di Wu · Wasi Ahmad · Dejiao Zhang · Murali Krishna Ramanathan · Xiaofei Ma

Bottleneck-Minimal Indexing for Generative Document Retrieval

Xin Du · Lixin Xiu · Kumiko Tanaka-Ishii

Go to Event Page

Oral

Oral 4F Labels

4:30 PM - 5:30 PM

4 Events in this session

Does Label Smoothing Help Deep Partial Label Learning?

Xiuwen Gong · Nitin Bisht · Guandong Xu

SAM as the Guide: Mastering Pseudo-Label Refinement in Semi-Supervised Referring Expression Segmentation

Danni Yang · Jiayi Ji · Yiwei Ma · Tianyu Guo · Haowei Wang · Xiaoshuai Sun · Rongrong Ji

Candidate Pseudolabel Learning: Enhancing Vision-Language Models by Prompt Tuning with Unlabeled Data

Jiahan Zhang · Qi Wei · Feng Liu · Lei Feng

Speech Self-Supervised Learning Using Diffusion Model Synthetic Data

Heting Gao · Kaizhi Qian · Junrui Ni · Chuang Gan · Mark Hasegawa-Johnson · Shiyu Chang · Yang Zhang

Go to Event Page

Oral

Oral 4C Safety and Control

4:30 PM - 5:30 PM

4 Events in this session

Stealing part of a production language model

Trained Random Forests Completely Reveal your Dataset

Julien Ferry · Ricardo Fukasawa · Timothée Pascal · Thibaut Vidal

AI Control: Improving Safety Despite Intentional Subversion

Ryan Greenblatt · Buck Shlegeris · Kshitij Sachan · Fabien Roger

Low-Cost High-Power Membership Inference Attacks

Sajjad Zarifzadeh · Philippe Liu · Reza Shokri

Go to Event Page

Oral

Oral 4B Optimization 1

4:30 PM - 5:30 PM

4 Events in this session

InfoNet: Neural Estimation of Mutual Information without Test-Time Optimization

Zhengyang Hu · Song Kang · Qunsong Zeng · Kaibin Huang · Yanchao Yang

Optimal Hessian/Jacobian-Free Nonconvex-PL Bilevel Optimization

Feihu Huang

Principled Preferential Bayesian Optimization

Wenjie Xu · Wenbin Wang · Yuning Jiang · Bratislav Svetozarevic · Colin Jones

Zeroth-Order Methods for Constrained Nonconvex Nonsmooth Stochastic Optimization

Zhuanghua Liu · Cheng Chen · Luo Luo · Bryan Kian Hsiang Low

Go to Event Page

Oral

Oral 4E LLMs

4:30 PM - 5:30 PM

4 Events in this session

Position: Do pretrained Transformers Learn In-Context by Gradient Descent?

Lingfeng Shen · Aayush Mishra · Daniel Khashabi

ExCP: Extreme LLM Checkpoint Compression via Weight-Momentum Joint Shrinking

Wenshuo Li · Xinghao Chen · Han Shu · Yehui Tang · Yunhe Wang

How do Large Language Models Navigate Conflicts between Honesty and Helpfulness?

Ryan Liu · Theodore R Sumers · Ishita Dasgupta · Thomas Griffiths

Flextron: Many-in-One Flexible Large Language Model

Ruisi Cai · Saurav Muralidharan · Greg Heinrich · Hongxu Yin · Zhangyang “Atlas” Wang · Jan Kautz · Pavlo Molchanov

Go to Event Page

Oral

Oral 4A Reinforcement Learning 2

4:30 PM - 5:30 PM

4 Events in this session

Offline Actor-Critic Reinforcement Learning Scales to Large Models

Stop Regressing: Training Value Functions via Classification for Scalable Deep RL

SAPG: Split and Aggregate Policy Gradients

Jayesh Singla · Ananye Agarwal · Deepak Pathak

Rate-Optimal Policy Optimization for Linear Markov Decision Processes

Uri Sherman · Alon Cohen · Tomer Koren · Yishay Mansour

Go to Event Page

Social

Main Navigation

Registration

Gondzo - Charting a Path for African Low-Resource Languages: A Multifaceted Approach to Research and Development

Women in Machine Learning (WiML) Symposium at ICML 2024

Oral 3F Causality

Oral 3D Probabilistic Inference

Oral 3B Diffusion Models

Oral 3C LLMs: Code and Arithmetic

Oral 3A Reinforcement Learning 1

Oral 3E Data and Society

Poster Session 3

Poster Session 4

Machine Learning Opportunities for the Next Generation of Particle Physics

Town Hall / Business Meeting

Oral 4D Retrieval

Oral 4F Labels

Oral 4C Safety and Control

Oral 4B Optimization 1

Oral 4E LLMs

Oral 4A Reinforcement Learning 2

Machine Learning Scientists in Legal Tech

How to Achieve Your True Value as an AI Researcher

ML Content Creation as a Key Career Accelerator