ICML 2025 Schedule

Oral

Wed Jul 16 03:30 PM -- 03:45 PM (PDT) @ West Ballroom A None

Position: AI Competitions Provide the Gold Standard for Empirical Rigor in GenAI Evaluation

In Oral 4B Positions: Generative AI Evaluation

D. Sculley · William Cukierski · Phil Culliton · Sohier Dane · Maggie Demkin · Ryan Holbrook · Addison Howard · Paul Mooney · Walter Reade · Meg Risdal · Nate Keating

[ OpenReview]

Oral

Wed Jul 16 03:45 PM -- 04:00 PM (PDT) @ West Ballroom A None

Position: Medical Large Language Model Benchmarks Should Prioritize Construct Validity

In Oral 4B Positions: Generative AI Evaluation

Ahmed Alaa · Thomas Hartvigsen · Niloufar Golchini · Shiladitya Dutta · Frances Dean · Inioluwa Raji · Travis Zack

[ OpenReview]

Oral

Wed Jul 16 04:00 PM -- 04:15 PM (PDT) @ West Ballroom A None

Position: Principles of Animal Cognition to Improve LLM Evaluations

In Oral 4B Positions: Generative AI Evaluation

Sunayana Rane · Cyrus Kirkman · Graham Todd · Amanda Royka · Ryan Law · Erica Cartmill · Jacob Foster

[ OpenReview]

Oral

Wed Jul 16 04:15 PM -- 04:30 PM (PDT) @ West Ballroom A None

Position: Political Neutrality in AI Is Impossible — But Here Is How to Approximate It

In Oral 4B Positions: Generative AI Evaluation

Jillian Fisher · Ruth Elisabeth Appel · Chan Young Park · Yujin Potter · Liwei Jiang · Taylor Sorensen · Shangbin Feng · Yulia Tsvetkov · Margaret Roberts · Jennifer Pan · Dawn Song · Yejin Choi

[ OpenReview]