Shift happens: Crowdsourcing metrics and test datasets beyond ImageNet

Workshop

Shift happens: Crowdsourcing metrics and test datasets beyond ImageNet

Roland S. Zimmermann · Julian Bitterwolf · Evgenia Rusak · Steffen Schneider · Matthias Bethge · Wieland Brendel · Matthias Hein

Ballroom 4

Fri 22 Jul, 6 a.m. PDT

[ Abstract ] Workshop Website

Deep vision models are prone to short-cut learning, vulnerable to adversarial attacks, as well as natural and synthetic image corruptions. While OOD test sets have been proposed to measure the vulnerability of DNNs to distribution shifts of different kinds, it has been shown that the performance on popular OOD test sets such as ImageNet-C or ObjectNet is strongly correlated to the performance on clean ImageNet. Since performance on clean ImageNet clearly tests IID but not OOD generalization, this calls for new challenging OOD datasets testing different aspects of generalization.Our goal is to bring the robustness, domain adaptation, and out-of-distribution detection communities together to work on a new broad-scale benchmark that tests diverse aspects of current computer vision models and guides the way towards the next generation of models. Submissions to this workshop will contain novel datasets, metrics and evaluation settings.

Chat is not available.

Timezone: America/Los_Angeles

Schedule

Fri 6:00 a.m. - 6:10 a.m.	Introduction and opening remarks ( Talk ) > SlidesLive Video	Julian Bitterwolf · Roland S. Zimmermann · Steffen Schneider · Evgenia Rusak 🔗
Fri 6:10 a.m. - 6:25 a.m.	Contributed Talk 1: When does dough become a bagel?Analyzing the remaining mistakes on ImageNet ( Oral ) > link SlidesLive Video Link	Vijay Vasudevan · Benjamin Caine · Raphael Gontijo Lopes · Sara Fridovich-Keil · Rebecca Roelofs 🔗
Fri 6:25 a.m. - 7:05 a.m.	Invited Talk 1: Aleksander Mądry ( Talk ) > SlidesLive Video	Aleksander Madry 🔗
Fri 7:05 a.m. - 7:35 a.m.	Coffee Break	🔗
Fri 7:35 a.m. - 7:50 a.m.	Contributed Talk 2: MetaShift: A Dataset of Datasets for Evaluating Contextual Distribution Shifts ( Oral ) > link SlidesLive Video Link	Weixin Liang · Xinyu Yang · James Zou 🔗
Fri 7:50 a.m. - 8:30 a.m.	Invited Talk 2: Lucas Beyer ( Talk ) > SlidesLive Video	🔗
Fri 8:30 a.m. - 9:10 a.m.	Invited Talk 3: Chelsea Finn ( Talk ) > SlidesLive Video	Chelsea Finn 🔗
Fri 9:10 a.m. - 10:10 a.m.	Lunch Break	🔗
Fri 10:10 a.m. - 10:50 a.m.	Invited Talk 4: Alexei Efros ( Talk ) > SlidesLive Video	Alexei Efros 🔗
Fri 10:50 a.m. - 10:52 a.m.	OOD-CV: A Benchmark for Robustness to Individual Nuisances in Real-World Out-of-Distribution Shifts ( Oral ) > link SlidesLive Video Link	Bingchen Zhao · Shaozuo Yu · Wufei Ma · Mingxin Yu · Shenxiao Mei · Angtian Wang · Ju He · Alan Yuille · Adam Kortylewski 🔗
Fri 10:52 a.m. - 10:54 a.m.	Wild-Time: A Benchmark of in-the-Wild Distribution Shift over Time ( Oral ) > link Link	Huaxiu Yao · Caroline Choi · Yoonho Lee · Pang Wei Koh · Chelsea Finn 🔗
Fri 10:54 a.m. - 10:56 a.m.	Growing ObjectNet: Adding speech, VQA, occlusion, and measuring dataset difficulty ( Oral ) > link SlidesLive Video Link	David Mayo · David Lu · Chris Zhang · Jesse Cummings · Xinyu Lin · Boris Katz · James Glass · Andrei Barbu 🔗
Fri 10:56 a.m. - 10:58 a.m.	Classifiers Should Do Well Even on Their Worst Classes ( Oral ) > link SlidesLive Video Link	Julian Bitterwolf · Alexander Meinke · Valentyn Boreiko · Matthias Hein 🔗
Fri 10:58 a.m. - 11:00 a.m.	Towards Systematic Robustness for Scalable Visual Recognition ( Oral ) > link Link	Mohamed Omran · Bernt Schiele 🔗
Fri 11:00 a.m. - 11:02 a.m.	Lost in Translation: Modern Image Classifiers still degrade even under simple Translations ( Oral ) > link SlidesLive Video Link	Leander Kurscheidt · Matthias Hein 🔗
Fri 11:02 a.m. - 11:04 a.m.	Evaluating Model Robustness to Patch Perturbations ( Oral ) > link SlidesLive Video Link	Jindong Gu · Volker Tresp · Yao Qin 🔗
Fri 11:04 a.m. - 11:06 a.m.	ImageNet-Cartoon and ImageNet-Drawing: two domain shift datasets for ImageNet ( Oral ) > link SlidesLive Video Link	Tiago Salvador · Adam Oberman 🔗
Fri 11:06 a.m. - 11:08 a.m.	CCC: Continuously Changing Corruptions ( Oral ) > link SlidesLive Video Link	Ori Press · Steffen Schneider · Matthias Kuemmerer · Matthias Bethge 🔗
Fri 11:08 a.m. - 11:10 a.m.	SI-Score ( Oral ) > link SlidesLive Video Link	Jessica Yung · Rob Romijnders · Alexander Kolesnikov · Lucas Beyer · Josip Djolonga · Neil Houlsby · Sylvain Gelly · Mario Lucic · Xiaohua Zhai 🔗
Fri 11:10 a.m. - 11:12 a.m.	ImageNet-D: A new challenging robustness dataset inspired by domain adaptation ( Oral ) > link SlidesLive Video Link	Evgenia Rusak · Steffen Schneider · Peter V Gehler · Oliver Bringmann · Wieland Brendel · Matthias Bethge 🔗
Fri 11:12 a.m. - 11:14 a.m.	The Semantic Shift Benchmark ( Oral ) > link SlidesLive Video Link	Sagar Vaze · Kai Han · Andrea Vedaldi · Andrew Zisserman 🔗
Fri 11:14 a.m. - 11:16 a.m.	3D Common Corruptions for Object Recognition ( Oral ) > link SlidesLive Video Link	Oguzhan Fatih Kar · Teresa Yeo · Amir Zamir 🔗
Fri 11:50 a.m. - 12:50 p.m.	Poster session ( Poster session ) >	🔗
Fri 12:50 p.m. - 1:20 p.m.	Tea break	🔗
Fri 1:20 p.m. - 2:00 p.m.	Invited Talk 5: Ludwig Schmidt ( Talk ) > SlidesLive Video	🔗
Fri 2:00 p.m. - 3:00 p.m.	Panel discussion ( Panel ) > link SlidesLive Video Link	Steffen Schneider · Aleksander Madry · Alexei Efros · Chelsea Finn · Soheil Feizi 🔗
Fri 3:00 p.m. - 3:15 p.m.	Community presentation 1: Robust Vision Challenge ( Talk ) > link SlidesLive Video Link	Adam Kortylewski 🔗
Fri 3:15 p.m. - 3:30 p.m.	Community presentation 2: Challenge on Out-of-Distribution Generalization in Computer Vision ( Talk ) > link Link	Adam Kortylewski 🔗
Fri 3:30 p.m. - 3:45 p.m.	Community presentation 3: Shifts Challenge 2.0 ( Talk ) > SlidesLive Video	Andrey Malinin 🔗
Fri 3:45 p.m. - 4:00 p.m.	Contributed Talk 3: ImageNet-Patch: A Dataset for Benchmarking Machine Learning Robustness against Adversarial Patches ( Oral ) > link SlidesLive Video Link	Maura Pintor · Daniele Angioni · Angelo Sotgiu · Luca Demetrio · Ambra Demontis · Battista Biggio · Fabio Roli 🔗
Fri 4:00 p.m. - 4:15 p.m.	Closing remarks ( Talk ) > SlidesLive Video	Evgenia Rusak · Roland S. Zimmermann · Julian Bitterwolf · Steffen Schneider 🔗
-	OOD-CV: A Benchmark for Robustness to Individual Nuisances in Real-World Out-of-Distribution Shifts ( Poster ) > link Link	Bingchen Zhao · Shaozuo Yu · Wufei Ma · Mingxin Yu · Shenxiao Mei · Angtian Wang · Ju He · Alan Yuille · Adam Kortylewski 🔗
-	Wild-Time: A Benchmark of in-the-Wild Distribution Shift over Time ( Poster ) > link Link	Huaxiu Yao · Caroline Choi · Yoonho Lee · Pang Wei Koh · Chelsea Finn 🔗
-	Growing ObjectNet: Adding speech, VQA, occlusion, and measuring dataset difficulty ( Poster ) > link Link	David Mayo · David Lu · Chris Zhang · Jesse Cummings · Xinyu Lin · Boris Katz · James Glass · Andrei Barbu 🔗
-	MetaShift: A Dataset of Datasets for Evaluating Contextual Distribution Shifts ( Poster ) > link Link	Weixin Liang · Xinyu Yang · James Zou 🔗
-	Classifiers Should Do Well Even on Their Worst Classes ( Poster ) > link Link	Julian Bitterwolf · Alexander Meinke · Valentyn Boreiko · Matthias Hein 🔗
-	Lost in Translation: Modern Image Classifiers still degrade even under simple Translations ( Poster ) > link Link	Leander Kurscheidt · Matthias Hein 🔗
-	Towards Systematic Robustness for Scalable Visual Recognition ( Poster ) > link Link	Mohamed Omran · Bernt Schiele 🔗
-	Evaluating Model Robustness to Patch Perturbations ( Poster ) > link Link	Jindong Gu · Volker Tresp · Yao Qin 🔗
-	ImageNet-Cartoon and ImageNet-Drawing: two domain shift datasets for ImageNet ( Poster ) > link Link	Tiago Salvador · Adam Oberman 🔗
-	CCC: Continuously Changing Corruptions ( Poster ) > link Link	Ori Press · Steffen Schneider · Matthias Kuemmerer · Matthias Bethge 🔗
-	SI-Score ( Poster ) > link Link	Jessica Yung · Rob Romijnders · Alexander Kolesnikov · Lucas Beyer · Josip Djolonga · Neil Houlsby · Sylvain Gelly · Mario Lucic · Xiaohua Zhai 🔗
-	ImageNet-D: A new challenging robustness dataset inspired by domain adaptation ( Poster ) > link Link	Evgenia Rusak · Steffen Schneider · Peter V Gehler · Oliver Bringmann · Wieland Brendel · Matthias Bethge 🔗
-	The Semantic Shift Benchmark ( Poster ) > link Link	Sagar Vaze · Kai Han · Andrea Vedaldi · Andrew Zisserman 🔗
-	When does dough become a bagel?Analyzing the remaining mistakes on ImageNet ( Poster ) > link Link	Vijay Vasudevan · Benjamin Caine · Raphael Gontijo Lopes · Sara Fridovich-Keil · Rebecca Roelofs 🔗
-	3D Common Corruptions for Object Recognition ( Poster ) > link Link	Oguzhan Fatih Kar · Teresa Yeo · Amir Zamir 🔗
-	ImageNet-Patch: A Dataset for Benchmarking Machine Learning Robustness against Adversarial Patches ( Poster ) > link Link	Maura Pintor · Daniele Angioni · Angelo Sotgiu · Luca Demetrio · Ambra Demontis · Battista Biggio · Fabio Roli 🔗