Поясню об этом инструменте в контексте машинного обучения и анализа данных. Ящик с усами — способ визуализации распределения в выборке. Часто он применяется для поиска объектов-выбросов в данных. Можно заметить, что такая визуализация напоминает квадратный ящик с двумя усами, направленными в разную сторону от ящика, поэтому иногда его так называют. А вообще у него есть более строгое название — «диаграмма размаха».
По смыслу, половина значений рассматриваемого признака в выборке должна находиться как бы внутри «ящика» (с первого по третий квартили). «Усы» же визуализируют границы значений для объектов, не относящихся к выбросам — вторая половина значений рассматриваемого признака в выборке должна располагаться внутри усов. Длина усов, чаще всего, устанавливается равной полутора интерквартильным размахам (полтора размера того самого «ящика»). Вообще это некоторая эмпирика и в разных источниках могут встречаться немного отличающиеся варианты для длины «усов».
Стоит помнить, что не всегда те объекты, которые попадают за пределы усов, следует исключать из выборки, возможно это реальные выдающиеся значения. Тут важно аккуратно интерпретировать наблюдения в контексте задачи. Иногда именно такие объекты и представляют для бизнеса наибольший интерес, избавляться от них не стоит.