1 заметка с тегом

правда

Сравнение несравнимых долей

Допустим, мы провели исследование по поводу кофейных напитков. Мы задали десяти тысячам человек два вопроса:

Какой кофе вы предпочитаете (черный или с каким-то видом молока)?
Как вы его предпочитаете пить — с сахаром или без?

Мы выяснили, что среди любителей черного кофе 85% пьют его без сахара, а среди любителей кофе с молоком без сахара пьют только 25%. Ну и логично было бы нарисовать какую-то такую картинку, да?

Нет! С этой картинкой куча проблем!

Главная проблема в том, что здесь сравниваются 85% и 75%, 15% и 25% — они ведь стоят рядом и они похожи по размерам. Но это не абсолютные доли людей из опроса, а доли относительно ответивших «черный» и «с молоком». Вот эти 85%, пьющих черный кофе без сахара — это 85% от какого числа?

И выясняется, например:

В нашем опросе из 10 тысяч человек
Черный кофе из них пили только 20%, остальные 80% предпочитали пить с молоком
85% от пьющих черный кофе — это 10000 × 20% × 85% = 10000 × 17%
75% от пьющих кофе с молоком — это 10000 × 80% × 75% = 1000 × 60%

И график, соответственно, будет выглядеть несколько иначе:

А вся проблема в том, что данные по двум группам респондентов стояли на одном графике. Формально и те, и другие измерялись в процентах, но это были проценты от разных величин, они не были приведены друг к другу.

Ну и вообще ставить не связанные между собой по времени данные по горизонтали некруто, но это тема для отдельного разговора.