Слайдер с ползунком vs пятибалльная числовая шкала: что эффективнее для компьютеров и мобильных устройств

Нам почему-то кажется, что с помощью ползунков мы получим максимально точные результаты, ведь они предоставляют пользователям гораздо больше вариантов ответа и кажутся более интересными и интерактивными, чем многоточечная шкала.

Когда нам необходимо собрать числовые оценки в онлайн-опросе, возникает соблазн использовать слайдер с ползунком, а не более привычные числовые шкалы с радиокнопками.

Однако дьявол кроется в деталях. Насколько же хорошо на самом деле работают слайдеры с ползунками и что думают о них респонденты?

Результаты опубликованных исследований, в рамках которых было проведено прямое сравнение слайдеров с ползунками и числовых шкал, неоднозначны (PDF). Например, взаимодействие с ползунком может быть сложнее как физически, так и когнитивно, чем простой клик по радиокнопке.

В нашем исследовании не было обнаружено существенных (или статистических) различий в средних оценках или распределении ответов между пятибалльной шкалой UX-Lite ™ (интерполированной до 0–100 баллов) и ползунками на шкале от 0 до 100 баллов для рейтингов развлекательных услуг.

Однако в исследовании по методу Монте-Карло мы обнаружили, что стандартный слайдер с ползунком немного точнее отражает результаты, чем пятибалльная шкала. Эти выводы были аналогичны итогам более ранних исследований, которые проводились с помощью опросника Subjective Mental Effort Questionnaire — субъективная оценка ментальных усилий (SMEQ; Sauro & Dumas, 2009 [PDF]).

В рамках нашего предыдущего исследования мы сфокусировались на сравнении ползунков и пятибалльных числовых шкал на компьютерах. Процент респондентов, использующих мобильные устройства для заполнения опросов, достигает 57% (Toepoel & Funke, 2018), поэтому важно понять, как тип устройства влияет на поведение людей.

В статье мы описываем исследование, в ходе которого респонденты использовали слайдеры с ползунками и числовые шкалы для заполнения короткого опроса на компьютерах и мобильных устройствах.

Экспериментальный дизайн

Мы провели эксперимент с участием 212 респондентов (подобраны американским агентством в конце января 2021 года). Они использовали радиокнопки и слайдеры для оценки интернет-магазинов (Amazon, Walmart, Target, Walgreens, CVS, Wayfair) и маркетплейсов (Craigslist, eBay, Etsy, Facebook Marketplace) с помощью UX-Lite (2 пятибалльные шкалы) и 1 одиннадцатибалльной шкалы Likelihood-to-Recommend — вероятность рекомендации (LTR).

Около половины (109) респондентов проходили опрос на компьютере, а другая половина (103) использовала мобильное устройство. Все респонденты должны были поставить оценку с помощью как числовой шкалы, так и ползунка. Шкалы разных видов были размещены в случайном порядке по методу греко-латинского квадрата.

Дизайн числовой шкалы и слайдера с ползунком

На рисунках 1 и 2 показаны десктопные версии числовой шкалы и слайдера UX-Lite и LTR. На рисунках 3 и 4 — мобильные версии.

Пример числовой шкалы UX-Lite и LTR для десктопа (создано с помощью MUIQ).

Пример слайдера с ползунком UX-Lite и LTR для десктопа (создано с помощью MUIQ).

Пример числовой шкалы UX-Lite и LTR для мобильных устройств (создано с помощью MUIQ).

Пример слайдера с ползунком UX-Lite и LTR для мобильных устройств (создано с помощью MUIQ).

Невозможно протестировать все виды шкал в рамках одного эксперимента. В текущем исследовании мы использовали разные варианты ориентации, размеры, форматы (радиокнопки vs слайдер) и длины шкал (1—5 и 0—10).

Ориентация

Как показано на рисунках 1—4, в десктопной версии ориентация была горизонтальной, а в мобильной — вертикальной для числовых шкал и горизонтальной для слайдеров с ползунками.

В предыдущей статье мы анализировали результаты для числовых шкал (горизонтальных на компьютере и вертикальных на мобильных устройствах). Было всего несколько случаев, когда ответы распределились по-разному, но мы не обнаружили существенных расхождений в средних значениях.

Наши результаты соответствовали выводам, полученным Funke, Reips и Thomas (2011), которые тестировали и горизонтальные, и вертикальные шкалы и слайдеры, но не обнаружили никаких значительных отличий в зависимости от ориентации.

Место на экране

В десктопной версии слайдеры занимали больше места, чем числовые шкалы. На экранах мобильных устройств все было наоборот, во многом из-за вертикальной ориентации числовых шкал.

Формат числовой шкалы

Во всех числовых шкалах для выбора опции использовались радиокнопки. Каждой из них соответствовал номер, а крайние точки были подписаны (крайнее негативное значение слева или сверху — там, где обычно располагается наименьшее число).

Формат слайдера с ползунком

Слайдеры могут быть разных видов. Например, некоторые из них отображают ограниченное количество вариантов ответа (допустим, 5), так что единственное отличие от стандартной числовой шкалы — это взаимодействие, которое используется для выбора опции (на шкале — клик, на слайдере — перетаскивание ползунка).

Часто слайдер охватывает широкий диапазон ответов (например, от 0 до 100). Ползунок нужно перетаскивать мышкой, пальцем или другим способом. Такой интерфейс может вызывать у некоторых пользователей определенные затруднения (см. исследование Chyung et al., 2018).

Иногда ползунок можно не только перетащить, но и приблизительно кликнуть в нужную точку на слайдере, а затем уточнить его позицию (как в случае со слайдерами MUIQ). Такие слайдеры называют визуально-аналоговая шкала (ВАШ).

Это название происходит от старых бумажных шкал, на которых пользователи отмечали определенную точку, чтобы выразить свое отношение или настроение (обычно линия имела длину 10 см, а положение отметки измеряли вручную, чтобы получить оценку от 0 до 100).

Изначально ползунок слайдера может располагаться слева, справа или в центре. Кроме того, они обладают разной чувствительностью, то есть степенью, в которой шкала позволяет выбирать значения между опциями (чем больше вариантов оценки, тем более чувствительной является шкала).

В этом эксперименте чувствительность шкалы составляла 0,1, а числовой диапазон слайдера соответствовал диапазону аналогичных числовых шкал (1–5 для UX-Lite, 0–11 для LTR). Выбранное значение появлялось во всплывающей подсказке, что можно увидеть на рисунках 2 и 4. Изначально ползунок размещался в центре шкалы, но значение не отображалось, пока пользователь не начинал перемещать ползунок, перетягивая его в другую точку или нажимая на другую часть слайдера.

Длина шкалы

Шкалы UX-Lite включали значения от 1 до 5, а LTR — от 0 до 11. В этой статье мы сосредоточились на результатах для UX-Lite. Мы представим остальные выводы в следующих статьях.

Результаты

Средние значения UX-Lite

Стандартный показатель UX-Lite вычисляется путем усреднения двух его значений и интерполяции до шкалы с диапазоном от 0 до 100. На рисунке 5 показаны средние значения UX-Lite (с доверительным интервалом 95%) в зависимости от устройства (компьютер, мобильный телефон) и формата (числовая шкала с радиокнопками, слайдер с ползунком).

Хотя средние значения слайдеров были немного выше как на компьютерах, так и на мобильных устройствах, анализ результатов показал, что различия не были статистически значимыми. В частности, дисперсионный анализ показал отсутствие значимого взаимодействия между независимыми переменными и форматом шкалы (F (1, 210) = 0,02, p = 0,88).

Главный эффект формата шкалы также был незначительным (среднее значение числовой шкалы — 73,0, среднее значение слайдера — 74,2, наблюдаемая разница — 1,2 с доверительным интервалом 95% от 4,7 до 2,3, t (211) = 0,70, p = 0,49), как и главный эффект устройства (среднее значение для компьютеров — 72,7, среднее значение для мобильных устройств — 74,5, наблюдаемая разница 1,8 с доверительным интервалом 95% от -2,4 до 6,0, t (210) = 0,85, p = 0,40).

Распределение ответов в рамках UX-Lite

На рисунках 6 и 7 показано, как распределились ответы для числовых шкал и слайдеров (внутрисубъектное сравнение, поскольку каждый респондент имел возможность проставить оценки и в том, и в другом формате). Мы использовали следующие правила, чтобы распределить ответы по дискретным диапазонам, соответствующим значениям 1—5 радиокнопок.

1: значение ползунка меньше 1,6
2: значение ползунка в пределах от 1,6 до 2,5
3: значение ползунка в пределах от 2,6 до 3,5
4: значение ползунка в пределах от 3,6 до 4,5
5: значение ползунка больше 4,5

Сфокусировавшись на часто используемых метриках для оценки процентных показателей (значение первого столбца или сумма значений первых двух столбцов), мы не обнаружили статистически значимых различий ни для первого, ни для второго вопроса, хотя некоторые показатели были близки к значимым (оценивались с помощью тестов средней вероятности МакНемара). Распределение ответов для числовых шкал и слайдеров не было идентичным, но и кардинально не различалось.

Простота использования сайта — первый столбец p = .08
Простота использования сайта — первые два столбца p = .89
Отвечает ли сайт потребностям — первый столбец p = .42
Отвечает ли сайт потребностям — первые два столбца p = .11

Распределение ответов на вопрос о простоте использования сайта для числовых шкал и слайдеров. Top-Box — значение первого столбца, Top-2-Box — значение первых двух столбцов.

Распределение ответов на вопрос о соответствии сайта потребностям респондента для числовых шкал и слайдеров. Top-Box — значение первого столбца, Top-2-Box — значение первых двух столбцов.

В таблице 1 показаны результаты 8 тестов N-1 с 2 пропорциями, в рамках которых было проведено сравнение оценок UX-Lite по первым столбцам и первым двум столбцам для компьютеров и мобильных устройств.

Таблица 1: Сравнение результатов тестирования по первым столбцам и первым двум столбцам: распределение оценок в зависимости от устройства (компьютеры и мобильные).

Результаты и выводы

Мы провели эксперимент (n = 212), чтобы увидеть, как 2 независимые переменные, формат шкалы (числовые шкалы с радиокнопками vs слайдеры с ползунками) и устройство (компьютеры vs мобильные) влияют на поведение респондентов и их оценки.

Средние значения не различаются: Несмотря на те или иные факторы, мы не нашли статистических различий в средних значениях между слайдерами и радиокнопками при использовании двух пятибалльных шкал в UX-Lite. Не было выявлено значимых главных эффектов или взаимодействий, наблюдаемые различия составляли менее 2 баллов по шкале UX-Lite от 0 до 100 (рисунок 5).

Возможно умеренное влияние на распределение ответов: Ни один из анализов распределения ответов по первому или первым двум столбцам в зависимости от формата шкалы не был статистически значимым, однако 2 из них были близки к значимым (первый столбец для вопроса о простоте использования и два первых столбца для вопроса о соответствии потребностям — рисунки 6 и 7). Аналогичные результаты были получены при анализе первого столбца и первых двух столбцов в зависимости от устройства (таблица 1, все p > .10).

Небольшие различия не исключены: Главный вывод заключается в том, что значительных различий в поведении респондентов для числовых шкал с радиокнопками и слайдеров на компьютерах и мобильных не наблюдается. Если бы такие различия были достаточно заметными, наш эксперимент точно помог бы их обнаружить. С другой стороны, еще слишком рано утверждать, что различия, если они существуют, настолько малы, что не имеют практического значения, особенно для исследователей, которых интересуют результаты оценок по первым столбцам и первым двум столбцам.

Были использованы только 2 пятибалльные шкалы: Одно исследование не может охватить все аспекты этой темы. Мы использовали только 2 пятибалльные шкалы UX-Lite. В следующих статьях мы представим результаты оценок по одиннадцатибалльным шкалам (LTR) и предпочтения пользователей относительно числовых шкал и слайдеров с ползунками в этом случае.

Больше классных проектов в uprock.design

Источник

и

:

measuringu.com

,