Что такое А/Б эксперимент а также почему оно необходимо
Что такое А/Б эксперимент а также почему оно необходимо
A/B эксперимент составляет из себя подход проверки двух либо разных версий веб-страницы, дизайна, текста, элемента действия, формы, email-сообщения, рекламного креатива или другого цифрового блока. Основная задача состоит в этом, дабы определить, какая версия результативнее работает на практике. Вместо предположений плюс личных суждений задействуется тест в рамках живой посетителей, когда первая доля получает версию A, тогда как другая — версию B.
Подобный метод позволяет выбирать действия с опорой на основе показателей, а без опоры на субъективных вкусов а также нерегулярных наблюдений. В экспертных материалах, в том числе 1win зеркало, нередко подчеркивается, что A/B эксперимент особо ценно там, когда точечные правки способны влиять на действия пользователей: клики, оформления профилей, отправку форм, объем изучения, возвращаемость, заказы, подписки а также прочие заданные результаты. Подход дает возможность увидеть, действительно ли изменение повышает 1win эффект.
Каким образом проводится A/B тестирование
Механизм сплит тестирования достаточно понятен. Вначале определяется объект, который необходимо протестировать. Объектом проверки способен оказаться название, визуальный тон элемента действия, порядок элементов, сообщение сообщения, логика анкеты, картинка, стоимость, формат предложения а также позиция целевого действия. Затем готовятся как минимум два версии: исходный а также обновленный. Затем этого поток пользователей разделяется по ними по предварительно установленным условиям.
Контрольная часть посетителей остается просматривать исходную страницу, и вторая получает измененную. Инструмент фиксирует сведения про действиях каждой группы затем анализирует результаты. В случае если вариант B дает более сильный результат на фоне значительном объеме данных, такой вариант можно запускать. В случае если разницы не видно либо тестовая версия функционирует слабее, изменение отклоняется. Как раз в таком подходе и проявляется практическая польза проверки: он помогает тестировать гипотезы до массового 1вин запуска.
Зачем используется сплит тестирование
сплит проверка нужно ради снижения неясности. Внутри цифровых сервисах даже незначительная особенность имеет шанс влиять на оценку экрана. Один текстовый блок способен стать понятнее иного, сжатая анкета способна проходиться чаще объемной, а заметно более заметная кнопка действия имеет шанс повысить число переходов. Если не использовать тестирования подобные выводы обычно сохраняются предположениями.
Эксперимент позволяет оптимизировать платформу постепенно. Взамен крупной реконструкции целого проекта а также сервиса допустимо проверять точечные блоки и измерять практический результат. Такая логика сокращает угрозу слабых изменений, экономит время и средства а также позволяет собирать знания касательно поведении пользователей. Через периодом команда 1 win формирует не совокупность оценок, вместо этого модель валидированных действий.
Какие блоки получается проверять
Тестировать получается почти каждый блок, который влияет в отношении действия аудитории. Чаще преимущественно оценивают headline-блоки, подзаголовки, призывы к переходу, формулировки элементов действия, анкеты создания профиля, расположение секций, визуалы, страницы позиций, очередность этапов, фильтры, навигацию, визуальные блоки, подсказки, рассылки плюс промо материалы. Важно, чтобы указанный элемент оказывался объединен с определенной точной метрикой.
Когда ориентир заключается в процессе увеличении заполненных заявок, разумно проверять форму, формулировку возле нее, объем строк плюс выразительность элемента действия. В случае если важно усилить глубину изучения, имеет смысл проверять навигацию, модули предложений, внутренние линки и построение раздела. Насколько яснее соотношение 1win в паре корректировкой а также целью, настолько ценнее результат тестирования.
Предположение в роли база теста
Каждый хороший сплит эксперимент стартует на основе проверяемой идеи. Проверяемая идея показывает, какое именно изменение предлагается, по какой причине оно имеет шанс сказаться по части эффект плюс какого типа результат может измениться. В частности, допустимо сформулировать, что сокращение анкеты регистрации сократит число отказов, поскольку ведь посетителю нужно будет меньший объем времени для завершения действия.
Хорошая проверяемая идея не должна должна казаться слишком размытой. Идея вроде «сделать страницу лучше» не помогает позволяет оценить результат. Намного более ценный пример: «при условии что обновить растянутый надпись элемента действия на более краткий а также точный, число нажатий вырастет, поскольку ведь ожидаемый результат окажется понятнее». Такая гипотеза сразу же 1вин определяет объект проверки, основание а также метрику.
Контрольная а также тестовая выборки
На уровне сплит тестировании базовая часть получает первоначальный формат, а экспериментальная — измененный. Это разделение нужно с целью честного сравнения. В случае если просто заменить версию и оценить результаты до плюс вслед за, итог способен исказиться из-за сезонности, рекламной кампании, смены каналов посещений, событий, технических проблем или других окружающих причин.
Одновременный показ отличающихся вариантов снижает роль непредвиденных условий. Обе выборки остаются в похожей среде: единый а также самый одинаковый срок, одинаковые самые потоки пользователей, схожие девайсы а также единый контекст. Следовательно отличие в показателях с большей 1 win значительной вероятностью связано как раз с конкретным изменением, и не не с случайными обстоятельствами.
Какие показатели применяются при сплит проверках
Критерий — является значение, по которому оценивается итог эксперимента. Определение критерия зависит от задачи эксперимента. Для раздела с размещенной формой значимы передачи форм, для онлайн-магазина — сохранения в заказ и заказы, в случае контентного проекта — глубина просмотра и период чтения, ради сервиса — регистрации, первые действия, retention плюс повторные 1win активности.
Важно отделять ключевую а также дополнительные метрики. Основная показывает, зачем чего делается тест. Вторичные позволяют понять побочные результаты. Например, обновление элемента действия способно усилить клики, при этом ухудшить результативность следующих событий. Из-за этого полезно оценивать не исключительно исключительно в сторону первый шаг, но также в сторону дальнейшее действие: выполнение формы, повторные визиты, выходы, проблемы плюс итоговую значимость действия.
Расчетная значимость
Математическая существенность показывает, как реалистично, что полученная расхождение среди решениями не считается случайным колебанием. Когда конкретный формат незначительно превосходит альтернативный по итогам пары десятков единиц посещений, это все еще не означает доказывает победу. При небольшом объеме наблюдений итог способен оперативно измениться, после того как 1вин аудитория окажется шире.
Ради надежного вывода нужно нужное количество наблюдений. Насколько скромнее ожидаемая отличие в паре решениями, настолько больше данных потребуется накопить. Когда правка обязано увеличить метрику всего около пару %, проверке будет необходимо повышенный объем времени а также трафика. Математическая достоверность позволяет не выносить быстрые действия по основе нестабильных изменений.
Масштаб наблюдений и длительность эксперимента
Объем группы сказывается на качество итога. Если тест получает очень мало людей, результаты способны стать ненадежными. К примеру, пять дополнительных переходов в одной группе способны показываться как увеличение, но при большем масштабе станут простой колебанием. Поэтому до запуском разумно понимать, какой объем посетителей 1 win либо действий потребуется ради проверки гипотезы.
Срок проверки тоже сохраняет роль. Слишком быстрый эксперимент может не успеть отражать отличия среди будними плюс нерабочими сутками, рабочей плюс послерабочей реакцией, разными источниками трафика. Как правило проверка должен включать завершенный круг действий посетителей. При этом слишком долгий период проверки равно неподходящ, когда внешние условия успевают заметно измениться.
Почему опасно менять эксперимент во процесс запуска
Одна из частых ошибок — добавлять корректировки в проверку вслед за начала. В случае если по ходу центре теста обновить сообщение, аудиторию, интерфейс, правила демонстрации либо метрику, данные перемешаются. После этого станет сложно понять, какой фактор конкретно воздействовало по части итог. Тест потеряет прозрачность, при этом заключения станут ненадежными 1win.
До момента начала необходимо установить предположение, форматы, критерии, разбивку аудитории и параметры остановки. Вслед за запуска правильнее не менять условия без наличия важной основания. Если найдена ошибка на уровне настройке либо служебный дефект, разумнее остановить проверку, устранить ошибку и создать повторный эксперимент, чем пытаться объяснять испорченные наблюдения.
Параллельное сравнение многих корректировок
Порой появляется желание проверить одновременно ряд правок: обновленный headline, альтернативную кнопку, сокращенную форму и перестроенный порядок элементов. Этот подход имеет шанс дать суммарный результат, но не покажет покажет, какой именно фактор сказался в отношении метрику. В случае если новая вариация выиграла, будет неясно, какая правка помогло сильнее прочего.
Ради корректной оценки как правило корректируют единственный существенный элемент в 1вин один этап. Если необходимо сопоставить несколько сочетаний, применяется мультивариантное тестирование. Этот формат труднее, требует повышенного числа пользователей а также аккуратной оценки. Для многих целей А/Б тест на основе конкретной ясной идеей обеспечивает намного более понятный плюс практичный результат.
Сценарии А/Б тестирования на уровне UI
В интерфейсах A/B эксперимент часто используется ради оптимизации ясности действий. Например, можно проверить пару версии анкеты: расширенную с большим множеством строк плюс краткую с небольшим минимальным числом данных. Когда краткая форма повышает число оконченных регистраций без риска потери ценности обращений, такую форму можно считать гораздо более удачной.
Следующий пример — тестирование формулировки элемента действия. Нейтральная формулировка способна быть не такой очевидной, относительно прямое название действия. Кроме того сравнивают расположение CTA-элементов, очередность смысловых разделов, подачу 1 win hint-элементов, наличие прогресс-бара, метод показа предупреждений и количество этапов на протяжении пути. Каждый этот фактор воздействует в отношении то самое, насколько легко завершить заданное событие.
сплит тестирование на уровне контенте
В контенте проверка дает возможность понять, какие именно headline-блоки, описания, построения а также форматы сильнее привлекают внимание. Допустимо проверять отличающиеся интро, размер текста, последовательность объяснений, присутствие списков, подачу элементов, подачу преимуществ или формат объяснения непростой задачи. Однако при таком подходе необходимо измерять не только нажатия, однако также дальнейшее взаимодействие.
Название способен повысить объем переходов, но в случае если контент не будет соответствует запросам, увеличится процент отказов. Следовательно редакционные проверки нужны чтобы анализировать качество чтения: длительность просмотра, скролл, перемещения на уровне платформы, возвраты и завершение нужных действий. Сильный результат — представляет собой не просто просто захват интереса, но согласование ожидания и контента.
сплит эксперимент в email-рассылках
Внутри email-рассылках нередко сравнивают заголовки рассылок, название отправителя, первые строки, время рассылки, объем сообщения, расположение CTA-элементов плюс описания предложений. Одна часть подписчиков открывает одну формат письма, другая часть — другую. Вслед за рассылкой сравниваются открытия, клики, отказы от подписки, негативные сигналы а также дальнейшие события в пределах платформе.
Необходимо не сводить анализ метрикой open rate. Subject-строка рассылки имеет шанс стать выразительной а также привлекать интерес, но в случае если тема не сможет соответствует контенту, нажатия плюс доверие могут снизиться. Поэтому качественный email-тест измеряет полную последовательность: просмотр, нажатие, действия вслед за нажатия а также отклик аудитории на рассылку.