Os perigos do teste A / B

Há uma expressão na publicidade que diz “Eu sei que 80% da minha publicidade não está funcionando. Eu não sei quais 80% ”. A mesma lógica se aplica a todas as formas de design, incluindo web design. Se soubéssemos qual parte do conteúdo de nossa página, layouts e fluxos de trabalho não estavam funcionando tão bem quanto deveriam, isso não seria incrível?

Parece uma dádiva de Deus saber o que funciona quando se trata de design de experiência do usuário, ter confirmado em dados quantificáveis que de dois layouts, elementos ou rotas é o ideal e essa é a promessa do teste A / B. É uma ferramenta poderosa, mas não é uma panacéia e o excesso de confiança não só pode embotar o seu julgamento como designer, mas também, paradoxalmente, resultar em soluções sub-ótimas.

Neste artigo, examinarei algumas das armadilhas do uso de testes A / B e como esses testes comparativos podem ser usados como parte de um kit de ferramentas de designers, em vez de uma metodologia de design dominante.

O teste A / B tornou-se um poderoso aplicativo no campo do design da web. O advento da veiculação dinâmica de páginas e de softwares de análise modernos, como o Google Analytics, facilita a configuração e a execução de testes A / B ou testes de divisão. Os visitantes são servidos alternadamente um layout de página ou outro, e o software mede o que gera o maior número de uma ação predeterminada, por exemplo, clicar em um botão Comprar agora ou preencher um formulário de registro. Essas ações são definidas como metas: mensuráveis, quantificáveis, cognoscíveis. No teste A / B de web design, essas metas devem ser algo que pode ser registrado pelo software de análise, portanto, embora o objetivo possa ser um usuário clicar em um link para um artigo, ele não pode registrar se o usuário lê esse artigo. .

Este artigo tem mais informações sobre como executar testes A / B e aqui está um resumo de alguns dos mais conhecidos estudos de casos de teste.

O teste A / B é inevitavelmente redutivo, evoluindo de forma darwinista o design 'mais apto'. Testar dois designs radicalmente diferentes dirá qual deles funciona melhor para o objetivo que você está testando. Você pode repetir essa etapa ad infinitum. Mas, para ir além disso, você precisará variar dois elementos do design mais adequado, a fim de tentar melhorar a pontuação do feedback. Quase imediatamente você passou de testar 2 designs altamente divergentes para ajustar o design 'vencedor'. Os estatísticos chamam isso de encontrar o máximo local em vez do máximo global. Você pode facilmente encontrar-se descendo uma estética sem saída, encontrando a casa mais bonita na rua do que a melhor casa de toda a cidade. O teste de várias opções, chamado teste multivariado ou teste de bucket, adiciona complexidade adicional e as ferramentas são geralmente mais caras.

Mesmo com várias opções, o teste de divisão só pode ser usado para medir e otimizar um objetivo de cada vez. A otimização para um objetivo pode ser boa se o site for muito focado, como um site de comércio eletrônico, em que um resultado desejado supera todos os outros. Mas se você tiver vários objetivos para o seu site, precisará verificar se as alterações são bem-sucedidas em relação a todas as metas.

Tendo passado tanto tempo testando e otimizando um site para descobrir o máximo local, é compreensível que um designer não queira desperdiçar todo esse esforço e buscar outro design. Para ser franco, você pode ter passado muito tempo determinando qual dos dois layouts é o melhor, sem perceber que ambas as páginas são ruins. A dúvida persistente deve sempre permanecer, se você conseguiu otimizar o conteúdo e UX de um que marcou uma taxa de sucesso de 6% para uma taxa de sucesso de 8%, há outro projeto que renderia um retorno de 9% ou mais?

As respostas dos usuários também serão alteradas com o tempo, e o que pode ter sido testado como ótimo no mês passado pode não estar mais obtendo os melhores resultados. Um perigo é que você pode ficar preso em um ciclo contínuo de testes e ajustes. Nesse ponto, você é menos um designer do que um autômato quant-a. Você abdicou do seu julgamento e projetou a sensibilidade para buscar continuamente a garantia do teste. Conheço pessoas que se tornaram obcecadas em tentar testar tudo, decidofóbicas, sempre buscando o Shangri-La de taxas ótimas de conversão.

Contagem das primeiras impressões

“Você nunca tem uma segunda chance para causar uma primeira impressão”, como diz o ditado. Como pesquisa na Universidade de Ontário e em outros lugares, os visitantes de um site tomam uma decisão subconsciente de gostar ou não em um tempo incrivelmente curto, mesmo em milissegundos. O "efeito halo" dessa impressão inicial colore o julgamento subsequente do usuário no site e até mesmo determina a avaliação da credibilidade do site. Sempre me surpreendeu a taxa de rejeição que todos os sites recebem, ou seja, pessoas que visitam um site e quase que imediatamente saem novamente. Muitas vezes, isso ocorre devido à frustração do usuário que aguarda o carregamento da página. A otimização técnica e a redução do peso da página geralmente serão mais benéficas do que o teste UX. A renderização lenta da página afastará os usuários até mesmo do site mais atraente.

O que nos leva a uma advertência importante: você só pode fazer um teste A / B depois de lançar. Você precisa ter usuários reais com metas reais para dividir seu site com precisão. Mesmo A / B testando um site beta de pré-lançamento privado não é confiável, a menos que você tenha uma grande comunidade beta. Um tamanho de amostra grande (ou seja, um alto número de visitas à página) também é necessário para resultados precisos. Assim, você precisará se comprometer a lançar um design antes mesmo de começar a pensar em otimizar. Você tem que se comprometer com um design, e sempre há um primeiro passo para o desconhecido que o teste A / B não pode ajudar.

A centelha de inspiração

Como Henry Ford disse: “Se eu perguntasse às pessoas o que elas queriam, elas teriam pedido cavalos mais rápidos”. Os usuários nem sempre são as melhores pessoas para pedir feedback. Isso me leva à minha maior crítica ao teste A / B: ele força você a seguir seu público, não a liderá-lo. Você abdica da responsabilidade de decidir o que faz seu site funcionar melhor para a sabedoria da multidão. Você acaba projetando para agradar o público que você tem, não o público que você quer.

Essa abordagem não deixa lugar para essa centelha de inspiração, para criar algo verdadeiramente original, algo que nunca vimos antes. Não é de admirar que tantos sites pareçam tão semelhantes, cada um jogando com uma aparência estabelecida. Você se atreve a ser diferente? Como esta conversa provocadora Estados, às vezes precisamos olhar para além dos ganhos marginais e procurar o salto quântico, a próxima grande ideia.

Um design exclusivo e uma experiência do usuário provavelmente serão mal testados no início, mas pode levar algum tempo para ganhar tração. Lentamente, um burburinho pode se desenvolver em torno do design, e pode atrair um novo público, que esteja mais disposto a se engajar com o site, seu conteúdo e design em síntese. O teste A / B pode ser usado para ajustar e otimizar ainda mais o design e o layout, mas não pode levá-lo à terra prometida. Você precisará definir as metas do que contribui para um público engajado. Visualizações de página são uma métrica muito fraca de engajamento. O tempo gasto em uma página é melhor ou o número de comentários que um artigo atrai. Mas apenas o feedback e a análise qualitativa do seu público dirão se eles gostam de usar o site, apenas as medições quantitativas não contam a história completa.

Confie em seu julgamento

O maior ato de design é fazer uma marca, saber por que você fez isso e confiar que isso é bom. Se todo elemento colocado, toda palavra escrita, for feito com dúvida, como alguém pode construir com confiança? Projetar com confiança e nossa sensibilidade de design individual é o que nos permite projetar com estilo e personalidade.

Em última análise, um site que é construído com a lógica e a consistência de uma visão de design clara sempre superará um site que foi construído com cada elemento timidamente colocado e testado com nervosismo.

Isso não quer dizer que o teste A / B não tenha seu lugar. Mas é mais adequado para elementos de teste de nicho, não para layouts. É menos útil testar uma página em relação à outra, mas é melhor testar um elemento, como uma cópia diferente em um botão. Fluxos de trabalho também estão prontos para testes separados: o formulário de inscrição é melhor como uma sequência de pequenos passos ou uma grande forma? E se o formulário de inscrição for uma janela modal sobreposta à página inicial? Confira Qual teste ganhou para ver alguns ótimos exemplos e estudos de caso de testes UX, predominantemente no campo de comércio eletrônico.

De um modo geral, será melhor usar o tempo gasto no teste A / B para modificar seu site de outras maneiras que você sabe que estão aprimorando seu site, como garantir a renderização adequada em todos os navegadores e reduzir o peso da página. O layout é responsivo a diferentes dispositivos, oferecendo a melhor experiência possível? Existem erros de digitação? Parece bom em dispositivos móveis?

Você não deve sempre precisar de um teste A / B para saber que está melhorando o seu site.

Quanto teste A / B você faz? Um bom web designer precisa de um teste A / B? Deixe-nos saber seus pensamentos nos comentários.

Imagem em destaque / miniatura, imagem de decisão via Shutterstock.

experiência de usuário teste de ab google analytics teste de balde kit de ferramentas de designers teste multivariado otimizar conteúdo armadilhas do teste a / b