O que é índice inchado e como corrigi-lo?   

Como especialista em SEO, você pode ter despendido um esforço significativo na otimização de material novo, mas ainda não atingiu seu potencial de classificação. Pode ser porque você negligencia uma ameaça invisível: o inchaço do índice.

O inchaço do índice representa problemas tanto para os mecanismos de pesquisa quanto para os proprietários de sites. Isso dificulta o esforço dos algoritmos dos mecanismos de pesquisa para reconhecer informações úteis, resultando em menos rastreamentos de sites. 

Além disso, ele esconde material de alta qualidade atrás de páginas menos úteis, reduzindo a exposição do seu site e o potencial total de classificação.

Felizmente, lidar com o inchaço do índice é simples. Analisaremos o inchaço dos índices, como isso afeta os orçamentos de rastreamento e soluções práticas para aumente a exposição online do seu site.     

O que é inchaço do índice? 

inchaço do índice

O inchaço do índice ocorre quando seu site contém dezenas, centenas ou milhares de páginas de baixa qualidade indexadas pelo Google que não oferecem utilidade aos visitantes em potencial.

Isso faz com que os rastreadores de pesquisa gastem muito tempo pesquisando páginas irrelevantes do seu site, em vez de concentrar seus esforços em sites que beneficiam o seu negócio. Ele também oferece uma experiência de usuário terrível para os visitantes do seu site.

O inchaço do índice ocorre frequentemente em sites de comércio eletrônico com um grande número de produtos, categorias e avaliações de usuários. Páginas de baixa qualidade indexadas pelos mecanismos de pesquisa podem sobrecarregar o site devido a dificuldades técnicas.

Resumindo, o inchaço do índice faz com que seu site fique lento e desperdice o financiamento do rastreamento. Manter um site limpo garante que os mecanismos de pesquisa indexem apenas os URLs que você deseja que os usuários encontrem.

Inchaço do índice em ação: um exemplo

Há alguns anos, planejamos trabalhar em um site de comércio eletrônico com aproximadamente páginas 10000.

Quando visitamos o Google Search Console, ficamos surpresos ao descobrir que o Google havia indexado 38000 páginas para nosso domínio. Isso era muito alto, dado o tamanho do local. 

(Dica: você pode descobrir esses números para o seu site em “Search Console” > “Indexação” > “Páginas”.)

Esse número aumentou consideravelmente em um curto período. Inicialmente, o Google Analytics indexou 16000 páginas.

O que estava acontecendo?

O software do site criou centenas de páginas de produtos supérfluas. 

Em alto nível, se o estoque de uma marca esgotasse no site (o que acontecia com frequência), o algoritmo de paginação gerava centenas de páginas adicionais. 

Como resultado do bug, a indexação do site disparou – e o desempenho do SEO foi prejudicado. 

Inchaço do índice: por que é importante?

porque

O inchaço do índice aumenta a presença do seu mecanismo de pesquisa com conteúdo que não tem propósito ou é irrelevante para os visitantes.

Quando os bots de pesquisa indexam essas páginas irrelevantes, acontece:

  • Os mecanismos de pesquisa têm mais dificuldade em classificar seus sites. Os rastreadores de pesquisa devem compreender o seu site para corresponder com precisão o conteúdo às solicitações dos usuários e classificá-lo. Páginas sem um propósito claro e lógico tornam mais difícil para o Google e outros mecanismos de pesquisa compreender e obter informações.
  • Impacta negativamente as classificações dos mecanismos de pesquisa. Quando páginas com conteúdo comparável têm como alvo as mesmas palavras-chave, elas competem entre si. Páginas de baixa qualidade ou conteúdo duplicado podem não conseguir classificar ou interessar os leitores, diminuindo a autoridade geral do seu site.
  • Uso ineficiente do orçamento de rastreamento. O inchaço do índice faz com que os bots de pesquisa desperdicem seu orçamento limitado de rastreamento adquirindo material que o Google não exige. Isso desvia tempo e recursos das páginas que você deseja classificar.

Como diagnosticar o inchaço do índice?

diagnosticar

O Relatório de cobertura do Google Search Console é uma das técnicas mais rápidas e confiáveis ​​para descobrir tipos de páginas que causam inchaço no índice.

Os URLs que são indexados, mas não enviados ao mapa do site XML, presumindo que o mapa do site siga as práticas recomendadas de SEO e contenha apenas URLs relevantes para SEO.

Use uma ferramenta de rastreamento ilimitada para encontrar o número de URLs indexáveis ​​se seus sitemaps XML não representarem páginas legítimas de maneira ideal.

Se você tiver muito mais páginas legítimas do que URLs rastreados, certamente está enfrentando um inchaço no índice.

Não utilize o operador site: search advanced para contar o número de páginas indexadas; é bastante impreciso.

Depois de encontrar páginas de baixo valor para desindexar, faça referência cruzada dos URLs com os dados do Google Analytics para determinar o impacto esperado no tráfego orgânico.

Devido à sua natureza, geralmente não têm impacto prejudicial, mas é essencial verificar novamente antes de prosseguir com a desindexação em grande escala.

Como o inchaço do índice afeta o desempenho de SEO?

desempenho seo

Com mais de 1.13 bilhão de sites online, os mecanismos de pesquisa têm uma “orçamento de rastreamento" para cada um. Isso significa que eles só podem visualizar e analisar uma determinada quantidade de páginas em um determinado período de tempo. 

As páginas principais do seu site são rastreadas, mas não indexadas devido ao excesso de índice e, se o seu orçamento acabar, o processo de indexação será interrompido.

Como resultado, seu conteúdo levará mais tempo para ser aparecer em SERPs, prejudicando assim a classificação do seu site e diminuindo as taxas de conversão. 

Seu site tem um número limitado de páginas indexadas pelo Google, além de restrições orçamentárias de rastreamento.

Isso deixa grande material intocado e talvez pouco conhecido. Uma página de alta qualidade que recebe 7,000 visualizações por mês poderá receber apenas 2,500 se o Google rastrear as páginas indesejadas que competem pelo mesmo tráfego.

O inchaço do índice pode levar a taxas de cliques mais baixas e uma experiência ruim para o usuário. 

Quando os usuários encontram páginas de um índice excessivamente grande, eles precisam examinar mais resultados de baixa qualidade para encontrar o que procuram, resultando em mais rejeições e menos cliques em seus sites.

Com o tempo, isso reduz sua CTR, fazendo com que o Google perca a fé em você e o classifique em uma posição inferior.

Aqui está um resumo de como o inchaço do índice afeta a saúde do SEO:

  • Desperdiçar um orçamento caro de rastreamento em páginas que não contribuem em nada para o crescimento do seu negócio.
  • prejudicando as classificações, reduzindo o tráfego e, eventualmente, diminuindo as taxas de conversão.
  • Diminuindo o CTR e criando uma UX terrível.

Resumindo, o inchaço do índice atrasa significativamente o progresso do SEO, ao mesmo tempo que reduz silenciosamente a eficácia do seu maior conteúdo. É como tentar sair da areia movediça; isso atrai você a cada passo.

Como corrigir o inchaço do índice?

a. Conduza uma auditoria de índice

Explore o Search Console e o Google Analytics para determinar o valor das páginas indexadas. Classifique em:

  • Conteúdo essencial para manter
  • Penugem média para fortalecer ou solidificar
  • Páginas zumbis inúteis para excluir ou redirecionar

Ao segmentar as páginas dessa forma, você pode revelar possibilidades de consolidação e redução, permitindo alterar facilmente o patrimônio histórico do conteúdo. O tráfego contínuo de links para as regiões do seu site que melhor atendem às demandas dos usuários.

Essa técnica também mostrará falhas no design do site que exigem novo posicionamento de conteúdo.

b. Remover links internos

Se você pretende não indexar seu material, a exclusão de conexões internas com ele reduzirá a capacidade do Google de detectá-lo e indexá-lo. 

Como o Google utiliza links internos para encontrar novos materiais em seu site, a remoção desse canal faz com que o Google concentre sua atenção em outras conexões internas em sua página e as examine.

Se você deseja remover suas páginas desnecessárias, a exclusão de conexões internas a essas páginas diminuirá a probabilidade de links quebrados e permitirá que você acesse informações mais relevantes que deseja que o Google encontre.

c. Redirecionamentos 301

Se o seu site tiver muitos URLs que contenham informações iguais ou comparáveis, use redirecionamentos 301 para a versão canônica desejada da página.

Isso direcionará os sinais de patrimônio e classificação do link para o URL canônico, eliminando o inchaço do índice de sites duplicados.

d. Defina as tags canônicas adequadas

O Google prioriza sites que contêm tags canônicas na seção de cabeçalho ( ) para indexação. 

Durante a indexação, evitamos páginas duplicadas e consolidamos o valor do link, redirecionando-o para a página principal.

e. Atualize ou instale robot.txt

instalar

Se o seu site ainda não possui um arquivo robot.txt, crie um. Para garantir que os rastreadores de pesquisa cheguem aos sites corretos, é recomendável revisar e atualizar regularmente os arquivos robot.txt atuais.

Um arquivo robot.txt impede que bots de mecanismos de pesquisa acessem subdiretórios. Por exemplo, evitamos que o Google rastreie resultados de pesquisa gerados por usuários. 

Se nosso arquivo robots.txt não conseguir isso, o Google poderá acessar, rastrear e indexar milhares de páginas que não queremos que apareçam nos resultados de pesquisa, esgotando seu orçamento de rastreamento.

f. Use a ferramenta de remoção de URL do Google Search Console

remoção de URL

Adicionando o “sem índice”A diretiva pode não ser uma cura rápida e o Google pode continuar a indexar as páginas, e é por isso que o Ferramenta de remoção de URL pode ser útil de vez em quando.

No entanto, utilize este procedimento apenas como uma solução temporária. Quando você solicita ao Google, ele exclui imediatamente as páginas de seu índice (normalmente em algumas horas, dependendo do volume de consultas).

As Ferramentas de Remoção funcionam melhor quando usadas em conjunto com a diretiva no-index. Lembre-se de que quaisquer exclusões feitas serão reversíveis no futuro.

g. Use Meta Robot Tags e robôs X

Um documento HTML pode adicionar uma meta tag robot para oferecer informações sobre uma única página sem afetar os robôs de todo o site. Você tem mais controle sobre como cada página é rastreada.

Também pode incluir instruções para rastreadores específicos (“bot do Google” ou “bot do Bing”) e omitir páginas de imagens, vídeos e pesquisas de notícias do Google. É necessário usar uma meta tag de robôs nas páginas que você não deseja que os mecanismos de pesquisa rastreiem.

Se você adicionar inadvertidamente uma tag no-index a uma página que não deveria ser indexada de acordo com seu arquivo robots.

A tag X-Robots aparece em uma resposta de cabeçalho HTTP. Ela tem a mesma finalidade de uma meta tag de robôs, controlando a indexação de fotos, vídeos, PDFs e outros documentos não HTML.

h. Implemente a paginação corretamente

Se o seu site tiver material paginado (como listas de produtos ou arquivos de artigos), use as tags rel=”next” e rel=”prev” para indicar a paginação apropriada aos mecanismos de pesquisa. 

Isso os impede de indexar cada página paginada individualmente, o que reduz o inchaço do índice. 

Conclusão

O inchaço do índice é um problema predominante que tem impacto no desempenho de um site nas páginas de resultados de mecanismos de pesquisa e na experiência do usuário. 

A indexação excessiva de sites irrelevantes pelos motores de busca enterra material útil. Isso leva a classificações diluídas e ao desperdício de recursos de rastreamento.

No entanto, reconhecer as causas e implementar soluções tecnológicas adequadas pode melhorar o desempenho geral de SEO.

Você pode identificar quais páginas do seu site apresentam inchaço no índice e eliminá-las usando as técnicas discutidas acima.

Isso pode ajudá-lo a melhorar a avaliação geral da qualidade do seu site nos mecanismos de pesquisa, obter uma classificação mais elevada e criar um índice mais limpo, permitindo que o Google identifique as páginas que você deseja classificar de forma rápida e eficaz.

Perguntas Frequentes

1. O que é inchaço rastejante?

Isso ocorre quando mecanismos de pesquisa como o Google indexam um grande número de páginas irrelevantes, redundantes ou de baixa qualidade de um site. A presença de inchaço no índice pode diluir os esforços de SEO de um site, distribuindo o orçamento de rastreamento de maneira desigual e influenciando as avaliações de qualidade geral dos mecanismos de pesquisa.

2. Como posso resolver problemas de indexação de páginas?

Esse problema acontece quando você pede diretamente ao Google para indexar uma página (adicionando-a ao mapa do site ou solicitando manualmente a indexação), mas essa página não possui tag de índice. A solução é simples: exclua a tag noindex para que o Google possa acessar a página.

3. Como posso remover uma página da indexação?

Para evitar que URLs ou domínios apareçam nos resultados de pesquisa do Google, use uma tag noindex no cabeçalho da(s) página(s) que você deseja excluir. A desindexação é o processo de remoção de um URL existente do índice de pesquisa do Google.

    Cadastre-se em nosso boletim informativo para obter as últimas atualizações diretamente

    Deixe um comentário

    O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *