×

Como remover uma página da web do Google

Como remover uma página da web do Google

Como remover uma página da web do Google

Os motivos para remover uma página dos resultados de pesquisa do Google não mudaram muito desde que publiquei este artigo pela primeira vez em 2023. Os exemplos incluem páginas com informações confidenciais, premium ou desatualizadas. No entanto, as ferramentas e táticas evoluíram.

Aqui está minha versão atualizada.

Remoção temporária

A necessidade de remover URLs do Google é urgente quando um site é (i) invadido por malware ou conteúdo ilícito enquanto é indexado (até mesmo classificado) ou (ii) expõe inadvertidamente informações privadas que o gigante das buscas então indexa.

A maneira mais rápida de ocultar URLs dos pesquisadores é por meio da ferramenta de remoção de URL do Google na seção “Indexação” do Search Console. Lá, você pode remover um único URL ou uma categoria inteira.

Na minha experiência, o Google processa essas solicitações rapidamente, mas não as desindexa permanentemente. Em vez disso, oculta os URLs dos resultados da pesquisa por cerca de seis meses.

A ferramenta do Search Console remove URLs dos resultados da pesquisa por “cerca de seis meses”. Clique na imagem para ampliar.

Um recurso semelhante nas Ferramentas do Google para webmasters, chamado “Bloquear URLs”, oculta páginas de Pesquisa do Bing por aproximadamente 90 dias.

Captura de tela da caixa de diálogo “Adicionar URL ao bloco” das Ferramentas do Google para webmasters. O formulário permite a entrada de uma URL e a seleção de opções de página ou diretório e tipo de bloco (URL e Cache ou somente Cache). Uma nota na parte inferior informa que o bloqueio permanecerá em vigor por no máximo 90 dias.

“Bloquear URLs” nas Ferramentas do Google para webmasters oculta páginas da pesquisa do Bing por aproximadamente 90 dias. Clique na imagem para ampliar.

Permanente

Várias opções de remoção URLs permanentemente do índice do Google.

Exclua a página do seu site

Excluir uma página do seu servidor web irá desindexá-la permanentemente. Após a exclusão, configure um 410 Código de status HTTP de “desaparecido” em vez de 404 “não encontrado”. Aguarde alguns dias para que o Google rastreie novamente o site, descubra o código 410 e remova a página de seu índice.

Observe que o Google desencoraja o uso de redirecionamentos para remover páginas de baixo valor, pois a prática envia sinais ruins ao sucessor.

À parte, o Google fornece um formulário para remover informações pessoais dos resultados da pesquisa.

Adicione o sem índice marcação

Os mecanismos de pesquisa quase sempre honram o sem índice metatag. Os bots de pesquisa rastrearão um sem índice página, mas não a incluirá nos resultados da pesquisa.

Na minha experiência, o Google reconhecerá imediatamente um sem índice meta tag depois de rastrear a página. Observe que a tag remove a página dos resultados da pesquisa, não o site. A página permanece acessível através de outros links, internos e externos.

Uma tag noindex provavelmente não removerá a página de LLMs como ChatGPT, Claude e Perplexity, já que essas plataformas nem sempre honram sem índice tags ou até mesmo exclusões de robots.txt. Excluir páginas do seu site é a tática de remoção infalível.

Proteger por senha

Considere adicionar uma senha a uma página publicada para evitar que ela se torne acessível publicamente. O Google não pode rastrear páginas que exijam senhas ou nomes de usuário.

Adicionar uma senha não removerá uma página indexada. UM sem índice tag irá, no entanto.

Remover links internos

Remova todos os links internos para páginas que você não deseja indexar. E não crie links para páginas protegidas por senha ou excluídas; ambos prejudicam a experiência do usuário. Sempre concentre-se nos visitantes humanos – não apenas nos mecanismos de pesquisa.

Robôs.txt

Os arquivos Robots.txt podem impedir que o Google (e outros bots) rastreando uma página (ou categoria). Páginas bloqueadas via robots.txt ainda poderia ser indexado e classificado se incluído em um mapa do site ou vinculado de outra forma. O Google não encontrará um sem índice tag em páginas bloqueadas, pois não pode rastreá-las.

Um arquivo robots.txt pode instruir os rastreadores da web a ignorar, por exemplo, páginas de login, arquivos pessoais ou páginas resultantes de classificações e filtros exclusivos. Preserve o tempo de rastreamento dos bots de pesquisa nas partes que você deseja classificar.

Publicar comentário