Advanced SEOTechnical SEO

Aprendizado de máquina acessível para SEOs

Aprendizado de máquina – um ramo da inteligência artificial que estuda o aprimoramento automático de algoritmos de computador – pode parecer muito fora do escopo de seu trabalho de SEO. Palestrante da MozCon (e gênio do SEO) Britney Muller está aqui com uma edição especial do Whiteboard Friday para dizer por que isso não é verdade e para seguir alguns passos para você começar. Você pode acessar o notebook Colab discutido no vídeo aqui . 

Para ver mais sobre aprendizado de máquina de Britney e nossas outras apresentações do MozCon 2020, confira o pacote de vídeos deste ano. 

Aprendizado de máquina acessível

Clique na imagem do quadro branco acima para abrir uma versão em alta resolução em uma nova guia!

Transcrição de Vídeo

Ei, fãs de Moz. Bem-vindo a esta edição especial do Whiteboard Friday. Hoje estamos dando uma espiada no que falei na MozCon 2020 , onde tornei o aprendizado de máquina acessível para SEOs em todos os lugares.

Isso é tão empolgante porque está facilmente ao seu alcance hoje, e vou mostrar exatamente como começar. 

Então, para começar, eu aprendi sobre esse conceito estranho chamado parasitas de cria neste verão, e é fascinante. É basicamente onde um animal engana outro animal da mesma espécie para criar seus filhotes.

É fascinante e, quanto mais eu aprendia sobre isso, mais percebia: meu Deus, sou uma espécie de parasita de ninhada quando se trata de programação e aprendizado de máquina! Eu agarro e encontro esses grandes modelos que fazem todo o trabalho – todo o levantamento – e coloco meus dados e minhas ideias, e eles fazem coisas por mim.

Portanto, vamos usar esse conceito a nosso favor. Na verdade, consegui ensinar a meu pai a maioria desses modelos que, novamente, estão disponíveis para você hoje em uma ferramenta chamada Colab . Deixe-me explicar como é isso. 

Modelos para você começar

Então, para começar, se você quiser começar o aquecimento agora, apenas comece a praticar pressionando “Shift” e depois pressione “Enter”.

Apenas comece a praticar isso agora. É metade da batalha. Você está prestes a lançar alguns modelos muito legais. 

Tudo bem. Quais são alguns exemplos disso? Como é isso? Portanto, alguns dos modelos com os quais você pode brincar hoje são coisas como DeOldify , que é onde você repara e colorir fotos antigas. É muito, muito divertido. 

Outro é um gerador de texto. Eu criei um com GTP-2 – super bobo, é este gerador de desculpas. Você pode manipulá-lo e fazer com que ele faça coisas diferentes por você. 

Há também um modelo de previsão muito, muito bom, em que você basicamente coloca um pedaço de dados de série temporal e ele prevê o que o futuro pode ter reservado. É muito, muito poderoso e divertido.

Você pode resumir o texto, o que é realmente valioso. Pense em meta descrições, todas essas coisas boas. 

Você também pode automatizar o agrupamento de pesquisa de palavras-chave, que mostrarei aqui em um segundo. 

Você pode fazer análises de link interno realmente poderosas, tenha um notebook para isso.

Talvez uma das coisas mais poderosas é que você pode extrair entidades e categorias como o Google as percebe. É uma das minhas APIs favoritas. É por meio da API NLP do Google . Eu coloco em um bloco de notas e você basicamente coloca os URLs dos quais deseja extrair essas informações e pode comparar como seu URL se compara aos concorrentes.

É muito valioso e divertido. 

Mais importante ainda, você não pode quebrar nada disso! 

Não se deixe intimidar por nenhum dos códigos. Muitos desenvolvedores experientes não sabem o que está acontecendo em alguns desses blocos de código. Está bem.

Usando Colab

Podemos jogar neste ambiente. Ele está hospedado no Google Drive e, portanto, não há medo de quebrar qualquer coisa em seu computador ou com seus dados ou qualquer coisa. Então, vamos mergulhar. Como eu disse, isso é feito por meio de uma ferramenta gratuita chamada Colab . 

Você sabe como o Google pegou o Excel e fez o Planilhas Google?

Eles fizeram a mesma coisa com o que é conhecido como Jupyter Notebooks. O Jupyter é instalado localmente no seu computador. É um dos ambientes de notebook mais populares. Mas requer alguma configuração e pode ser um tanto desajeitado. Isso se confunde com diferentes versões e blá, blá. O Google colocou isso na nuvem (configuração zero necessária) e agora está chamando-o de Notebooks Colab. É incrivelmente poderoso.

Então, novamente, é grátis. Ele está disponível para você agora se quiser abri-lo em uma nova guia. Não há configuração zero. O Google também oferece acesso gratuito à computação GPU e TPU, o que é excelente. Tem uma duração de 12 horas. 

Algumas desvantagens são que você pode atingir os limites. Cheguei aos limites e agora estou pagando US $ 9,99 por mês pela versão Pro e não tive problemas.

Mais uma vez, não sou afiliado a nada disso. Estou muito apaixonado por isso, e o fato de eles oferecerem uma versão gratuita é tão emocionante. Já vi muita gente começar nisso. Também é algo a se observar que provavelmente não é tão seguro ou robusto quanto a solução Enterprise do Google. Portanto, se você estiver fazendo isso para uma grande empresa ou se estiver realmente levando a sério, você provavelmente deve verificar algumas outras opções. Mas se você está apenas brincando e quer explorar e se divertir, vamos continuar a festa. 

Usando pandas

Tudo bem. Portanto, novamente, este é um ambiente de notebook hospedado na nuvem. Então, uma coisa que eu realmente quero focar aqui, porque eu acho que é a mais valiosa para SEOs, é essa biblioteca conhecida como ” pandas “.

Pandas é uma biblioteca de análise de dados construída em cima do python. Depois de executar apenas duas linhas de código, você pode carregar um arquivo CSV de seu computador local. Este exemplo bobo é aquele que realmente executei com os dados do Google Search Console.

Então você executa isso em um notebook (Shift + Return). Novamente, estou compartilhando todo este caderno com você hoje. Portanto, basta clicar na primeira célula de texto e começar a executar Shift + Clique para abrir o bloco de notas. Não é tão intimidante quanto parece.


Depois de executar o código acima, faça upload do seu CSV. Depois de carregá-lo, você nomeará seu quadro de dados. 

Após fazer o upload do seu CSV, você verá a saída que indica o seu nome CSV. Copie exatamente como foi carregado e cole na próxima (célula acima) para nomeá-lo.

Nesse caso, o meu era apenas “gsc-example.csv”. Novamente, depois de fazer upload de seu CSV, você verá o nome na saída abaixo da célula de código “from .google.colab import files”. 

Agora, vamos executar algumas linhas simples de código para garantir que seus dados estejam lá corretamente.


Uma primeira verificação comum que as pessoas fazem é “df.head ()”. Isso mostra as primeiras cinco linhas de seu quadro de dados. Você também pode fazer “df.tail ()”, e ele mostra as últimas cinco linhas de seu quadro de dados.

Você pode até colocar um número entre parênteses (por exemplo, df.head (30)) para ver as primeiras 30 linhas. É tão fácil! 

Agora vem a parte realmente divertida, e esta é apenas a ponta do iceberg.

Portanto, você pode executar essa célula de código muito, muito legal aqui para criar uma tabela filtrável. 

O que é poderoso sobre isso, especialmente com os dados do Google Search Console, é que você pode facilmente extrair e explorar palavras-chave que têm uma alta taxa de cliques e uma classificação baixa na pesquisa. É uma das minhas maneiras favoritas de explorar oportunidades de palavras-chave para clientes, e não poderia ser mais fácil.

Portanto, brinque com a visualização filtrável.

Se estiver fazendo pesquisa de palavras-chave, você está tentando agrupar palavras-chave, está tentando organizar tópicos, etc., mas pode organizar mais facilmente suas palavras-chave com o Pandas.

Veja como criar uma nova coluna que indique se uma palavra-chave é ou não ‘Com marca’. 

Então, para orientar você nisso, “df [” Com marca “]” cria uma nova coluna chamada “Com marca”. 

Em seguida, “df.Query.str.contains (” moz | rand | ose “)” usa regex que rotula qualquer consulta com essas palavras-chave como Branded = True. 

Isso torna a filtragem e a exploração muito mais rápidas! Você pode até fazer isso de maneiras em que pode criar uma tabela de quadro de dados totalmente diferente (exemplos disso também estão neste bloco de notas). 

Você pode usar isso e exportar suas palavras-chave para baldes como esse, sem perder tempo. As coisas não congelam como o Excel. Você pode contabilizar erros ortográficos e todos os tipos de coisas boas mais facilmente com expressões regulares. É muito legal.

Conclusão

Novamente, esta é apenas a ponta do iceberg, meus amigos. Estou muito animado para plantar esta semente dentro de todos vocês para que vocês possam voltar e me ensinar o que têm sido capazes de realizar. Acho que temos muito mais a explorar neste espaço. Vai ser muito divertido! Se você gosta disso e quer continuar explorando diferentes modelos, diferentes programas no Colab, sugiro que baixe a extensão Colab do Chrome.

Isso torna a abertura do notebook muito mais fácil. 

Você pode salvar cópias de cadernos que descobrir em sua unidade e brincar com eles o quanto quiser. É muito divertido. Espero que isso tenha gerado alguma inspiração em você, e estou muito animado para ouvir o que todos vocês pensam e criam. -Realmente aprecio você assistir.

Então, muito obrigado. Eu verei todos vocês na próxima vez. Tchau.

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo