Préparer sa liste de mots-clés SEO avec R

P
Formation Data SEO Labs

Comment supprimer les requêtes marques dans un fichier de mots-clés avec R ?

Voici l’une des questions que l’on me pose le plus souvent !

En tant que professionnel du (DATA) SEO, vous avez probablement envie d’automatiser au maximum votre stratégie et c’est exactement ce qu’un langage de programmation comme le R peut vous apporter. Si vous découvrez ce langage, je vous invite à relire mon article sur R et le SEO.

Vous verrez ici 2 façons de nettoyer sa liste de mots-clés SEO :
– Supprimer les mots-clés qui contiennent un terme en particulier
– Supprimer des mots-clés exacts

Je vais vous donner le code pour automatiser ces 2 tâches qui peuvent parfois être chronophages. Vous verrez, rien de très compliqué et un bon gain de temps à la clé !

Supprimer des mots-clés qui contiennent un terme en particulier

Cette manip est très utile pour supprimer les requêtes marques (de votre site ou celles de concurrents) ou encore pour exclure tous les mots-clés qui contiendraient un terme non-représentatif de votre offre (par exemple le terme « gratuit » si la gratuité ne fait pas partie de votre business model).

Pour l’exemple, nous allons utiliser un export des mots clés associés venant de SEMrush (Analyse de mots-clés > Mots clés associés) mais comme vous le savez, la liste de mots-clés peut aussi venir de différentes sources (voir mon article « Utiliser l’API de la Search Console Google avec R« )

#1. Ouvrir le fichier SEMrush
dataset <- read.csv2("drone-phrase_related-fr.csv", sep=",")

#2. Création d'un second dataset qui sera utilisé à l'étape 7
dataset2 <- dataset
preparer mots cles seo avec r
L’export initial comporte 100 lignes

Passons à la création d’une liste de termes à supprimer (appelée ici « competitor_list ») puis lançons la boucle de suppression.
Le script va alors chercher dans notre fichier de mots-clés toutes les lignes qui contiennent un terme de notre « competitor_list » et les supprimer.

#3. Création de la liste de termes à supprimer
competitor_list <- c("parrot", "dji")

#4. Boucle de suppression des mots-clés non-conformes
for (i in 1:length(competitor_list)) {
  word_to_delete <- as.character(competitor_list[i])
  print(paste("Remove rows that contain", word_to_delete),sep="\n")
  dataset <- dataset[!grepl(word_to_delete, dataset$Keyword),]
}

C’est fini pour cette première étape de préparation de votre fichier de mots-clés.

Passons à la suite.

Supprimer des mots-clés exacts

À force de travailler sur le même secteur d’activité, il est probable que vous finissiez par remarquer la présence récurrente de certains termes parasites dans vos données. La fonction suivante permet justement de supprimer les lignes qui contiennent exactement ces termes.

#5. Création de la liste de termes parasites
parasites_list <- c("boulanger drone", "drone leclerc", "drone wikipedia")

Comme pour l’exemple précédent, nous utilisons une boucle for() mais ici avec une petite particularité : la présente d’une REGEX (expréssion régulière)

#6. Boucle de suppression utilisant une REGEX
for (i in 1:length(parasites_list)) {
  word_to_delete <- as.character(paste0("^",parasites_list[i],"$"))
  print(paste("Remove rows that contain", word_to_delete),sep="\n")
  dataset <- dataset[!grepl(word_to_delete, dataset$Keyword),]
}

Pour contrôler ce que nous venons de faire, nous pouvons maintenant afficher les lignes supprimées.

#7. Afficher les lignes supprimées
library(dplyr)
removed_rows <- setdiff(dataset2,dataset)
removed_rows
keywords r seo
Voici les 15 lignes que nous venons de supprimer

Encore plus de script R pour le SEO !

Vous souhaitez accélérer votre apprentissage du langage R ? Je vous invite à regarder du côté des formations Data SEO Labs.

Pour recevoir d’autres scripts R, abonnez-vous à ma newsletter et suivez-moi sur Twitter.

A propos de l'auteur

Rémi Bacha

Passionné de SEO et Data Science. Cofondateur des formations Data SEO Labs.

Ajouter un commentaire

Articles récents

Rémi Bacha

Passionné de SEO et Data Science. Cofondateur des formations Data SEO Labs.

Restons en contact

RDV sur les réseaux sociaux pour discuter et être informé de mes prochains articles :