Outil SEO Python : Vérification des Codes de Statut des URLs
Un outil indispensable pour les experts SEO
En tant qu’experts en référencement (SEO), nous savons tous que surveiller le statut des URLs de notre site est essentiel pour maintenir un classement élevé sur les moteurs de recherche. Une redirection incorrecte, une erreur 404 ou tout autre problème lié au statut peut avoir un impact négatif sur la visibilité de notre site web. C’est pourquoi nous avons développé un outil simple et puissant en Python pour vérifier les codes de statut des URLs répertoriées dans un fichier au format TXT, tout en générant un fichier CSV détaillé pour faciliter l’analyse des résultats.
Installation des dépendances à partir du fichier requirements.txt
Nous utilisons des bibliothèques tierces pour notre projet, et il est essentiel de les installer dans notre environnement virtuel. Pour cela, nous avons préparé un fichier requirements.txt
contenant toutes les dépendances nécessaires. Voici comment les installer :
1- Assurez-vous que votre environnement virtuel est activé.
2- Utilisez la commande suivante pour installer les dépendances à partir du fichier requirements.txt
:
`pip install -r requirements.txt`
Cela installera automatiquement toutes les bibliothèques requises pour exécuter le script.
Le code Python pour vérifier les codes de statut
Voici le code Python qui vous permettra de réaliser cette tâche en un rien de temps :
import requests
import csv
from tqdm import tqdm
# Lire les URLs à partir du fichier 'input.txt'
with open('input.txt', 'r') as f:
urls = [line.strip() for line in f]
# Obtenir les codes de statut
results = []
# Utiliser tqdm comme itérateur pour suivre la progression
for url in tqdm(urls, desc="Traitement des URLs", unit="URL"):
try:
response = requests.get(url)
results.append((url, response.status_code))
except requests.exceptions.RequestException as e:
results.append((url, str(e)))
# Écrire les résultats dans le fichier 'output.csv'
with open('output.csv', 'w', newline='') as f:
writer = csv.writer(f)
writer.writerow(['URL', 'Code de statut'])
writer.writerows(results)
Comment le script fonctionne ?
Ce script Python utilise les bibliothèques suivantes pour accomplir sa tâche :
1- requests
: Une bibliothèque Python pour envoyer des requêtes HTTP. C’est grâce à elle que nous récupérons le code de statut de chaque URL.
2- csv
: Une bibliothèque Python pour lire et écrire des fichiers CSV. Elle nous permet de stocker les résultats de manière organisée dans un fichier.
3- tqdm
: Une bibliothèque Python pour afficher une barre de progression lors du traitement des URLs. Cela vous permettra de suivre facilement l’avancement de la vérification.
Utilisation du script
1- Assurez-vous d’avoir Python installé sur votre système.
2- Placez les URLs que vous souhaitez vérifier dans un fichier texte au format TXT, nommé “input.txt”. Chaque URL doit être sur une ligne séparée.
3- Copiez le code Python ci-dessus dans un fichier Python, par exemple, “url_checker.py”.
4- Ouvrez une invite de commande ou un terminal et exécutez le script en tapant la commande suivante :
`python url_checker.py`
Le script commencera à vérifier les codes de statut pour chaque URL et affichera une barre de progression pour vous informer de l'avancement.
5- Une fois le traitement terminé, le script générera un fichier CSV appelé “output.csv” qui contiendra les URLs et leurs codes de statut respectifs.
Analyser les résultats
Le fichier CSV “output.csv” contiendra deux colonnes : “URL” et “Code de statut”. Vous pourrez facilement l’ouvrir dans n’importe quel tableur, tel que Microsoft Excel ou Google Sheets, pour examiner les résultats.
En résumé, ce script Python vous permettra de gagner du temps précieux en vérifiant automatiquement les codes de statut des URLs. Vous pourrez ainsi détecter rapidement et résoudre tout problème éventuel, améliorant ainsi le classement de votre site sur les moteurs de recherche.
N’hésitez pas à utiliser cet outil régulièrement pour maintenir la santé de votre site et offrir une meilleure expérience utilisateur.
Alors, lancez-vous dès maintenant et optimisez votre stratégie SEO avec cet outil simple et puissant !
Note: Assurez-vous de garder une sauvegarde de vos URLs d’origine avant d’utiliser cet outil, afin d’éviter toute perte de données.
Code disponible ici 😉
Tags:
Python SEO