Extraire le contenu du site Web à l'aide de l'API Scraping avec PHP





 L'API Web Scraping permet aux développeurs d'utiliser un format structuré pour supprimer les données du site Web. Renvoie les données en temps réel du site Web en fonction de l'URL de la page Web définie dans les paramètres de l'API. L'API Web Scraping est très utile pour extraire le contenu de la source HTML des pages Web.

Diverses API de grattage Web pour extraire les informations sur le site Web sont disponibles. Parmi celles-ci, Scrapestack est l'une des meilleures API gratuites de grattage Web. Scrapestack fournit une API REST conviviale qui collecte des informations à partir d'un site Web avec des cadres IP, CAPTCHA ou des géolocalisations sans programmation ni contrainte. Nous allons vous montrer comment intégrer l'API Web Scraping à l'API REST Scrapestack de PHP dans ce didacticiel.

Pour intégrer l'API Web Scraping à scrapestack en PHP, suivez les étapes simples ci-dessous.


Commencer à obtenir la clé d'accès à l'API Scrapstack

  • Créer un compte sur  scrapestack .
  • Dans le tableau de bord, vous obtiendrez la clé API sous  Your API Access Key .

scrapestack-API

Configuration de l'API Scrapestack

La clé d'accès est requise pour s'authentifier et accéder à l'API scrapestack

Après une requête API réussie, le contenu de la page Web sera renvoyé dans un format structuré.

Cryptage HTTPS 256 bits

Pour sécuriser les demandes d'API, utilisez le chiffrement HTTPS (SSL) en appelant l'URL de l'API commençant par  https.

Codes d'erreur de l'API

Si votre requête échoue, l'API scrapestack renverra une erreur au format JSON. Trouvez ci-dessous un exemple d'erreur qui se produit lorsque l'API n'a pas récupéré l'URL demandée.

Erreurs d'API courantes :

CODETAPERINFO
404404_not_foundL'utilisateur a demandé une ressource qui n'existe pas.
101missing_access_keyL'utilisateur n'a pas fourni de clé d'accès.
101invalid_access_keyL'utilisateur a fourni une clé d'accès non valide.
102inactive_userLe compte utilisateur est inactif ou bloqué.
103invalid_api_functionL'utilisateur a demandé une fonction API inexistante.
104usage_limit_reachedL'utilisateur a atteint le quota mensuel de demandes de son abonnement.
105function_access_restrictedL'abonnement actuel de l'utilisateur ne prend pas en charge cette fonction API.
105https_access_restrictedLe plan d'abonnement actuel de l'utilisateur ne prend pas en charge HTTPS.
210missing_urlL'utilisateur n'a pas spécifié d'URL valide à récupérer.
211invalid_urlL'utilisateur a spécifié une valeur non valide dans le paramètre URL.
212invalid_proxy_locationL'utilisateur a spécifié un emplacement proxy non valide ou non pris en charge.
213scrape_request_failedLa demande de scraping actuelle a échoué en raison d'un problème technique. Si cette erreur se produit, veuillez le signaler au service client technique.

Exemple de code - Script PHP pour récupérer le contenu du site Web via l'API scrapestack

Vous trouverez ci-dessous le code complet pour extraire le contenu de la page Web à l'aide de PHP.


Conclusion

L'API scrapestack est gratuite et des plans premium pour des utilisations avancées sont également disponibles. Nous avons utilisé certains paramètres requis pour appeler l'API Web Scraping dans l'exemple de code. Il existe plusieurs options de configuration disponibles dans l'API scrapestack, qui peuvent être utilisées pour personnaliser les données de grattage. Consultez la documentation de l' API scrapestack pour une référence complète.

Enregistrer un commentaire

Post a Comment (0)

Plus récente Plus ancienne