Aller au contenu
  • Pas encore inscrit ?

    Pourquoi ne pas vous inscrire ? C'est simple, rapide et gratuit.
    Pour en savoir plus, lisez Les avantages de l'inscription... et la Charte de Zébulon.
    De plus, les messages que vous postez en tant qu'invité restent invisibles tant qu'un modérateur ne les a pas validés. Inscrivez-vous, ce sera un gain de temps pour tout le monde, vous, les helpeurs et les modérateurs ! :wink:

Batch pour accéder à un site web


Messages recommandés

Posté(e) (modifié)

bonjour,

Je peux lancer un batch à partir d'un fichier de commande (cmd)

Que dois-je mettre dedans pour télécharger, sous format texte, la page d'accueil d'un site tel que la page télé-loisir du programme de ce soir, sans que l’accès me soit interdit (cas du powershell par exemple et bien d'autres méthodes) ?

Modifié par Phoe
  • Tonton a modifié le titre en Batch pour accéder à un site web

Posté(e)

Salut !

Quand je veux récupérer le contenu d'un site, je suis plus Python + requests et je n'ai pas wget d'installer sur mon Windows pour tester.

Mais logiquement un wget sur un site en php devrait récupérer le code html généré par le code php non ?

Phoe, qu'est ce que tu veux dire par "sans que l’accès me soit interdit" ?

Posté(e)

Oui, il faudra expliciter cette partie du message, car même en powershell, la récupération (simple) de page web fonctionne  :

powershell Invoke-WebRequest -Uri "URL_A_RECUPERER" -OutFile "CHEMIN_DU_FICHIER_DEST"

ou avec wget ou curl  ou ... :)

 

Peut-être un souci d'authent. ou de cookie ?

Posté(e) (modifié)

"sous format texte" est également sujet à interprétation...

L'HTML récupéré est un format texte...

Mais si c'est vraiment le contenu texte (sans la mise en page, ...) qui est recherché, le plus simple serait de passer par le service https://www.w3.org/services/html2txt

.... qui peut être scripté de la même façon avec wget/curl/powershell : https://www.w3.org/services/html2txt?url=URL_A_RECUPERER

Par exemple, avec le lien de Kana-chan: https://www.w3.org/services/html2txt?url=https%3A%2F%2Fwww.tnt-programme.com%2Findex.php

voir https://www.w3.org/services/html2txt pour les différentes options/paramètres lors de la soumission du formulaire

 

Modifié par JWhy
  • Modérateurs
Posté(e)

Bonjour à tous,

Je confirme que la méthode powershell  fonctionne parfaitement pour la page Programme TV de ce soir de Télé-Loisirs, rendant le code HTML de cette page dans un fichier texte.

powershell Invoke-WebRequest -Uri "https://www.programme-tv.net/programme/toutes-les-chaines/" -OutFile "PageHTML.txt"

Comme l'indique fort justement Kana-chan, on récupère ainsi le code HTML de la page affichée, et non pas le code (en général en PHP) de constitution dynamique de cette page à partir de la base de données du site. Néanmoins, la demande étant d'obtenir le programme du jour (et non pas la façon de le construire), cette requête répond à la question posée. Il restera bien entendu à interpréter le code HTML pour obtenir en clair la quintessence du programme ! :wink:

Rejoindre la conversation

Vous publiez en tant qu’invité. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.
Remarque : votre message nécessitera l’approbation d’un modérateur avant de pouvoir être visible.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

  • En ligne récemment   0 membre est en ligne

    • Aucun utilisateur enregistré regarde cette page.
×
×
  • Créer...