Ici & Là

01 Société 02 Histoire 03 Science 04 Science fiction 05 SPIP 06 NTIC 07 Sondages 08 Divers
La meilleure façon de réaliser ses rêves est de se réveiller (Paul Valéry)

Accueil > NTIC > Sites statiques - dynamiques > L’aspirateur de sites Web HTTrack

Très puissant, libre (GNU GPL) et gratuit

L’aspirateur de sites Web HTTrack

Pour novices et experts

jeudi 29 octobre 2020, par François Daniel Giezendanner

Notez cet article
2 votes

HTTrack est un aspirateur de sites web très puissant, libre (GNU GPL) et gratuit. Très simple d’utilisation, son assistant guidera pas à pas les novices pour paramétrer l’aspiration automatique d’un site Web statique ou dynamique. Il permet à l’utilisateur de télécharger un site web d’Internet vers son disque dur, en construisant récursivement tous les répertoires, récupérant html, images et fichiers du serveur vers son ordinateur, créant ainsi un site statique. Les plus expérimentés seront comblés grâce aux nombreuses options de configuration de HTTrack qui en font un outil de pointe ne déméritant pas au regard de ce que proposent ses concurrents. Après une présentation succincte des principes et fonctionnalités de HTTrack nous donnons une liste non exhaustive de tutoriels pour le maitriser à divers niveaux de compétence.

 Préambule

HTTrack est un aspirateur de sites web très puissant, facile d’utilisation, libre (GNU GPL) et gratuit :

 HTTrack pour les novices

Très simple d’utilisation, son assistant guidera pas à pas les novices pour paramétrer l’aspiration d’un site Web statique ou dynamique. HTTrack est un robot d’exploration et d’indexation Web qui parcourt systématiquement le site à aspirer. Il utilise une technique proche de celle des moteurs de recherche. Il permet à l’utilisateur de télécharger un site web d’Internet vers son disque dur, en construisant récursivement tous les répertoires, récupérant html, images et fichiers du serveur vers son ordinateur, créant ainsi un site statique. HTTrack réorganise la structure des liens en relatif de façon à ce que tous les liens se réfèrent à la copie locale. On ouvre simplement une page du site « aspiré » dans son navigateur, et l’on peut naviguer librement à l’intérieur, comme si on était connecté.

 HTTrack pour les experts

Les plus expérimentés seront comblés grâce aux nombreuses options de configuration de HTTrack qui en font un outil de pointe ne déméritant pas au regard de ce que proposent ses concurrents : il est possible de demander le téléchargement de l’intégralité d’un site, ou seulement d’un certain nombre de niveaux de profondeur des pages dans l’arborescence, de filtrer les éléments à ramener (choix du type de fichier à télécharger et de leur taille maximale) : pages, images, animations, vidéo, musique, et même de limiter le poids total du site en fixant un seuil à ne pas dépasser. On peut choisir le nombre de téléchargements simultanés, la mise à jour d’un site existant (seules les pages modifiées sont téléchargées) ou continuer un téléchargement interrompu. Le robot est entièrement configurable, avec un système d’aide intégré.

Concernant la connexion multiple pour les téléchargements simultanés : par défaut on a 8 connexions pour augmenter la vitesse, le logiciel se connecte en simultané à plusieurs pages Internet pour en télécharger plusieurs en même temps, afin de ne pas être retardé si l’une des pages est difficile à télécharger.

De plus, HTTrack a été programmé pour fonctionner avec les sites dynamiques (CGI, PHP, ASP, Javascript, ...). Un must à posséder absolument !

 Relevons encore :

- Une interface multi-langues : l’aspirateur de site est disponible en 25 langues dont le français.
- Une option d’utilisation des miroirs afin de permettre la copie exacte d’un site Internet.
- Une compression http pour réduire la taille du site.
- Lorsque l’on aspire un site, si le processus d’aspiration est interrompu, Httrack propose de consulter un fichier d’erreur.
- HTTrack existe en plusieurs versions. WinHTTrack est la version Windows (de Windows 2000 à Windows 10 et au delà) de HTTrack, WebHTTrack la version pour Linux/OSX/BSD/Unix version sources et HTTrack (Android) la version pour Android (>= 2.2) via Google Play.

Nombreux sont ceux qui ont écrit un tutoriel pour utiliser HTTrack à divers niveaux de compétence. La bibliographie ci-dessous en donne une liste non exhaustive.

 Principales fonctionnalités de HTTrack

Voici la liste descriptive des fonctionnalités de HTTrack présentée sur le site officiel https://www.httrack.com :

  1. Versions disponibles pour Windows, Linux, Sun Solaris, et autres systèmes Unix ainsi que pour Android. (D’autres plate-formes pourraient être ajoutées prochainement).
  2. Interface multi-langues sous Windows et Linux/Unix (English, Français, Castellano, Deutsch, Nederlands, Polski, Português, Italiano, Kréyòl Matinik, Magyar, Brazilian, Simplified Chinese, Traditional Chinese, Danish, Estonian, Swedish, Turkish, Macedonian, Japanese, Slovak, Czech, Ukrainien, Norvégien, Slovène, Roumain, Grec).
  3. Logiciel libre (GPL) et gratuit (sources fournies).
  4. Miroir d’un ou plusieurs sites ensembles (avec des liens partagés).
  5. Niveau de récursion paramétrable.
  6. Mise à jour rapide (update) d’un miroir et possibilité de continuer un transfert interrompu (rupture de connexion, crash, etc.).
  7. Filtres selon le type, la position du lien, la profondeur, la taille des fichiers, la taille du site, possibilité d’accepter ou de refuser certains sites ou fichiers (avec jokers évolués).
  8. Gestion du timeout et du taux de transfert minimum pour passer les sites les plus lents.
  9. Wizard permettant de choisir quels liens doivent être transférés (accepter/refuser : lien, tout le domaine, le répertoire tout entier).
  10. Connexions multiples (par défaut : 4 connexions) pour augmenter la vitesse.
  11. Compression HTTP (gzip..).
  12. Gestion de proxy pour améliorer les performances, avec authentification possible.
  13. Reprise du chargement des fichiers partiellement transmis (HTTP/1.1).
  14. Noms de fichiers avec structure originale préservée ou mode séparé (un répertoire pour les html, un autre pour les images), gestion des noms courts dos optionnel et structure définie par l’utilisateur.
  15. Switch automatique pour les erreurs « Moved ».
  16. Parcours HTML avec analyse des tags, ainsi que du code javascript/HTML généré.
  17. Parcours basique des fichiers java et Flash.
  18. Cache DNS intégré.
  19. Supporte https et ipv6 natifs.
  20. Fichier log optionnel avec erreurs et commentaires.
  21. Chemin définissable pour le miroir et les fichiers log.
  22. Fonctionne en ligne de commande, ou via un shell pour une utilisation privée (capture) ou professionnelle (miroir on-line).

 Toutes les fonctionnalités de HTTrack

HTTrack est doté d’un très grand nombre de fonctionnalités dont on trouvera une description détaillée dans les documents suivants :

  • HTTrack Help
    http://httrack.kauler.com/help/Home
    Contents :
    • Issues concerning a mirror
      • Authentication
      • Files & filetypes
      • Filters (scan rules)
      • General
      • URLs
    • WinHTTrack & WebHTTrack interfaces
    • Specific solutions
    • Advanced
    • Information

 Développement

Le projet HTTrack a été développé par :

  • Xavier Roche (xroche chez httrack dot com) chef de projet, pour le moteur principal, l’interface graphique Windows/Linux et la maintenance pour v2.0 et v3.0.
  • Yann Philippot (yphilippot chez lemel dot fr) pour le parseur binaire .Classes Java.

Avec l’aide de :

  • Leto Kauler (molotov sur tasmail.com) pour la conception du site / des logos <http://kauler.com/> .
  • Christian Marillat (marillat.christian at wanadoo.fr) pour la conformité autoconf et le package .deb.
  • Nicolas Benoit (nbenoit sur tuxfamily.org), SDP Multimedia et Major MMS pour les routines principales du plugin mms (MMSRIP) <http://nbenoit.tuxfamily.org/> .
  • Jean-loup Gailly de gzip.org pour l’aide fournie avec Zlib <http://www.zlib.net/> .
  • Eric A. Young (eay sur cryptsoft.com) pour le matériel cryptographique SSL (OpenSSL) <http://www.openssl.org/> .
  • Fred Cohen (fc sur all.net) pour le guide de l’utilisateur HTTrack <http://all.net/> .
  • Arnaud pour des conseils de conception Android.

Traductions rédigées par :

  • David Lawrie (dalawrie at lineone dot net)m et Robert Lagadec (rlagadec at yahoo dot fr) pour vérifier les traductions anglaises et françaises.
  • Juan Pablo Barrio Lera (Université de León) pour les traductions en espagnol.
  • Etc.

 FAQ HTTrack

  • Captures de sites, problèmes rencontrés lors d’une aspiration de site
    http://danzcontrib2.free.fr/captures.php
    En général, les options par défaut de WinHTTrack et des autres aspirateurs permettent de réussir une capture, mais parfois le résultat n’est pas satisfaisant.
    Si la difficulté que vous rencontrez n’est pas traitée ci-dessous, consultez la FAQ en anglais.

 Télécharger HTTrack

Télécharger HTTrack Website Copier 32 bits | 64 bits (gratuit)
Section téléchargement : http://www.httrack.com/page/2/fr/index.html
Editeur : Xavier Roche.

  • Windows XP Windows Vista Windows 2000 Windows 7 Windows 8 Windows 10.
  • Linux/OSX/BSD/Unix version sources WebHTTrack.
  • Android (>= 2.2) via Google Play, HTTrack (Android).
  • Les versions 64 bits, portable, Linux et Mac OS X sont disponibles.

Distributions Linux :
Paquet Debian, Paquet Ubuntu, Paquet Gentoo, Paquet RPM (RedHat & Suse), Paquet OSX (MacPorts), Paquet OSX (Homebrew), Paquet Fedora, Paquet FreeBSD i386.

 BIBLIOGRAPHIE

 Documentation

  • Xavier Roche - Senior Software Engineer - Algolia | LinkedIn
    https://fr.linkedin.com/in/xroche
    Paris Area, France
    Moving forward to new adventures !
    Project Leader : HTTrack
    HTTrack Website Copier project leader. HTTrack (http://www.httrack.com/) is an offline browser utility, allowing you to download a World Wide website from the Internet to a local directory, building recursively all directories, getting html, images, and other files from the server to your computer.
    • Free software (GPL), multi-platforms (Windows, POSIX, Android, ...).
    • Integrated GUI (Windows/Linux/Android) and commandline/batch.
    • Multiple connections, updates, reget, IPv6, compression, HTTPS.
    • Hundreds of options/tuning.
  • HTTrack Help
    http://httrack.kauler.com/help/Home
    Contents :
    • Issues concerning a mirror
      • Authentication
      • Files & filetypes
      • Filters (scan rules)
      • General
      • URLs
    • WinHTTrack & WebHTTrack interfaces
    • Specific solutions
    • Advanced
    • Information
  • About this project : Informations on this project :
    https://www.httrack.com/html/contact.html
    This project has been developed by :
    • Xavier Roche (xroche at httrack dot com) for the main engine and Windows interface and maintainer for v2.0 and v3.0.
    • Yann Philippot (yphilippot at lemel dot fr) for the java binary dot class parser.
    • David Lawrie (dalawrie at lineone dot net).
    • Robert Lagadec (rlagadec at yahoo dot fr) for checking both English & French translations.
    • Juan Pablo Barrio Lera (University of León) for Spanish translations.
    • etc.
  • Chocolatey Software | HTTrack 3.49.2
    Last Update : 20 May 2017
    https://chocolatey.org/packages/httrack
    • install HTTrack
    • Description
    • Files
    • Version History
    • Dependencies
    • Discussion for the HTTrack Package

 Tutoriels

  • HTTrack Website Copier - How to start, Step-by-step
    Quick start with WinHTTrack/WebHTTrack
    Tutoriel détaillé créé par httrack.com
    http://www.httrack.com/html/step.html
    • Step 1 : Choose a project name and destination folder
    • Step 2 : Fill the addresses
    • Step 3 : Ready to start
    • Step 4 : Wait !
    • Step 5 : Check the result
    • Option panel
  • Capturer des sites avec WinHttrack. Tutoriel en 15 pages.
    Auteur : Dan, novembre 2002
    https://archive.framalibre.org
    • 1. Introduction
    • 2. Une capture facile
      • Options
      • Limiter la taille de la capture
    • 3. Compléter une capture
      • Trouver les noms et extensions des fichiers manquants
      • Ajouter des liens
    • 4. Ça se complique
      • Les applets java (niveau 1)
        • Les accessoires MSIE5
        • Utiliser le cache de MSIE
      • Les fichiers Flash
      • Les applets java (niveau 2)
    • 5. Conclusion
  • Aspirez des sites web avec HTTRACK
    Club Informatique des Clayes-sous-Bois
    https://www.club-informatique-clayes-sous-bois.fr
    Tutoriel en 5 chapitres
    • 1 - Installation et lancement de HTTRACK
    • 2 – Reprendre l’aspiration d’un site
    • 3 – Consulter un site aspiré
    • 4 – Récupérer des fichiers du site aspiré
    • 5– Paramétrages de Httrack
      • 5.1– Règles de filtrage
      • 5.2– Limites de capture
      • 5.3– Autres réglages des autres onglets
      • 5.4– Autres réglages
  • Aspirer un site entier
    15/01/2009 à 07h00
    https://www.01net.com
    Tutoriel en 6 chapitres
    • Installez HTTrack
    • Démarrez une capture de site
    • Définissez l’étendue des pages récupérer
    • Lancez la capture
    • Naviguez hors connexion sur le site téléchargé
    • Mettez le site à jour
  • L’aspirateur de site HTTrack
    https://sites.google.com
    Tutoriel en 5 étapes
    • Étape 1 : Choisissez un nom de projet et le dossier de destination
    • Étape 2 : Remplissez les adresses
    • Étape 3 : Prêt à démarrer
    • Etape 4 : Attendez !
    • Étape 5 : Vérifiez le résultat
    • Panneau d’option
  • HTTrack Manual (16 pages)
    http://www.netlab.dk
    • 1. Introduction
    • 2. Installation
      • 2.1 Mac OS X
      • 2.2 Windows
    • 3. Archiving
      • 3.1 Mac OS X
      • 3.2 Windows
    • 4. Displaying archived material
      • 4.1 Mac OS X
      • 4.2 Windows
    • 5. Uninstalling
      • 5.1 Mac OS X
      • 5.2 Windows
  • **TUTO** HTTrack en Français - aspirateur de site/blog
    Un tuto en Français qui explique comment se servir, de façon basique, de HTTrack ! Suivez les images, c’est simple !
    Par Peter Petrelli, cyber blogueur, 16/09/2009
    http://forum.canalblog.com
  • Aspirer un site SPIP avec HTTRACK
    https://contrib.spip.net
    Sous ubuntu en mode console
    17 décembre 2008 – par Bredren
    Mode d’emploi
    • SOMMAIRE
    • Installer Httrack
    • Aspiration du site
  • CONSULTATION DU SITE SANS CONNECTION INTERNET
    Tutoriel
    Quand on est en croisière, il n’est pas toujours possible de se connecter à internet, ou alors les connections WiFi mises à disposition n’ont pas toujours le débit suffisant pour naviguer sereinement sur un site internet. On emmène le site complet !
    http://www.viaggiitalia.fr
  • Téléchargement gratuit de HTTRack Website Copier
    Publié par GetIntoPC sur octobre 7, 2017
    https://agetintopc.com
    Contenus du Tutoriel :
    • Présentation du copieur de site Web HTTRack
    • Caractéristiques du copieur de site Web HTTRack :
    • Détails de la configuration technique du copieur de site Web HTTRack
    • Configuration requise pour le copieur de site Web HTTRack
    • Téléchargement gratuit de HTTRack Website Copier
  • How to Download Offline Version of Any Website
    Tutoriel de Niveau débutant.
    Written by Soufiane Sabiri. Last updated mai 2020.
    https://www.easytutorial.com
  • Comment cloner un site web avec HTTrack - TUTORIELS
    AUTEUR:ADMININFO.INFO DATE DE PUBLICATION:OCTOBER/2020
    https://fr.admininfo.info
  • Copier un site internet avec un aspirateur de sites Web ? Black Hat SEO
    12 juin, publié par Nicolaseo
    Utiliser HTTrack Website Copier. Tutoriel simple.
    https://www.black-hat-seo.org
  • Comment configurer HTTrack pour un site Web avec protection par mot de passe.
    Tutoriel détaillé créé par jdfineart
    http://www.jdfineart.com

 Présentation simple de HTTrack

  • L’aspirateur de site HTTRack
    http://annexes.iut2.upmf-grenoble.fr
    Description détaillée en 2 chapitres et 7 paragraphes
    • Introduction
    • 1. Les aspirateurs de sites
      • 1.1 Les fonctionnalités
      • 1.2 Avantages et inconvénients
    • 2. L’aspirateur de site Httrack
      • 2.1 Présentation
      • 2.2 Description
      • 2.3 Les points forts et les points faibles
      • 2.4 L’avis des utilisateurs
      • 2.5 Httrack un logiciel moderne et dynamique
    • 3. Conclusion
    • 4. Sitographie
  • Télécharger HTTrack pour Windows : téléchargement gratuit !
    Oubliez tous les autres, HTTrack fait aussi bien, sans installation et pour pas un rond !
    https://www.clubic.com
  • HTTrack. Avis utilisateurs : ils ont téléchargé HTTrack
    Auteur/éditeur : Xavier Roche & Yann Philippot
    https://www.01net.com