Accueil > NTIC > Sites statiques - dynamiques > L’aspirateur de sites Web HTTrack
Très puissant, libre (GNU GPL) et gratuit
L’aspirateur de sites Web HTTrack
Pour novices et experts
jeudi 29 octobre 2020, par
Notez cet articleHTTrack est un aspirateur de sites web très puissant, libre (GNU GPL) et gratuit. Très simple d’utilisation, son assistant guidera pas à pas les novices pour paramétrer l’aspiration automatique d’un site Web statique ou dynamique. Il permet à l’utilisateur de télécharger un site web d’Internet vers son disque dur, en construisant récursivement tous les répertoires, récupérant html, images et fichiers du serveur vers son ordinateur, créant ainsi un site statique. Les plus expérimentés seront comblés grâce aux nombreuses options de configuration de HTTrack qui en font un outil de pointe ne déméritant pas au regard de ce que proposent ses concurrents. Après une présentation succincte des principes et fonctionnalités de HTTrack nous donnons une liste non exhaustive de tutoriels pour le maitriser à divers niveaux de compétence.
Préambule
HTTrack est un aspirateur de sites web très puissant, facile d’utilisation, libre (GNU GPL) et gratuit :
- Développé par : Xavier Roche.
- Première version : Mai 1998.
- Dernière version : 3.49-2 (20 mai 2017).
- Dépôt : github.com/xroche/httrack.
- Écrit en : C.
- Système d’exploitation : Microsoft Windows, macOS, Linux, FreeBSD et Android.
- Environnement : Windows, GNU/Linux, Unix/BSD, Android.
- Langues : Multilingue.
- Type : Aspirateur de site web.
- Nom : HTTrack est l’abréviation de HyperTextTRACKer.
- Licence : Licence publique générale GNU version 3.
- Site web : http://www.httrack.com.
- téléchargement : http://www.httrack.com/page/2/fr/index.html
HTTrack pour les novices
Très simple d’utilisation, son assistant guidera pas à pas les novices pour paramétrer l’aspiration d’un site Web statique ou dynamique. HTTrack est un robot d’exploration et d’indexation Web qui parcourt systématiquement le site à aspirer. Il utilise une technique proche de celle des moteurs de recherche. Il permet à l’utilisateur de télécharger un site web d’Internet vers son disque dur, en construisant récursivement tous les répertoires, récupérant html, images et fichiers du serveur vers son ordinateur, créant ainsi un site statique. HTTrack réorganise la structure des liens en relatif de façon à ce que tous les liens se réfèrent à la copie locale. On ouvre simplement une page du site « aspiré » dans son navigateur, et l’on peut naviguer librement à l’intérieur, comme si on était connecté.
HTTrack pour les experts
Les plus expérimentés seront comblés grâce aux nombreuses options de configuration de HTTrack qui en font un outil de pointe ne déméritant pas au regard de ce que proposent ses concurrents : il est possible de demander le téléchargement de l’intégralité d’un site, ou seulement d’un certain nombre de niveaux de profondeur des pages dans l’arborescence, de filtrer les éléments à ramener (choix du type de fichier à télécharger et de leur taille maximale) : pages, images, animations, vidéo, musique, et même de limiter le poids total du site en fixant un seuil à ne pas dépasser. On peut choisir le nombre de téléchargements simultanés, la mise à jour d’un site existant (seules les pages modifiées sont téléchargées) ou continuer un téléchargement interrompu. Le robot est entièrement configurable, avec un système d’aide intégré.
Concernant la connexion multiple pour les téléchargements simultanés : par défaut on a 8 connexions pour augmenter la vitesse, le logiciel se connecte en simultané à plusieurs pages Internet pour en télécharger plusieurs en même temps, afin de ne pas être retardé si l’une des pages est difficile à télécharger.
De plus, HTTrack a été programmé pour fonctionner avec les sites dynamiques (CGI, PHP, ASP, Javascript, ...). Un must à posséder absolument !
Relevons encore :
Une interface multi-langues : l’aspirateur de site est disponible en 25 langues dont le français.
Une option d’utilisation des miroirs afin de permettre la copie exacte d’un site Internet.
Une compression http pour réduire la taille du site.
Lorsque l’on aspire un site, si le processus d’aspiration est interrompu, Httrack propose de consulter un fichier d’erreur.
HTTrack existe en plusieurs versions. WinHTTrack est la version Windows (de Windows 2000 à Windows 10 et au delà) de HTTrack, WebHTTrack la version pour Linux/OSX/BSD/Unix version sources et HTTrack (Android) la version pour Android (>= 2.2) via Google Play.
Nombreux sont ceux qui ont écrit un tutoriel pour utiliser HTTrack à divers niveaux de compétence. La bibliographie ci-dessous en donne une liste non exhaustive.
Principales fonctionnalités de HTTrack
Voici la liste descriptive des fonctionnalités de HTTrack présentée sur le site officiel https://www.httrack.com :
- Versions disponibles pour Windows, Linux, Sun Solaris, et autres systèmes Unix ainsi que pour Android. (D’autres plate-formes pourraient être ajoutées prochainement).
- Interface multi-langues sous Windows et Linux/Unix (English, Français, Castellano, Deutsch, Nederlands, Polski, Português, Italiano, Kréyòl Matinik, Magyar, Brazilian, Simplified Chinese, Traditional Chinese, Danish, Estonian, Swedish, Turkish, Macedonian, Japanese, Slovak, Czech, Ukrainien, Norvégien, Slovène, Roumain, Grec).
- Logiciel libre (GPL) et gratuit (sources fournies).
- Miroir d’un ou plusieurs sites ensembles (avec des liens partagés).
- Niveau de récursion paramétrable.
- Mise à jour rapide (update) d’un miroir et possibilité de continuer un transfert interrompu (rupture de connexion, crash, etc.).
- Filtres selon le type, la position du lien, la profondeur, la taille des fichiers, la taille du site, possibilité d’accepter ou de refuser certains sites ou fichiers (avec jokers évolués).
- Gestion du timeout et du taux de transfert minimum pour passer les sites les plus lents.
- Wizard permettant de choisir quels liens doivent être transférés (accepter/refuser : lien, tout le domaine, le répertoire tout entier).
- Connexions multiples (par défaut : 4 connexions) pour augmenter la vitesse.
- Compression HTTP (gzip..).
- Gestion de proxy pour améliorer les performances, avec authentification possible.
- Reprise du chargement des fichiers partiellement transmis (HTTP/1.1).
- Noms de fichiers avec structure originale préservée ou mode séparé (un répertoire pour les html, un autre pour les images), gestion des noms courts dos optionnel et structure définie par l’utilisateur.
- Switch automatique pour les erreurs « Moved ».
- Parcours HTML avec analyse des tags, ainsi que du code javascript/HTML généré.
- Parcours basique des fichiers java et Flash.
- Cache DNS intégré.
- Supporte https et ipv6 natifs.
- Fichier log optionnel avec erreurs et commentaires.
- Chemin définissable pour le miroir et les fichiers log.
- Fonctionne en ligne de commande, ou via un shell pour une utilisation privée (capture) ou professionnelle (miroir on-line).
Toutes les fonctionnalités de HTTrack
HTTrack est doté d’un très grand nombre de fonctionnalités dont on trouvera une description détaillée dans les documents suivants :
- Httrack Users Guide
https://www.httrack.com/html/fcguide.html
- HTTrack Help
http://httrack.kauler.com/help/Home
Contents :- Issues concerning a mirror
- Authentication
- Files & filetypes
- Filters (scan rules)
- General
- URLs
- WinHTTrack & WebHTTrack interfaces
- Specific solutions
- Advanced
- Information
- Issues concerning a mirror
Développement
- Credits et auteurs - HTTrack Website Copier
https://www.httrack.com/page/6/fr/index.html
Le projet HTTrack a été développé par :
- Xavier Roche (xroche chez httrack dot com) chef de projet, pour le moteur principal, l’interface graphique Windows/Linux et la maintenance pour v2.0 et v3.0.
- Yann Philippot (yphilippot chez lemel dot fr) pour le parseur binaire .Classes Java.
Avec l’aide de :
- Leto Kauler (molotov sur tasmail.com) pour la conception du site / des logos <http://kauler.com/> .
- Christian Marillat (marillat.christian at wanadoo.fr) pour la conformité autoconf et le package .deb.
- Nicolas Benoit (nbenoit sur tuxfamily.org), SDP Multimedia et Major MMS pour les routines principales du plugin mms (MMSRIP) <http://nbenoit.tuxfamily.org/> .
- Jean-loup Gailly de gzip.org pour l’aide fournie avec Zlib <http://www.zlib.net/> .
- Eric A. Young (eay sur cryptsoft.com) pour le matériel cryptographique SSL (OpenSSL) <http://www.openssl.org/> .
- Fred Cohen (fc sur all.net) pour le guide de l’utilisateur HTTrack <http://all.net/> .
- Arnaud pour des conseils de conception Android.
Traductions rédigées par :
- David Lawrie (dalawrie at lineone dot net)m et Robert Lagadec (rlagadec at yahoo dot fr) pour vérifier les traductions anglaises et françaises.
- Juan Pablo Barrio Lera (Université de León) pour les traductions en espagnol.
- Etc.
FAQ HTTrack
- FAQ-1 HTTrack
https://www.malasuk.com/doc/httrack/html/faq.html
- FAQ-2 HTTrack
http://httrack.kauler.com/help/Home
- Captures de sites, problèmes rencontrés lors d’une aspiration de site
http://danzcontrib2.free.fr/captures.php
En général, les options par défaut de WinHTTrack et des autres aspirateurs permettent de réussir une capture, mais parfois le résultat n’est pas satisfaisant.
Si la difficulté que vous rencontrez n’est pas traitée ci-dessous, consultez la FAQ en anglais.
Télécharger HTTrack
Télécharger HTTrack Website Copier 32 bits | 64 bits (gratuit)
Section téléchargement : http://www.httrack.com/page/2/fr/index.html
Editeur : Xavier Roche.
- Windows XP Windows Vista Windows 2000 Windows 7 Windows 8 Windows 10.
- Linux/OSX/BSD/Unix version sources WebHTTrack.
- Android (>= 2.2) via Google Play, HTTrack (Android).
- Les versions 64 bits, portable, Linux et Mac OS X sont disponibles.
Distributions Linux :
Paquet Debian, Paquet Ubuntu, Paquet Gentoo, Paquet RPM (RedHat & Suse), Paquet OSX (MacPorts), Paquet OSX (Homebrew), Paquet Fedora, Paquet FreeBSD i386.
BIBLIOGRAPHIE
Documentation
- Xavier Roche - Senior Software Engineer - Algolia | LinkedIn
https://fr.linkedin.com/in/xroche
Paris Area, France
Moving forward to new adventures !
Project Leader : HTTrack
HTTrack Website Copier project leader. HTTrack (http://www.httrack.com/) is an offline browser utility, allowing you to download a World Wide website from the Internet to a local directory, building recursively all directories, getting html, images, and other files from the server to your computer.- Free software (GPL), multi-platforms (Windows, POSIX, Android, ...).
- Integrated GUI (Windows/Linux/Android) and commandline/batch.
- Multiple connections, updates, reget, IPv6, compression, HTTPS.
- Hundreds of options/tuning.
- HTTrack Website Copier - Site officiel
http://www.httrack.com/page/1/fr/index.html- A propos - Bienvenue
- Télécharger
- Documentation
- Forum
- Blog
- Informations
- Httrack Users Guide
https://www.httrack.com/html/fcguide.html
- HTTrack Help
http://httrack.kauler.com/help/Home
Contents :- Issues concerning a mirror
- Authentication
- Files & filetypes
- Filters (scan rules)
- General
- URLs
- WinHTTrack & WebHTTrack interfaces
- Specific solutions
- Advanced
- Information
- Issues concerning a mirror
- HTTrack Documentation
http://www.httrack.com/html/index.html
- Description : Fonctionnalités principales de HTTrack
https://www.httrack.com
- Credits : Greetings & authors - HTTrack Website Copier
http://www.httrack.com/page/6/en/index.html
- Credits : Credits et auteurs - HTTrack Website Copier
https://www.httrack.com/page/6/fr/index.html
- About this project : Informations on this project :
https://www.httrack.com/html/contact.html
This project has been developed by :- Xavier Roche (xroche at httrack dot com) for the main engine and Windows interface and maintainer for v2.0 and v3.0.
- Yann Philippot (yphilippot at lemel dot fr) for the java binary dot class parser.
- David Lawrie (dalawrie at lineone dot net).
- Robert Lagadec (rlagadec at yahoo dot fr) for checking both English & French translations.
- Juan Pablo Barrio Lera (University of León) for Spanish translations.
- etc.
- GitHub - xroche/httrack : HTTrack Website Copier, copy websites to your computer (Official repository)
https://github.com/xroche/httrack
- Quel outil pour l’archivage de sites Internet ?
Publié le 13 décembre 2005 par CC-Blog2doc
http://blog2doc.over-blog.com
- Robot d’exploration Web - Web crawler
https://fr.qaz.wiki/wiki/Web_crawler
- Chocolatey Software | HTTrack 3.49.2
Last Update : 20 May 2017
https://chocolatey.org/packages/httrack- install HTTrack
- Description
- Files
- Version History
- Dependencies
- Discussion for the HTTrack Package
Tutoriels
- HTTrack Website Copier - How to start, Step-by-step
Quick start with WinHTTrack/WebHTTrack
Tutoriel détaillé créé par httrack.com
http://www.httrack.com/html/step.html- Step 1 : Choose a project name and destination folder
- Step 2 : Fill the addresses
- Step 3 : Ready to start
- Step 4 : Wait !
- Step 5 : Check the result
- Option panel
- HTTrack, aspirateur libre. Tutoriel en 16 pages.
http://www.cndp.fr/crdp-reims/
- Capturer des sites avec WinHttrack. Tutoriel en 15 pages.
Auteur : Dan, novembre 2002
https://archive.framalibre.org- 1. Introduction
- 2. Une capture facile
- Options
- Limiter la taille de la capture
- 3. Compléter une capture
- Trouver les noms et extensions des fichiers manquants
- Ajouter des liens
- 4. Ça se complique
- Les applets java (niveau 1)
- Les accessoires MSIE5
- Utiliser le cache de MSIE
- Les fichiers Flash
- Les applets java (niveau 2)
- Les applets java (niveau 1)
- 5. Conclusion
- Aspirer un site Web. PC Astuces. Tutoriel en 6 chapitres.
- Aspirez des sites web avec HTTRACK
Club Informatique des Clayes-sous-Bois
https://www.club-informatique-clayes-sous-bois.fr
Tutoriel en 5 chapitres- 1 - Installation et lancement de HTTRACK
- 2 – Reprendre l’aspiration d’un site
- 3 – Consulter un site aspiré
- 4 – Récupérer des fichiers du site aspiré
- 5– Paramétrages de Httrack
- 5.1– Règles de filtrage
- 5.2– Limites de capture
- 5.3– Autres réglages des autres onglets
- 5.4– Autres réglages
- Aspirer un site entier
15/01/2009 à 07h00
https://www.01net.com
Tutoriel en 6 chapitres- Installez HTTrack
- Démarrez une capture de site
- Définissez l’étendue des pages récupérer
- Lancez la capture
- Naviguez hors connexion sur le site téléchargé
- Mettez le site à jour
- L’aspirateur de site HTTrack
https://sites.google.com
Tutoriel en 5 étapes- Étape 1 : Choisissez un nom de projet et le dossier de destination
- Étape 2 : Remplissez les adresses
- Étape 3 : Prêt à démarrer
- Etape 4 : Attendez !
- Étape 5 : Vérifiez le résultat
- Panneau d’option
- Tutoriel HTTrack
http://soshg.free.fr/httrack/index.htm
- Aspirer un site Web (18 pages)
http://index-of.es/Failed-attack-techniques
- Comment copier un site Web : 11 étapes (avec images)
https://fr.wikihow.com/copier-un-site-Web
- Comment utiliser HTTrack pour aspirer un site
http://www.marocpolis.com
- HTTrack Manual (16 pages)
http://www.netlab.dk- 1. Introduction
- 2. Installation
- 2.1 Mac OS X
- 2.2 Windows
- 3. Archiving
- 3.1 Mac OS X
- 3.2 Windows
- 4. Displaying archived material
- 4.1 Mac OS X
- 4.2 Windows
- 5. Uninstalling
- 5.1 Mac OS X
- 5.2 Windows
- Comment télécharger un site entier avec HTTrack Website Copier
février 14, 2019
https://nossavoirs.blogspot.com
- Naviguez vos sites préférés SANS Internet !
Publié par Soufiane Sabiri
https://www.easytutoriel.com
- How to clone a website with httrack
by Jack Wallen in Networking on March 2, 2018, 4:00 AM PST
https://www.techrepublic.com
- Aspirer un site avec HTTrack
Avril 2013
http://www.finalclap.com
- **TUTO** HTTrack en Français - aspirateur de site/blog
Un tuto en Français qui explique comment se servir, de façon basique, de HTTrack ! Suivez les images, c’est simple !
Par Peter Petrelli, cyber blogueur, 16/09/2009
http://forum.canalblog.com
- Aspirer de sites web : HTTrack facile d’utilisation. Tutoriel en 3 pages.
WinHTTrack Website Copier : première utilisation.
https://www.pedagogie.ac-aix-marseille.fr
- Aspirer un site SPIP avec HTTRACK
https://contrib.spip.net
Sous ubuntu en mode console
17 décembre 2008 – par Bredren
Mode d’emploi- SOMMAIRE
- Installer Httrack
- Aspiration du site
- Sending a Drupal Site Into Retirement Using HTTrack
by Karen Stevenson February 26, 2020
https://www.lullabot.com
- CONSULTATION DU SITE SANS CONNECTION INTERNET
Tutoriel
Quand on est en croisière, il n’est pas toujours possible de se connecter à internet, ou alors les connections WiFi mises à disposition n’ont pas toujours le débit suffisant pour naviguer sereinement sur un site internet. On emmène le site complet !
http://www.viaggiitalia.fr
- Téléchargement gratuit de HTTRack Website Copier
Publié par GetIntoPC sur octobre 7, 2017
https://agetintopc.com
Contenus du Tutoriel :- Présentation du copieur de site Web HTTRack
- Caractéristiques du copieur de site Web HTTRack :
- Détails de la configuration technique du copieur de site Web HTTRack
- Configuration requise pour le copieur de site Web HTTRack
- Téléchargement gratuit de HTTRack Website Copier
- How to Download Offline Version of Any Website
Tutoriel de Niveau débutant.
Written by Soufiane Sabiri. Last updated mai 2020.
https://www.easytutorial.com
- Mode d’emploi de WinHTTrack
https://www.bibliquest.net
- Comment cloner un site web avec HTTrack - TUTORIELS
AUTEUR:ADMININFO.INFO DATE DE PUBLICATION:OCTOBER/2020
https://fr.admininfo.info
- Copier un site internet avec un aspirateur de sites Web ? Black Hat SEO
12 juin, publié par Nicolaseo
Utiliser HTTrack Website Copier. Tutoriel simple.
https://www.black-hat-seo.org
- WinHTTrack Website Copier pour Windows
Télécharger les pages web complètes
Tutoriel 100% texte, sans image/copie écran.
https://winhttrack-website-copier.fr.softonic.com/
- Comment configurer HTTrack pour un site Web avec protection par mot de passe.
Tutoriel détaillé créé par jdfineart
http://www.jdfineart.com
Présentation simple de HTTrack
- L’aspirateur de site HTTRack
http://annexes.iut2.upmf-grenoble.fr
Description détaillée en 2 chapitres et 7 paragraphes- Introduction
- 1. Les aspirateurs de sites
- 1.1 Les fonctionnalités
- 1.2 Avantages et inconvénients
- 2. L’aspirateur de site Httrack
- 2.1 Présentation
- 2.2 Description
- 2.3 Les points forts et les points faibles
- 2.4 L’avis des utilisateurs
- 2.5 Httrack un logiciel moderne et dynamique
- 3. Conclusion
- 4. Sitographie
- HTTrack 3.49-2. Télécharger HTTrack - Logithèque PC Astuces
Simple présentation de HTTrack
https://www.pcastuces.com
- Télécharger HTTrack pour Windows : téléchargement gratuit !
Oubliez tous les autres, HTTrack fait aussi bien, sans installation et pour pas un rond !
https://www.clubic.com
- HTTrack Website Copier
Utiliser HTTrack Website Copier | DBM Technologies
Simple présentation de HTTrack
https://www.dbmtechnologies.com
- Télécharger HTTrack (gratuit) - Comment Ça Marche
Simple présentation de HTTrack
https://www.commentcamarche.net
- HTTrack. Avis utilisateurs : ils ont téléchargé HTTrack
Auteur/éditeur : Xavier Roche & Yann Philippot
https://www.01net.com