Comment définir des options ?

Sur l'écran précédent, cliquer sur DEFINIR LES OPTIONS

cliquer sur

Vous obtenez une fenêtre avec plusieurs onglets. Seuls les 2 plus importants et utiles sont présentés:

Règles de filtrage : c'est l'option la plus importante !

- types de fichiers
afin d'inclure(+) ou exclure (-) certains formats de fichiers. En effet, peut-être n'avez vous pas besoin d'aspirer certains fichiers (inutiles, trop lourds... commes des sons, des vidéos, des fichiers zippés...)
Par défaut "tout est aspiré" !

Les 3 cases à cocher permettent d'inclure ou d'exclure, les 3 séries de fichiers concernés : images / zippés / vidéos.
Vous pouvez exclure d'autres fichiers, par exemple
-les fichiers textes doc pdf
-les fichiers exe (souvent dangereux)
- les sons en .mp3 wav

Exemple (fortement conseillé), vous voulez exclure les fichiers zippés et pdf et exe ainsi que les vidéos. (cocher comme dans l'exemple avec le signe -)
-*.pdf -*.zip -*.exe ...

-dossiers ou liens en définissant des "règles" qui utilisent + - * avec la possibilité d'inclure/exclure certains "mots" (utiliser les boîtes de dialogue "liens à inclure/exclure")

Exemple, dans le site que vous aspirez vous ne voulez pas du dossier boite :
-*/boite/*

Attention :
-la dernière règle est prioritaire par rapport aux règles précédentes
-Vous devez obligatoirement conserver les fichiers de base constituant les page web : htm html css jpeg jpg gif


Limites de la capture : c'est encore une option importante !

Profondeur maximum
Définis la profondeur d'aspiration dans le site. Cette option n'est pas remplie par défaut : la profondeur interne est infinie. L'aspirateur reste sur le site.

Profondeur externe maximum
Définis la profondeur dans des sites externes, ou sur des adresses qui étaient interdites.
Normalement, HTTRACK n'ira pas sur des sites externes, c'est l'option par défaut soit 0 (sauf par autorisation des filtres).. Vous pouvez outrepasser ce comportement, et aspirer N niveaux "externes". Employer cette option avec grand soin, 1 semble un maximum raisonnable.
dans l'exemple, seule la première page des sites externes sera capturée


Taille maxi d'un fichier HTM

Définir la taille maxi du plus fichier html à aspirer.
Cette option vous permet d'éviter les gros fichiers

Taille maxi d'un fichier non HTM
Définir la taille maxi du plus fichier non html (image, zip) à aspirer
Cette option vous permet d'éviter les gros fichiers
dans l'exemple, la taille des fichiers autres que htm est limitée à 0,75 ko
(se limiter à 600.000 bits soit 75.000 octets soit environ 75 ko est largement suffisant pour des images du web)
Taille maxi du site
Cette option limite le montant total d'octets qui peuvent être aspirés

Suspendre copie après
Cette option permet de faire une pause après avoir atteint une taille spécifique indiquée. Vous pourrez décider quoi faire ensuite

Temps Maximum de capture
Cette option limite le temps total de l'aspiration
dans l'exemple, 7200secondes soit 120mn soit 2 heures
Taux maxi
Cette option limite le débit

Maximum de connexions à la sec
Cette option limite le nombre de connexions simultanées
Par défaut :10, mais vous pouvez le modifier

Nombre maximum de liens
Le nombre maximum de liens à analyser. Ne pas établitr une limite trop basse car l''aspiration arrête aussitôt (ni trop haute ....)
100.000 liens (par défaut) est généralement assez.

 

Il est conseillé de ne pas modifier les autres onglets, sauf si vous êtes un "expert".Voir l'aide fournie (en anglais)


Par exemple, il est important de "conserver la structure du site"