Heritrix

Heritrix est un robot d’indexation conçu et utilisé par Internet Archive pour l’archivage du web. La BnF utilise ce robot Heritrix pour réaliser la collecte des sites web dans le cadre du dépôt légal de l’internet.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *