Informática. Aplicaciones
Tutorial sobre HTTrack, aplicación de copia de sitios en internet.

HTTrack es una aplicación informática del tipo "Software libre" con licencia GPL, multilenguaje y multiplataforma que sirve para la captura de sitios web, es decir la descarga a un sistema de almacenamiento en un ordenador (por ejemplo el disco duro de un PC o una llave electrónica o pen drive, de todo, o parte de un sitio web, para poder navegar en cualquier momento sin necesidad de estar conectado a internet.

1. Descarga del programa

Acceder a la página web del programa http://www.httrack.com, (también es posible desde sitios dedicados a descarga de programas) apareciendo la siguiente pantalla:

Pantalla página web httrack

Seleccionamos la opción "Download page".

Una vez almacenado el programa en el soporte que hemos elegido, se ha de proceder a la instalación, que se muestra seguidamente bajo el sistema operativo Windows XP.

2. Instalación bajo Windows de Httrack

Con el navegador de Windows pulsamos sobre el fichero que hemos descargado (la ubicación es la seleccionada en el paso anterior), apareciendo un botón "Next >" que nos permite iniciar el proceso de instalación al pulsar sobre él, si seleccionamos "Cancel" abandonamos la instalación del programa.

Inicio instalacion Httrack

Seguidamente nos muestra la licencia de uso de la aplicación, se ha de seleccionar el botón "I accept the agreement" y a continuación pulsar el botón "Next >"

Instalacion Htrack

A continuación aparece un marco que nos pide en qué directorio se ha de instalar Httrack, lo habitual es dejar por defecto el que aparece, si deseamos visulizar otros de nuestro sistema de almacenamiento, se ha de pulsar el botón "browse" y efectuar la elección. Seguidamente se inicia la instalación pulsando en el botón "Next", los otros botones sirven para volver atrás o cancelar el proceso. Seprecisan como mínimo 10 MO de espacio libre para la instalación

Instalacion Httrack

El paso siguiente lo aceptamos con la configuración por defecto, es la carpeta que elegimos para el menú de inicio. Aceptamos pulsando en "Next >"

Instalacion Httrack

A continuación nos pide que seleccionemos si deseamos un icono para iniciar el programa en el escritorio y otro de lanzamiento rápido. Si deseseamos que aparezcan los dos o alguno de ellos, marcamos el cuadrado corresponidente a nuestra elección. Seguidamente se pulsa el botón "Next >".



En este momento aparece un marco donde nos muestra las opciones que hemos seleccioando, si estamos de acuerdo pulsamos el botón "Install" y se realiza la instalación, si deseamos modificar algunas de las opciones se ha de volver a las etapas anteriores pulsando el botón " < Back" y el botón "Cancel" permite abandonar la instalación.



Cuando finaliza el proceso de instalación nos muestra la posibilidad de ejecutar el programa y ver un documento sobre el historial de actualizaciones del programa, seleccionado lo deseado en los cuadrados correspondientes. Pulsando el botón "Finish" se termina la instalación de Httrack.



En este momento, si hemos seleccionado que se ejecute el programa al terminar la instalación, aparece un marco que permite cambiar la lengua en que aparecen los menús, lo lógico es seleccionar castellano, pulsando el botón "Ok" para confirmarlo.



Seguidamente nos pide que reiniciemos el programa para que opere en castellano, pulsamos el botón "Aceptar".



3.- Ejecución de Httrack

El uso del programa es como cualquier otro, si hemos instalado un icono de acceso desde el escritorio, bastará con seleccionarlo con el ratón de la forma habitual.

Httrack en el escritorio Windows

Aparecerá una pantalla de bienvenida, pulsamos el botón "Siguiente" (por error indica que se pulse el botón AVANZAR) y así iniciamos el proceso de copiar un sitio o retomamos uno previamente iniciado. Tenemos otros botones cuya finalidad es obvia.



En la parte superior de la pantalla visualizamos el menú de Httrack.



Para iniciar el proceso de grabar un sitio de internet, se han de configurar las distintas opciones, desde el menú previamente indicado. Olvidando en este momento las opciones de configuración, al seguir desde la etapa previa nos pedirá nombre del proyecto, es decir como queremos denominar la copia del sitio seleccionado, en "Categoría del proyecto" podemos poner lo que consideremos oportuno , por último en donde indica "Ruta base" se ha de seleccionar el directorio donde vamos a grabar la copia. En el momento que pulsemos el botón "Siguiente" accede al marco que nos pide los datos necesarios para el proceso.



En el marco que aparece nos pide la acción a realizar, seleccionamos "Copiar todas las páginas del sitio (copia múltiple)" y a continuación en el recuadro se ha de indicar la dirección del sitio de internet a copiar, pudiendo añadir varios en la misma sección, mediante el botón "Añadir", por último nos permite establecer las opciones, habiendo una muy importante, que es el nivel de profundidad que captura de la web seleccionada, y también de los sitios enlazados externamente mediante hiperenlaces, para no generar un fichero muy grande, externamente hemos de seleccionar el mínimo nivel de profundidad, incluso nulo. Pulsando el botón "Siguiente >" comienza el proceso.



Por ejemplo, para copiar mi página web en la dirección http://www.um.es/docencia/barzana en la Universidad de Murcia, habiendo denominado el proyecto como UMU, se tendría la siguiente pantalla:



El último paso antes de iniciar la grabación se muestra en el siguiente marco, permite algunos parámetros para el proceso, por ejemplo retrasar el momento de inicio o grabar sólo la configuración y efectuar el volcado del sitio en otro momento. Pulsando el botón "Finalizar" se inicia el proceso, que durará en función del contenido del sitio a grabar y la velocidad de conexión a la red. Si salimos antes de terminar, se puede volver en otro momento y continuar desde nos habíamos quedado. Es muy importante, dentro de las opciones, ir a la pestaña "Límites" y en "Profundiad externa máxima" elegir el número de niveles que captura en los sirtios externos al que estamos grabando, se recomienda seleccionar 0.



Durante el volcado aparece una pantalla que indica los procesos que se realizan en cada momento. Podemos salir de la grabación pulsando el botón "Cancelar", en cualquier momento.



Una vez terminado el proceso, aparece un menú que nos permite visualizar los errores surgidos y ver el sitio capturado. Para terminar se pulsa el botón "Finalizar" y podemos seguir con otro proyecto. Si pulsamos "Salir" se termina la ejecucón del programa.

Finalizar HTTrack

4.- Visualización de los sitios grabados

Accedemos desde el navegador de Windows al directorio donde guradamos los sitios capturados mediante Httrack, por ejemplo en este caso sería "C:\Mis lugares Web", allí pulsamos sobre el archivo de índice "index" y aparece el índice de los sitios grabados, así accedemos al que deseamos visualizar.

Indice en HTTrack

5. Actualización de un proyecto

Al descargar un sitio, y ser cancelado en cualquier momento y por cualquier circunstancia, todo lo que se ha descargado hasta el momento no se pierde, permanece en la carpeta que elegimos al crear el proyecto para la descarga, pudiéndose navegar sin conexión a internet (off-line) desde dicha carpeta sobre el sitio, a través de las URL que se hayan descargado hasta el momento de cancelar el proyecto.

A la hora de continuar descragando un proyecto ya existente, hay que tener mucha precaución con las opciones seleccionadas, pues dependiendo de lo que queramos, es solo correcto un determinado tipo de opción de actualización del proyecto. Seguidamente se indican las dos posibilidades existentes para continuar con un proyecto existente:

Continuar con proyecto interrumpido. Esta es la opción a considerar para actualizar un proyecto cuando el sitio del que se creó el proyecto, ha desaparecido, o se ha borrado en el información importante que queremos conservar. Esta opción no borra nada de lo que ya teníamos descargado, continua la descarga del sitio con las direcciones pendientes de volcar, sin regrabar las direcciones que ya se habían descargado, dejando intactos todos los archivos que habíamos descargado previamente. Este tipo de opción no será la que necesitamos, si se quiere actualizar la información antigua que ya se había descargado a la información actual que hay en el sitio web. Como es lógico, en el caso de que sea indiferente que se reescriba en nuestro proyecto la información de la web, de todas formas nos interesa esta opción, puesto que al no volver a descargar las URL que se habían volcado previamente, el proceso es más rápido, por ejemplo, si habíamos descargado 900 Megas de una Web, con esta opción no se volverán a descargar otra vez esos 900 Megas, sino los que quedan por descargar correspondientes a las URL que el programa no ha recorrido.

Actualizar proyecto existente. Esta opción no se debe usar cuando el sitio o sitios web de los que se creó el proyecto, han desaparecido, o se ha borrado de ellos información que precisamos conservar. Esta opción sobrescribe todo de lo que ya teníamos descargado, es casi como crearamos un proyecto nuevo, lo único que cambia probablemente sea que en el proyecto que teníamos se tiene la dirección de todas las URL del sitio, con lo que el programa ya solo tendrá que conectar con dichas URL, a diferencia de cuando se empieza un proyecto nuevo, que el programa tiene que averiguar las URL, y después conectar con ellas.


Versión portable. Válida para memorias flash como los "pen drive". Se ha de descargar de aquí,y extraer los archivos en el soporte de almacenamiento flash, dentro de un directorio denominado Httrack. Para hacer uso del programa, se ha de ejecutar desde el soporte externo, WinHTTrack.exe. Para ahorrar espacio se pueden eliminar los archivos fuente que se encuentran en los directorios libtest, src y src_win.

Programas en versión portable:

Enlaces relacionados:

- Cómo navegar sin tener conexión. (CPR Monzón)
- Descarga versión portable de HTTrack
- Hacer una copia del blog
- Pendriveapps.com

Tutoriales software



Organizaciones escépticas



 



Búsquedas