Cómo clonar un sitio web con httrack
5 (100%) 12 votes

Te guiaré paso a paso durante todo el proceso de clonación de un sitio web con la herramienta de línea de comandos httrack y la GUI webhttrack.

¿Estás buscando un programa para clonar una pagina web completa? La herramienta httrack te puede ayudar con ello. Su funcionamiento es sencillo, y está disponible para Windows, Linux y Android. ¡Comencemos con este nuevo truco informático!

Si eres un desarrollador de sitios web, un propietario de un negocio o un estudiante en el área de TI, probablemente hayas encontrado una instancia en la que necesitas clonar rápidamente un sitio web.

Digamos, por ejemplo, que tienes un sitio que administras que tiene problemas; es posible que desee clonar ese sitio y luego comenzar a depurar ese clon. ¿por qué? porque trabajar con el clon ciertamente supera la posibilidad de romper aún más el sitio original.

1. Qué es HTTrack Website Copier

Hay muchas formas de clonar un sitio. Una solución que he usado ofrece opciones de línea de comando y GUI, y se llama httrack. La aplicación se puede utilizar en Linux, Windows, MacOS, Android, y hace una copia completa de un sitio web para su navegación local.

La herramienta de línea de comandos es, como de esperar, llamada httrack. También hay una versión de GUI para Linux llamada webhttrack. Voy a demostrar cómo usar tanto la línea de comando como las herramientas de la GUI, para que pueda hacer copias rápidas de sus sitios web. Estaré demostrando ambas versiones usando Ubuntu Linux.

Integrado en Kali

La herramienta httrack está integrado en Kali Linux.
Descargar HTTrack


2. Instalación

Tanto la línea de comando como las herramientas GUI se pueden encontrar en los repositorios estándar. Para instalarlos, abra una ventana de terminal y escriba el siguiente comando:

sudo apt install httrack webhttrack
Instalación de httrack linux

Instalación de httrack en Linux

Cuando se le solicite, escriba su contraseña de sudo, acepte la instalación y permita que se complete. Eso es todo lo que hay que hacer para instalar las herramientas.

3. Cómo usar HTTrack: Línea de comando

Primero copiaremos un sitio usando la herramienta de línea de comandos. Esto puede llevar algo de tiempo, dependiendo de qué tan grande sea su sitio. El comando para hacer la copia o clonación es el siguiente:

httrack URL_SITIOWEB -O DIRECTORIO

Donde URL_SITIOWEB es la URL real del sitio que desea copiar y DIRECTORIO es el directorio en su disco local para almacenar la copia. Una vez que se completa el comando, verá el clon recién creado en DIRECTORIO. Luego puede comenzar a trabajar con ese clon sin afectar su sitio de producción.

Ejemplo: Clonaremos un sitio web de prueba con URL www.webscantest.com

Uso de HTTrack Línea de comandos

Uso de HTTrack desde la Línea de comandos

Resultados después de clonar un sitio web:

La mayor advertencia sobre el uso de esta herramienta es que, dependiendo de cómo se haya escrito el sitio y cómo esté alojado, los resultados pueden variar. Si encuentra descargas de httrack con más de un archivo index, es probable que no funcione en su sitio. Hasta ahora, he encontrado que los sitios de WordPress, especialmente los alojados en hosts de terceros, son casi imposibles de clonar usando esta herramienta.


4. Uso de GUI: webhttrack

La herramienta GUI le brinda un poder un poco más fácil de usar. Para iniciar la GUI, abra una ventana de terminal y emita el siguiente comando:

webhttrack

Esto abrirá una ventana del navegador con la GUI lista.

  • En la primera pantalla, seleccione su idioma y haga clic en Siguiente >>. En la siguiente ventana, ingrese un nuevo nombre de proyecto y seleccione una de las categorías predefinidas. Escriba una ruta base para albergar los archivos descargados y haga clic en Siguiente >>.
  • En la siguiente ventana, seleccione la acción que se utilizará (ya que esta es una primera descarga, la predeterminada será correcta -Copiar Sitio de la Web) y escriba la URL para el sitio de destino en el cuadro de dirección.
Copiar Sitio de la Web Clonar

Copiar Sitio de la Web – HTTRACK

  • Haga clic en el botón Definir opciones y podrá configurar opciones como ID de navegador, reglas de robots/arañas, cantidad de conexiones, proxy, límites y más.
Definir opciones HTTRACK

Definir opciones en HTTRACK

¡Cuidado!

Si ejecuta un clon y encuentra que falla, es probable que tenga que volver a la sección de Opciones y hacer ajustes. Esto, por supuesto, dependerá del tipo de sitio que intente clonar.
  • Una vez que haya establecido las opciones exactamente cómo las necesita, haga clic en Ya, luego haga clic en Siguiente >> y luego haga clic en el botón Comenzar >>. En este punto, el sitio comenzará a clonar (guardándolo en el directorio local configurado).

Cuando la descarga finalice, puede comenzar a trabajar con su clon.

5. Conclusión

No perfecto, pero útil

Siempre que no intente descargar un sitio de WordPress, httrack o webhttrack harán un gran trabajo descargando un clon de su sitio web, para que pueda depurar, realizar copias de seguridad o lo que sea que necesite.

Como dije, dependiendo del tipo de sitio con el que intente trabajar, tendrá que juguetear con la configuración para que funcione. Pruebe esta útil herramienta y comparta en los comentarios sus impresiones 🙂

Por cierto… ¿ya tienes nuestra app Guías para Informáticos? Consíguela a través de este enlace y tendrás todas las guías al alcance de tu smartphone 😉


¡Mantente actualizado!

Suscríbete a nuestro boletín semanal...

Suscríbete a nuestro boletín electrónico para recibir artículos útiles y ofertas especiales. No te perderás absolutamente de nada!

Enviaremos solamente boletines al email y no compartiremos tu email.