Evine Rastreador Web con CLI Interactivo
Evine Rastreador Web con CLI Interactivo

Evine: Rastreador Web con CLI Interactivo

Un rastreador web con CLI interactivo.

Evine es un simple, rápido e interactivo rastreador y raspador web escrito en Golang. Evine es útil para una amplia gama de propósitos como la extracción de metadatos y datos, la minería de datos, el reconnaissance y testing

Instalar

Desde el Binario

También hay disponibles versiones binarias pre-construidas.

Desde la fuente

go get github.com/saeeddhqan/evine
"$GOPATH/bin/evine" -h

Desde GitHub

git clone https://github.com/saeeddhqan/evine.git
cd evine
go build .
mv evine /usr/local/bin
evine --help

Nota

Se requiere golang 1.13.x.

Comandos y Uso

TeclasDescripción
EnterEjecuta el rastreador (desde la vista URL)
EnterMuestra la respuesta (de las vistas de Keys y Regex)
TabSiguiente vista
Ctrl+SpaceEjecuta crawler
Ctrl+SGuarda la respuesta
Ctrl+ZSalir
Ctrl+RRestaurar a los valores por defecto (desde las vistas de Options y Headers)
Ctrl+QCerrar respuesta de la vista de guardado (de la vista Save)
Comandos con Teclas
evine -h

Mostrar la ayuda para la herramienta:

FlagDescripciónEjemplo
-urlURL para rastrearevine -url toscrape.com
-url-exclude stringExcluir las URLs que trabajan con esta expresión regular (por defecto “.*”)evine -url-exclude ?id=
-domain-exclude stringExcluir los dominios de alcance para rastrear. Separar con coma. default=root domainevine -domain-exclude host1.tld,host2.tld
-code-exclude stringExcluir el código de estado HTTP con estos códigos. Separar con ‘|’ (por defecto “.*”)evine -code-exclude 200,201
-delay intDescansar entre cada petición (milisegundo).evine -delay 300
-depthNivel de búsqueda de la profundidad del rastreador (predeterminado 1)evine -depth 2
-thread intEl número de goroutines concurrentes para resolver (predeterminado 5)evine -thread 10
-headerEncabezado HTTP para cada petición (Debe separar los campos por \N -).evine -header KEY: VALUE\nKEY1: VALUE1
-proxy stringProxy por esquema://ip:portevine -proxy http://1.1.1.1:8080
-scheme stringEstablecer el esquema de las solicitudes (por defecto “https”)evine -scheme http
-timeout intSegundos de espera antes de que el tiempo se agote (por defecto 10)evine -timeout 15
-keys stringExpresión JQuery(Podría ser una extensión de archivo(pdf), una consulta clave(url,script,css,..) o un selector de jquery($(“a).attr(‘hdr’)))evine -keys urls,pdf,txt
-regex stringBusca la expresión regular en el contenido de la páginaevine -regex ‘User.+’
-max-regex intResultado máximo de la búsqueda de la expresión regular para el campo regex (por defecto 1000)evine -max-regex -1
-robotsRasparrobots.txt para URLs y usarlos como semillasevine -robots
-sitemapRaspar el sitemap.xml para los URLs y usarlos como seedsevine -sitemap
-waybackRaspar WayBackURLs (web.archive.org) para URLs y usarlos como seedsevine -sitemap

Vistas

  • URL: En esta vista, debes introducir la cadena de URL.
  • Options: Esta vista sirve para configurar opciones.
  • Headers: Esta vista sirve para configurar los encabezados HTTP.
  • Query: Esta vista se utiliza después del rastreo de la web. Se utilizará para extraer los datos (documentos, URL, etc.) de las páginas web que se han rastreado.
  • Regex: Esta vista es útil para buscar los Regexes en las páginas web que han sido rastreadas. Escribe tu Regex en esta vista y presiona Enter.
  • Response: Todos los resultados escriben en esta vista
  • Search: Esta vista se utiliza para buscar los Regexes en el contenido de la vista Response.

Por Hacer

  • Salida JSON

Bugs o Sugerencias

¿Bugs o sugerencias? Crear un issue.

Evine está muy inspirada por wuzz.

Mi Carro Close (×)

Tu carrito está vacío
Ver tienda