¿Está buscando todos los documentos que contiene un sitio web, pero no sabes cómo acceder a ellos? Puede utilizar MetaFinder para buscar en el motor de búsqueda de tu elección y encontrarás resultados sorprendentes.
A continuación, vamos a analizar una nueva herramienta de OSINT llamada MetaFinder. Este “buscador” es único, ya que busca los metadatos de archivos en múltiples sitios, en lugar de su contenido. MetaFinder rastrea cualquier sitio web, y luego busca en los metadatos de cada sitio para encontrar lo que quieres. El resultado es una lista de URLs que a menudo puedes encontrar archivos, incluso cuando la página web en la que están ha sido retirada.
Instalación
La instalación está disponible a través de pip3
, por lo que puedes instalarlo en Windows, Linux o macOS:
pip3 install metafinder
Por ejemplo, para Linux (Parrot OS), la instalación se muestra a continuación:
Las actualizaciones también están disponibles mediante:
pip3 install metafinder --upgrade
Uso
MetaFinder puede utilizarse de dos maneras:
CLI
CLI: Interfaz de línea de comandos. Este uso es a través de la terminal. Para ello, utiliza la siguiente sintaxis:
metafinder -d dominio.com -l 20 -o /carpeta [-t 10] -go -bi -ba
Parámetros:
d
: Especifica el dominio de destino.l
: Especifica el número máximo de resultados a buscar en los buscadores.o
: Especifica la ruta para guardar el informe.t
: Opcional. Permite configurar los hilos (4 por defecto).v
: Muestra la versión de Metafinder.
Motores de búsqueda a seleccionar (Google por defecto):
go
: Opcional. Busca en Google.bi
: Opcional. Búsqueda en Bing.ba
: Opcional. Búsqueda en Baidu. (Experimental)
En Código
Para utilizarlo dentro de un código, entonces:
import metafinder.extractor as metadata_extractor
documents_limit = 5
domain = "target_domain"
result = metadata_extractor.extract_metadata_from_google_search(domain, documents_limit)
# result = metadata_extractor.extract_metadata_from_bing_search(domain, documents_limit)
# result = metadata_extractor.extract_metadata_from_baidu_search(domain, documents_limit)
authors = result.get_authors()
software = result.get_software()
for k,v in result.get_metadata().items():
print(f"{k}:")
print(f"|_ URL: {v['url']}")
for metadata,value in v['metadata'].items():
print(f"|__ {metadata}: {value}")
document_name = "test.pdf"
try:
metadata_file = metadata_extractor.extract_metadata_from_document(document_name)
for k,v in metadata_file.items():
print(f"{k}: {v}")
except FileNotFoundError:
print("File not found")
Ejemplo
Veamos un rápido ejemplo de uso, utilizando el dominio de la NASA.
metafinder -d nasa.gov -o /tmp -l 10 -go -bi
He utilizado los motores de búsqueda de Google y Bing. A continuación, se muestran algunas URLs que contienen archivos descargables:
Finalmente, se muestra información relacionada a los documentos, tales como su Autor y Software utilizado. Además, la información se almacena en la carpeta de salida especificada.
A falta de un motor de búsqueda dedicado a los documentos, MetaFinder utiliza un conjunto de motores de búsqueda, como Google, Bing y Baidu, para encontrar documentos en un dominio determinado. Además del caso de uso clásico de buscar un archivo en un servidor, el uso de motores de búsqueda de MetaFinder permite buscar documentos en formato de archivo en la web.
https://github.com/Josue87/MetaFinder