Extraer información sobre un usuario de las páginas web del perfil / respuestas de la API y guardarlas en un formato legible por la máquina.
Instalación
Ejecuta el siguiente comando para instalar a través de pip3
.
$ pip3 install socid-extractor
La última versión de desarrollo puede instalarse directamente desde GitHub:
$ pip3 install -U git+https://github.com/soxoj/socid_extractor.git
Uso de Socid Extractor
Como herramienta de línea de comandos:
$ socid_extractor --url https://www.deviantart.com/muse1908
country: France
created_at: 2005-06-16 18:17:41
gender: female
username: Muse1908
website: www.patreon.com/musemercier
links: ['https://www.facebook.com/musemercier', 'https://www.instagram.com/muse.mercier/', 'https://www.patreon.com/musemercier']
tagline: Nothing worth having is easy...
Sin instalar:
$ ./run.py --url https://www.deviantart.com/muse1908
Como una biblioteca de Python:
>>> import socid_extractor, requests
>>> r = requests.get('https://www.patreon.com/annetlovart')
>>> socid_extractor.extract(r.text)
{'patreon_id': '33913189', 'patreon_username': 'annetlovart', 'fullname': 'Annet Lovart', 'links': "['https://www.facebook.com/322598031832479', 'https://www.instagram.com/annet_lovart', 'https://twitter.com/annet_lovart', 'https://youtube.com/channel/UClDg4ntlOW_1j73zqSJxHHQ']"}
Páginas y métodos
Se admiten más de 100 métodos para diferentes sitios y plataformas
https://github.com/soxoj/socid-extractor/blob/master/METHODS.md
- Google (todas las páginas de documentos, contribuciones de mapas), se requieren cookies
- Yandex (disco, álbumes, znatoki, música, inmuebles, colecciones), se requieren cookies para evitar los bloqueos de captcha
- Mail.ru (página principal de usuario de my.mail.ru, fotos, vídeos, juegos, comunidades)
- Facebook (páginas de usuarios y grupos)
- VK.com (página de usuario)
- OK.ru (página de usuario)
- Medio
- Flickr
- Tumblr
- TikTok
- GitHub
- …y muchos otros.
También puedes consultar el archivo de pruebas para ver ejemplos de datos, el archivo de esquemas para explorar todos los métodos.
Cuando puede ser útil
- Obtener toda la información disponible por el nombre de usuario o/y el UID de la cuenta. Ejemplos: Week in OSINT, OSINTCurious
- Rastreo de usuarios, comprobando que la cuenta era conocida previamente (por su ID) incluso si toda la información pública ha cambiado. Ejemplos: Aware Online
- Búsqueda por UIDs de uso común entre servicios (GAIA ID, Facebook UID, Yandex Public ID, etc.)
- Fugas de la base de datos de foros y plataformas en formato SQL
- Enlaces indexados que contienen el ID del perfil de destino
- Búsqueda de datos de rastreo por comparación con otros UID – cómo funciona, cómo se puede utilizar.
- Solicitudes en línea de las fuerzas de seguridad
Herramientas que utilizan socid_extractor
- Maigret – potente comprobador de nombres, genera un informe con toda la información disponible de las cuentas encontradas.
- TheScrapper – raspa correos electrónicos, números de teléfono y cuentas de redes sociales de un sitio web.
- YaSeeker – herramienta para reunir toda la información disponible sobre la cuenta de Yandex por login/email.
- Marple – raspa los resultados de los motores de búsqueda para un nombre de usuario determinado.
https://github.com/champmq/TheScrapper
https://github.com/HowToFind-bot/YaSeeker
https://github.com/soxoj/marple
Pruebas
python3 -m pytest tests/test_e2e.py -n 10 -k 'not cookies' -m 'not github_failed and not rate_limited'
https://github.com/soxoj/socid-extractor