RastLeak III – Una tool para buscarlos a todos

Buenas,

Como ya sabéis RastLeak es una tool que prácticamente comenzó como un proyecto personal para automatizar la búsqueda de fuga de información basada en documentos indexados tirando contra un target así como sus subdominios. En su primera versión, empleaba como motor de búsqueda Bing:

 

RastLeak – Una tool para buscarlos a todos

 

Bing es un buscador bastante potente, sin embargo, desde mi punto de vista no puede llegar a competir con Google, por este motivo, decidí incorporar Google para ampliar el abanico de búsquedas, pues además, Google es mucho más flexible a nivel de Dorks teniendo unos resultados muy buenos. De ahí surgió un nuevo update:

RastLeak II – Una tool para buscarlos a todos, también con Google

que presenté oficialmente en la Hack&Beers Vol.8 de Madrid:

Hack&Beers Madrid – Vol 8 – RastLeak

Finalmente, optimicé el código e incorporé la funcionalidad de búsqueda de posible fuga de información fuera de la infraestructura del target, dónde además mi ex-compañero y amigo Rober, me dedicó un logo para la herramienta basado en uno de mis perros 😉

 

 

Visto el timeline, deje un poco aparcada RastLeak para dedicar tiempo a proyectos que tenía en mente, que presenté este mes en la HoneycCon17 de Guadalajara y  este finde en la Secadmin de Sevilla. Sin embargo, sí he sacado pequeños ratos para especialmente optimizar el código y obtener resultados más «limpios» y más usables para el día a día.

Si alguno echó un vistazo el código se encontraba todo en varias funciones en un mismo .py. Realmente funcionaba pero a la hora de incorporarlo como módulo para otros proyectos no era lo óptimo. Ya desde hace bastante, todos mis desarrollos (a no ser que sean muy precisos para una funcionalidad) los segmento en módulos para facilitar su uso, optimización y reciclaje de código.

Después de toda esta chapa, vengo a presentar un nuevo update de RastLeak (v.2.1) en el que se han incorporado los siguientes códigos:

  • Segmentación el código en módulos (todavía se podría segmentar más pero por el momento me vale).
  • Optimización y reciclaje de código.
  • Eliminación de duplicados en las búsquedas de Google. Al obtener los datos de la caché, en ocasiones se obtenían resultados duplicados.
  • Creación de una carpeta dónde se guarda:
    • .txt con las URL’s indexadas.
    • Los documentos indexados identificados.
    • Excel con dos pestañas: una de resumen con la categorización de los documentos indexados y otra con la extracción de metadatos.
    • Mejorar la adaptación de resultados de Bing con Google cuando salta el recaptha de Google.

A nivel de resultados que un usuario ve no se identifican estos cambios de manera significativa, sin embargo, a la hora de visualizar la exportación de resultados sí.

A continuación, se muestra una PoC sobre la nueva versión de RastLeak, disponible en mi github:

 

Realizando una pequeña búsqueda con N=1 para el target uah.es:

Se obtienen resultados indexados en las siguientes URL’s:

dónde se visualizan el tipo de documentos indexados:

 

Accediendo la directorio con el nombre del target se tienen los resultados exportados:

 

 

Del mismo modo, en la exportación a excel se tienen dos pestañas, una con el resumen de documentos encontrados

 

y otra con los metadatos extraídos:

 

 

Del mismo modo, debido a la cantidad de documento ofimáticos que se descargan automáticamente, una vez obtenidos los metadatos se eliminan.

Todavía tengo pendiente añadir duckduckGo como buscador así como exalead. Cualquier sugerencia e idea se agradece para futuras mejoras.

Espero que os sea útil este nuevo update.

Nos vemos en la siguiente entrada!

«La mejor defensa, es un buen ataque»

N4xh4ck5

2 comentarios en «RastLeak III – Una tool para buscarlos a todos»

Los comentarios están cerrados.