Uso Scrapy para la extracción automatizada de contenidos web en base a reglas XPATH.
pirateBayCrawl.py: https://github.com/Adastra-thw/pyHacks/blob/master/pirateBayCrawl.py
crawlerBlog.py: https://github.com/Adastra-thw/pyHacks/blob/master/crawlerBlog.py
Repositorio GIT de la serie:
https://github.com/Adastra-thw/pyHacks.git
[wpvideo 8AId1tHq]


7 respuestas a «Hacking con Python Parte 9 – Web Crawling con Scrapy»
[…] Hacking con Python Parte 9 – Web Crawlng con Scrapy […]
Hola, muy buen video. Sabes coo se utiliza scrapy para ocnruir una web, es decir una vez que tengo los datos en un archivo JSON como ago para construir desde ahi un archivo html. Saludos
Amigo, si supiste como, me podrías explicar.
excelente gracias
[…] muchas librerías y herramientas para iniciar procesos de crawling y scrapping en aplicaciones web, sin embargo, algo que siempre echo en falta, es la capacidad de […]
[…] Enlace […]
Hola Adastra me parece magnifico ya que yo hago esto con php pero realmente no es efectivo te queria consultar como se podra hacer scrapping de vario niveles abajo seleccionando o filtrando cuando alguna web tiene botones o javascript para poder accesar a la info y poder extraerla una tabla