Gestión de la información web usando Python - Antonio Sarasa Cabezuelo

Gestión de la información web usando Python

Por Antonio Sarasa Cabezuelo

  • Fecha de lanzamiento: 2017-03-05
  • Género: Informática e Internet

Descripción

En este manual se realiza una introducción a un conjunto de herramientas y técnicas para el acceso y procesamiento de datos web, que se encuentran en formatos como XML, CSV o JSON, o bien en bases de datos tanto relacionales como NoSQL. El objetivo de esta obra es acercar al lector estos conocimientos a partir de las herramientas y librerías de un lenguaje de programación concreto como Python,  el más utilizado hoy en el área del análisis de datos y big data. El primer capítulo constituye una introducción a Python, que sirve como lenguaje vehicular en el resto de los capítulos, los cuales se dedican a estudiar el acceso  y procesamiento de datos en los formatos XML, JSON y CSV. Los siguientes capítulos abordan el acceso a bases de datos relacionales, SQLite y MySQL,  y a la base de datos NoSQL MongoDB. En los dos últimos capítulos, se tratan técnicas de extracción de información usando web scraping y programación de páginas web con la framework Bottle. Cada capítulo contiene algunos ejercicios propuestos para fijar las ideas expuestas