Duración
30 horas
Introducción
Python es un lenguaje de programación orientada a objetos, que también puede utilizarse para el desarrollo web. El lenguaje Python está preparado para realizar cualquier tipo de programa, desde aplicaciones Windows a servidores de red o incluso, páginas web. Es un lenguaje interpretado, lo que significa que no se necesita compilar el código fuente para poder ejecutarlo, lo que ofrece ventajas muy valiosas para el mundo de la programación, como la rapidez de desarrollo e inconvenientes como una menor velocidad.
Formación en Python para analistas de datos o profesionales de empresa que deseen aprender a interpretar los datos empresariales y establecer estrategias dentro de una empresa.
Objetivos
Las personas asistentes aprenderán a cómo crear una aplicación que pueda publicar datos y suscribirse a los datos de un grupo de Apache Kafka®. Aprenderá el rol de Kafka en la línea moderna de distribución de datos, analizará los conceptos y componentes de la arquitectura de Kafka y revisará las API para desarrolladores de Kafka. Además de Kafka, Kafka Connect y Kafka Streams, el curso también cubre otros componentes en la plataforma Confluent más amplia, como el Registro de esquemas, el proxy REST y KSQL
Temario
- Introducción a Big Data
- Tendencias
- Economía del Dato
- ¿Qué es Big Data?
- Ecosistema Big Data y características
- Tipos de Datos
- Big Data en la nube (IaaS, PaaS, SaaS)
- Top players en la nube
- Herramientas usadas en Big Data
- Introducción a Ciencia de Datos
- ¿Qué es la Ciencia de Datos?
- Conceptos clave en Ciencia de Datos
- Roles y casos de uso
- Etapas de un proyecto de Ciencia de Datos
- Ciencia de Datos + Big Data + Inteligencia Artificial
- Top Players en Ciencia de Datos
- Python (refresco)
- Manual de estilo PEP-8
- Estructuras de datos
- Funciones
- Estructuras de control
- Acceso a datos
- Librerías más comunes
- Numpy
- Numpy vs Listas de Python
- Tipos de datos
- Arrays
- Matrices
- Pandas
- ¿Qué es Pandas?
- Acceso a datos (CSV, Excel, TXT, ISON, Bases de Datos)
- DataFrames
- Análisis de Datos Estructurados
- Análisis de Series Temporales
- Preparación de Datos
- Numpy
- Pandas
- Análisis de Datos
- Pandas Profiling
- Sweetwiz
- Autoviz
- D-Tale
- Pandas
- VAEX