La ingeniería de datos en proyectos Big Data y Data Science

¿Que es la ingeniería de datos?

Explicación para Dummies.

NO es Big Data, NO es Data Science, NO es Business Intelligence, NO es Spark, NO es Python, NO es Hadoop etc…

La ingeniería de datos es el ARTE y conjunto de técnicas para procesar, estructurar y normalizar los datos utilizando la tecnología. La ingeniería de datos es programación y los mejores ingenieros de datos suelen ser programadores.

Un ingeniero de datos debe tener conocimientos de Business Intelligence, debe tener conocimientos en Bases de Datos, debe saber diseñar esquemas Entidad relación, debe saber que es la tercera forma normal, debe saber que es la normalización de tablas y la desnormalización etc…

El ingeniero de datos debe ser capaz de trabajar con cualquier formato de datos, debe ser capaz de acceder a los datos de diferentes fuentes, procesarlos, estructurar y normalizar la información e insertarla en la base de datos, generar ficheros CSV etc…

La ingeniería de datos es la base de cualquier proyecto Big Data, Business Intelligence, Data Science o integración de datos.

El ingeniero de datos hoy trabaja con Amazon S3, mañana con Azure Data lake y pasado mañana con carpetas compartidas, le es igual la tecnología porque lo importante es tener bien claro los conceptos y que se necesita hacer.

La diferencia de un ingeniero de datos y un data scientist es que el ingeniero de datos trabaja con la información desestructurada para normalizarla y ofrecérsela a negocio y el Data Scientist utiliza la información que el ingeniero de datos le ofrece para sacar patrones, predecir, conclusiones, insights etc…

Francisco Rodríguez Alfaro

Entradas recientes

Proyectos de Web Scraping, Integración de datos y big data

¿Qué es el web scraping? ¿Qué se puede obtener con él? ¿Por qué es interesante…

2 años hace

Proyectos de Web Scraping, Integración de datos y big data

¿Qué es el web scraping? ¿Qué se puede obtener con él? ¿Por qué es interesante…

2 años hace

La importancia de la Ingeniería de datos y el Big Data en el Marketing Digital

En un mundo cada vez más digitalizado las personas tendemos cada vez más a realizar…

3 años hace

Power BI Embedded en aplicaciones WEB

Introducción Ya utilizas powerBI de costumbre para analizar tu negocio y te gustaría ir un…

3 años hace

Obtener el valor anterior NO NULO con SQL Server, MySQL y PostgreSQL

Introducción En el desarrollo de proyectos de Business Intelligence, Big Data y Data Science la…

5 años hace

¿Código Python dentro de SQL Server?

  ¿Python en SQL Server?    Sí, desde la versión de SQL Server 2016 se…

5 años hace