Ingeniería de datos

La ingeniería de datos se ocupa de diseñar, construir y mantener las infraestructuras necesarias para almacenar y procesar datos. Su objetivo es garantizar que la información esté disponible, sea fiable y pueda utilizarse de forma eficiente.

En el entorno profesional, los ingenieros de datos trabajan con pipelines, bases de datos y sistemas de procesamiento para dar soporte a analistas de datos y científicos de datos.

que_hace_un_ingeniero_de_datos

¿Qué hace un Ingeniero de datos y cómo convertirse en uno en 2022?

El ingeniero de datos o Data Engineer se encarga de construir y mantener las estructuras de datos y las arquitecturas tecnológicas necesarias para la ingestión, procesamiento e implementación a gran escala de aplicaciones que usan datos de forma intensiva. La ingeniería de datos se trata de un campo  con amplias aplicaciones y protagonismo en diversas …

¿Qué hace un Ingeniero de datos y cómo convertirse en uno en 2022? Leer más »

que es google cloud platform

¿Qué es Google Cloud Platform?

Google Cloud Platform es la solución para computación en la nube, que nos ofrece el líder de buscadores Google. Es un espacio donde además de servidores, incluye los más de 90 servicios que han contribuido al éxito de Google Cloud Platform y que pueden ayudarnos a escalar nuestro negocio. Google Cloud cuenta con: 25 regiones 76 …

¿Qué es Google Cloud Platform? Leer más »

Qué es Web Scraping

¿Qué es Web Scraping?

Web Scraping refiere al proceso de recolectar datos desde la web, ya sea de forma manual o automática. Específicamente la palabra “Scraping” nos da una intuición de lo que implica esta técnica, ya que traducida al español significa raspar, reunir, arañar. Como se ve a continuación, Web Scraping no es la única técnica de extracción …

¿Qué es Web Scraping? Leer más »

que es text mining

¿Qué es Text Mining?

También llamado análisis de textos o minería de textos, el Text Mining es una de las ramas más complicadas e interesantes de las Ciencias de Datos. Enmarcado dentro de lo que es el Procesamiento de Lenguaje Natural (NLP: Natural Language Processing), consiste en la extracción de información interesante y no obvia de un texto sin …

¿Qué es Text Mining? Leer más »

que_es_apache_airflow

¿Qué es Apache Airflow?

Apache Airflow es una plataforma de gestión de flujo de trabajo de código abierto escrita en Python. Te lo explicamos en este video: Aunque Airflow no es una herramienta ETL, puede ser definido como un orquestador de tareas, permitiendo ejecutar cada tarea en el momento correcto, de la forma correcta, en el orden correcto. El …

¿Qué es Apache Airflow? Leer más »

que_es_git

¿Qué es Git?

Git es una herramienta de control de versiones. Permite guardar nuestro código y traquear todo los cambios. También permite acceder a toda la historia de esos cambios. En este video te lo explicamos:   Git es una herramienta open source y gratuita. Git está hecha para trabajar localmente, pero lo normal es trabajar en equipos. …

¿Qué es Git? Leer más »