Data scientist, data analyst... 5 profesiones para dedicarse al ‘big data’

03. 11. 2020

5 min.

Data scientist, data analyst... 5 profesiones para dedicarse al ‘big data’
autor
Javier Lacort

Redactor freelance especializado en tecnología y startups

El ‘big data’ será la competencia tecnológica más buscada por las empresas en 2022, por encima de otras tecnologías como el internet de las cosas, la de los mercados para aplicaciones web o el ‘machine learning’. De hecho, en los últimos años, la demanda académica, y no solo laboral, de la gestión de datos se ha disparado y ha provocado que la nota de corte de grados como el de Matemáticas hayan pasado de un 5 sobre 10 a más de un 13 sobre 14 en la última década. Y es que el mercado profesional sigue en expansión para quienes provienen de esta rama y oferta cada vez más puestos especializados para quien decide dedicarse a los datos. Veamos qué opciones hay, qué hace falta para llegar a ellas, y a qué se dedican a partir de un simple ejemplo para que todos nos entendamos: una frutería.

Data analyst

Un analista de datos (data analyst) responde al perfil de estudio y análisis de datos más generalista, que ejerce varias funciones: minería, obtención de datos, depuración, procesado, análisis, preparación de informes y visualizaciones. Se trata de un puesto que requiere formación en estadística, recopilación de datos, análisis exploratorio y programación. No obstante, no necesariamente trabajará con big data como tal, sino que puede dedicarse simplemente a gestionar datos, sin llevarlo a niveles macro.

Un analista de datos puede comprender, gestionar y resolver cuestiones de la empresa que requieran del tratamiento de datos o la creación de un panel de control que integre métricas, pero no sería la persona a la que demandar investigación sobre nuevos algoritmos o que encuentre información complicada que requiera de una gran agudeza y experiencia. Por ejemplo, un analista de datos puede tratar datos de ventas de una frutería en los últimos seis meses y tratar de diseñar la mejor estrategia de ventas en cuanto a estocaje, volúmenes de compra, días de la semana, etc.

Sus herramientas cotidianas van desde Excel o el clásico programa estadístico SPSS hasta Microsoft Access, SAS y SAS Miner, bases de datos en SQL o visualizaciones en Tableau. Los lenguajes de programación más habituales son Python y R en la mayoría de casos.

Data scientist

El científico de datos (data scientist) bien podría considerarse una evolución del analista de datos con mayor experiencia que puede utilizar datos sin procesar, incluso de múltiples fuentes independientes, y enfocarse en la predicción gracias al uso de los datos. Esta figura es capaz de diseñar nuevos algoritmos y, esta vez sí, tratar con big data.

Por ejemplo, un científico de datos podrá recopilar información de las ventas de frutas de los últimos diez años, de la producción frutícola de todo el mundo y de los indicadores económicos del país para ver de qué forma se podría optimizar el negocio de venta de frutas, qué problemas hay actualmente (aunque no resulten evidentes) y qué tendencias de consumo se consolidarán en el futuro. De esa forma puede aconsejar la mejor forma de gestionar la oferta comercial, de maximizar el beneficio y de anticiparse al resto ofreciendo, por ejemplo, una fruta tropical como la pitahaya antes de que se convierta en la última obsesión de Instagram, o sugiriendo cambiar de proveedor en base a lo que dicen los datos, aunque hasta ahora no se hubiese planteado esa necesidad.

Los científicos de datos son más comunes en grandes empresas y rara vez tendrán acomodo en una pyme. Deben manejar herramientas y librerías de machine learning y deep learning para la construcción de modelos predictivos, además de SQL, R, y Python, así como SAS Enterprise Miner o Hadoop entre otras.

Data architect

Un arquitecto de datos (data architect) se encarga fundamentalmente de recopilar los datos crudos, sin procesar, de distintas fuentes, ya sean internas (propias de la empresa a través de un CRM, un panel de analítica de la web, un panel de ventas, etc.) o externas (cotizaciones bursátiles de un sector, informes de ventas de toda la industria, etc.).

También es su cometido diseñar la infraestructura que los unifique en una base de datos, así como la elección acertada de qué fuentes de datos tener en cuenta. Su papel, que requiere un perfil sénior, es el de quien toma decisiones que otros (concretamente los ingenieros de datos) ejecutarán. En el ejemplo que nos ocupa, será quien decida qué métricas deben tomarse en consideración, tanto de la frutería como de cualquier elemento externo (producción anual en nuestro país y en otros países, consumo por persona de cada tipo de fruta, evolución del IPC y de los salarios, etc.), para incluirlas en bases de datos que otros compañeros podrán analizar.

En este caso, la formación ha de combinar varias disciplinas: el data architect no solo tendrá conocimientos de estadística, base de datos y gestión, sino también de marketing y economía. Es quien ve el negocio desde un punto de vista más alejado, como parte de un ecosistema donde entran más actores en juego.

Data engineer

El ingeniero de datos (data engineer) es también un perfil más experimentado y avanzado que el analista de datos. Su perfil es mucho más técnico y requiere, además de las aptitudes que se esperan en un analista de datos, de capacidad de creación e integración de API (integraciones entre dos software distintos sujetas a una serie de reglas o limitaciones). También debe tener un gran conocimiento de bases de datos SQL, aprendizaje automático y programación avanzada.

Es quien desarrolla las soluciones e infraestructuras que a menudo diseña el arquitecto de datos, motivo por el cual es común ver a ingenieros informáticos en este puesto. Ha de ser experto en Hadoop, scripting, arquitectura de datos, SQL / NoSQL y programación. En nuestra empresa de fruta, sería quien construye el panel o las aplicaciones que demanda el arquitecto de datos para que otros expertos en datos puedan analizar la información que estas proporcionan.

Chief Data Officer

El director de datos (Chief Data Officer o CDO) es la figura más destacada en la empresa en cuanto a datos. Se encarga de desarrollar la estrategia para su uso por parte de todos los demás puestos relacionados. Su trabajo vuela a más altura que el del resto, ya que toma decisiones y adopta un rol más cercano al de un gerente que al de alguien que hace trabajo de campo, como la mayoría de los anteriores. Piensa en clave de tecnología, negocio y seguridad, ya que entiende los datos como un activo de la empresa y define las políticas de custodia de los mismos, por lo que también deberá tener los ojos puestos en las regulaciones nacionales y europeas sobre ello.

Ha de tener una gran experiencia en puestos relacionados con los datos, por lo que su formación ha de ser profunda en matemáticas, estadística, y programación, e incluso tener nociones de economía o marketing para ser capaz de ver con mayor perspectiva el papel de los datos en la empresa.

En empresas más pequeñas, este cargo no existirá, o a lo sumo, su papel será adoptado por el analista de datos, en función del conocimiento de este campo que tenga su superior, o del director de negocio o del director de las TIC (tecnologías de la información y de la comunicación). A medida que la empresa crezca, contará con un director de datos con recorrido en la empresa y la suficiente experiencia para la toma de decisiones y la comunicación con el resto de equipos, y de hecho será uno de los miembros mejor pagados de la compañía.

Si has estudiado matemáticas, estadística y programación, tienes bases más que suficientes para dedicarte a uno de estos oficios. Lo más natural en una posición inicial será comenzar en un puesto como el de analista de datos, enfocado en analizar los datos del pasado y extraer conclusiones en base a ellos. Con el paso del tiempo y el aumento de la experiencia ya podrás elegir hacia qué rama orientarte para progresar, hacia un perfil capaz de hacer predicciones como el del científico de datos; hacia uno que se encargue de escoger entre múltiples fuentes de datos, como el arquitecto de datos; hacia otro más ejecutor que prepare las infraestructuras como es el ingeniero de datos; o a algo más alejado en el horizonte y más ambicioso, como el director de datos.

Foto de WTTJ

Sigue a Welcome to the Jungle en Facebook, LinkedIn, Instagram o Twitter y suscríbete a nuestra newsletter para recibir nuestros últimos artículos.

Hledáte svou další pracovní příležitost?

Více než 200 000 kandidátů našlo práci s Welcome to the Jungle

Prozkoumat pracovní místa