Científico de Datos: ¿Qúe es y qué hacen exactamente?

Cientificos de Datos- Que hacen

A principios de este año, un estudio de Glassdoor identificó el papel del científico de datos como el mejor trabajo en Estados Unidos, ofreciendo el salario medio más alto de todas las carreras.

Sin embargo, en el clima de negocios de hoy en día, dominar el aprendizaje automático, la inteligencia artificial y los algoritmos de perfeccionamiento pueden no ser suficientes. Se está solicitando a los científicos de datos que comuniquen de manera más efectiva sus hallazgos a los clientes, sus equipos y la suite C. En otras palabras, el arte de contar historias se está convirtiendo en una habilidad esencial para este subconjunto de científicos, e incluso se ofrecen cursos de educación continua para abordar las brechas.

Desafortunadamente, muchas empresas no logran un canal de comunicación claro entre los científicos de datos y los ejecutivos, lo que genera fricciones para ambas partes y para toda la organización. Igualmente preocupante, basado en encuestas con 64,000 desarrolladores, encontró que junto a los especialistas en aprendizaje automático, más científicos de datos están buscando un nuevo trabajo en comparación con otros profesionales.

Mientras el liderazgo ejecutivo considera lo que significa invertir en científicos de datos, primero es importante identificar qué hace exactamente un científico de datos. Además, si el trabajo es tan lucrativo, muchos líderes de negocios están ansiosos por saber: ¿Cómo pueden ayudar a dar forma al rol de científico de datos definido de manera holgada para que proporcione el mayor valor a la organización en este momento de recolección masiva de datos?

Un científico de datos, a grandes rasgos

Jennifer Hobbs, científica senior de datos para STATS, una compañía de datos deportivos, explicó que algunas compañías usan el título de trabajo de científico de datos como un todo. En realidad, las funciones son más detalladas, como analista de datos, ingeniero de datos o ingeniero de lenguaje.

«La ciencia de datos es un término demasiado amplio que puede significar cosas muy diferentes», dijo Hobbs. «Una de las cosas que les digo a las personas que buscan trabajo como científicos de datos es que realmente necesita leer la descripción del trabajo y ver qué herramientas están buscando. Puede variar ampliamente».

Sin embargo, muchas compañías esperan que los científicos de datos tengan una variedad de habilidades similares. Según Hobbs, la responsabilidad del científico de datos es usar los datos para dar sentido a amplios conjuntos de información, hacer recomendaciones y construir modelos para identificar y predecir los resultados y el comportamiento de los negocios. «Alguien viene a mí con un problema», explicó, «y puedo traducirlo en algo que se puede resolver con matemáticas y construir un modelo a su alrededor».

Es en este elemento de construcción de modelos donde la narración entra en juego. Sin embargo, contar una historia sin conectarlo a un resultado deseado, enfatizó, no la cortará. «La narración de historias analíticas, para la mayoría de las personas, no va a ser interesante, quieren saber por qué es importante», dijo. «Es crucial que comuniques la importancia y el valor de los modelos que estás construyendo».

Para Hobbs, mejores historias requieren mejores datos y análisis. Entonces, es cuestión de pintar un cuadro. Al igual que Hobbs, Rory Armes, CEO de Eight Solutions, trabaja con científicos de datos y los contrata, pero es escéptico acerca de sus habilidades narrativas. «El tipo que dirige nuestro grupo de ciencia de datos es simplemente brillante: es inteligente, muy articulado y me describe claramente qué es la ciencia de datos y qué está sucediendo», describió. «Pero me pierde en unos cinco minutos«.

Para combatir esta falla en la comunicación, Armes sugirió que los científicos de datos realicen visuales gráficos con información fácilmente digerible. Cuando esto falla, recomendó agregar una capa entre el científico de datos y el C-suite. En Eight Solutions, los líderes también confían en el software para cerrar esa brecha.

Armes describió una herramienta que actúa como un conector de datos, tomando datos de una fuente y decodificándolos en una forma que sea más legible para los científicos que no tienen datos. «Es como un traductor de Google para datos en bruto«, dijo. «Nos da un valor más rápido y es un buen traductor entre la gente de estadísticas y el C-Suite».

Y mientras el campo aún está en sus inicios, hay razones para creer que la inversión en los científicos de datos solo continuarán creciendo. «Nos damos cuenta de que [los científicos de datos] son ​​un animal diferente con habilidades muy específicas», dijo Armes. «Muchos no tendrán un verdadero conocimiento de la ciencia de la información, pero en última instancia, tendrá que contratar programadores para que creen los modelos de datos». Al ampliar sus criterios de búsqueda para incluir a los programadores (especialmente los de compañías de renombre), ha podido contratar más candidatos de calidad .

Para Hobbs, la inversión más inteligente comienza con el desarrollo de descripciones de trabajo más precisas que estén en línea con las responsabilidades diarias de los científicos de datos. «Los empleados comenzarán a darse cuenta de lo que les gusta», dijo. «Entonces, verás listados más específicos; la gente encontrará su nicho de esa manera ”. Con esta receta, predijo, habrá una implementación y satisfacción más fluidas tanto para el empleador como para el empleado científico de datos.

Pero primero, la estrategia de datos

Hobbs recomienda que las empresas eviten el error de pensar que los científicos de datos son la «cereza en la cima». En cambio, las empresas necesitan expandir sus esfuerzos de reclutamiento para centrarse en las funciones que abarcan su estrategia de datos, incluida la gestión de datos, implementación, desarrollo y operaciones (DevOps) permisos, monitoreo y construcción de interfaces.

«Debe tener claro el componente de creación de su modelo de datos: cómo lo distribuye, a quién lo distribuye y los tipos de productos que desea publicar», dijo. En su estimación, alrededor del 80 por ciento de los proyectos de ciencia de datos fracasan debido al alto grado de dificultad para alinear la estrategia de datos con la estrategia empresarial. Un estudio de Gartner fija la tasa de fracaso en cerca del 85 por ciento.

«La clave es pensar primero en la producción», dijo Hobbs. Las compañías deberían hacer preguntas, por ejemplo, ¿cuándo se implementará esto y cómo lo implementaremos? ¿De dónde vendrán los datos? ¿Qué desafíos inesperados podrían surgir? ¿Cómo interactuarán los usuarios con él? ¿Cómo monitorearemos el rendimiento del modelo? Y, ¿qué recursos necesitamos para construir esto?

Hobbs destacó a Netflix como una compañía enfocada en la construcción de herramientas que permiten a sus científicos de datos trabajar de manera más eficiente: «Creo que las compañías que tienen éxito se enfocan en integrar la ciencia de datos en toda su pila de tecnología».

Sin embargo, la ciencia de los datos es solo una parte del panorama de los grandes datos. Los ingenieros de datos, programadores e ingenieros de aprendizaje automático también tienen una gran demanda, y todo el equipo, desde arriba hacia abajo, debe tener claro cómo las organizaciones pueden incorporar la ciencia de datos en todos los departamentos y en toda la cultura de la empresa.

Para retener a las mejores personas y enriquecer el entorno laboral, Hobbs recomendó que las empresas ayuden a los científicos de datos a desarrollar trayectorias profesionales únicas y especializadas más allá de la organización. Sin embargo, para Hobbs, no importa qué tan bueno sea el equipo de ciencia de datos de una empresa o qué tan fuertes sean sus algoritmos si sus hallazgos no se comparten con el mundo.

«Si no puedes desplegar [la historia de los datos] en el mundo», dijo, «no te está haciendo ningún dinero».

About the Author: Dell Technologies