in

Cómo elegir la carrera adecuada en el mundo de los datos

0YbHZHZZ4u63W 4VN
Foto de Cory Woodward en Unsplash

Horas de oficina

Cómo elegir la carrera adecuada en el mundo de los datos

¿Científico de datos, analista de datos o ingeniero de datos? ¿Cómo saber cuál es el adecuado para usted?

Tessa Xie

Tessa Xie

23 de enero·7 min de lectura

No es ningún secreto que los ingenieros de datos, los científicos de datos y los analistas de datos son roles populares en los que muchas personas hoy en día están mirando y esperando participar. PWC describe los tres como «uno de los puestos más buscados en Estados Unidos», mientras que el científico de datos y el ingeniero de datos se encuentran en el puesto 3 y 8, respectivamente, entre los 15 puestos de trabajo emergentes principales en el Informe de trabajos emergentes de LinkedIn 2020.

Estos roles están muy estrechamente relacionados to mutuamente; de hecho, muchas empresas podrían incluso utilizar los términos indistintamente. Entonces, si está pensando en ingresar al mundo de los datos, elegir el rol adecuado puede parecer una tarea desalentadora que conlleva muchas preguntas: ¿Puedo convertirme en un científico de datos sin un doctorado? ¿Necesito saber Python o R si quiero ser analista de datos? Como persona que solía trabajar como científico de datos, actualmente trabaja como analista de datos y ha trabajado en estrecha colaboración con muchos ingenieros de datos en ambos trabajos, intentaré desglosar las diferencias y señalarle los recursos adecuados. para cada.

Descripción general: superposición y diferencias de alto nivel

Si separamos aproximadamente a las empresas en dos lados, el de ingeniería y el de negocios, podemos usar el diagrama de Venn a continuación para ilustrar la relación y la superposición entre los roles y cada lado de la empresa. Tenga en cuenta que esta distinción se aplica a la mayoría de las empresas medianas y grandes; sin embargo, en las pequeñas empresas emergentes, las líneas entre estos roles se vuelven borrosas; muy a menudo los roles pueden ser un mezcla de los tres.

Imagen del autor

Ingeniero de datos es el más cercano al rol típico de ingeniero entre los tres, y el más alejado del lado comercial. Los ingenieros de datos dedican la mayor parte de su tiempo a diseñar, estructurar, construir y mantener bases de datos. La mayoría de las empresas tienen datos que provienen de muchas fuentes diferentes, tanto internas como externas; El trabajo de los ingenieros de datos es construir y mantener almacenes de datos para que los datos sean fácilmente accesibles y utilizables para el resto de la empresa. ¿Cómo se pueden unir las diferentes tablas de datos entre sí? ¿Cuál debería ser la clave principal para cada tabla? Estas son algunas de las decisiones de ejemplo que toman los ingenieros de datos en el trabajo. Los ingenieros de datos ocasionalmente colaboran con el lado comercial de la empresa para definir la estructura de las tablas, ya que los equipos comerciales suelen ser los usuarios finales de muchas de las tablas que construyen los ingenieros de datos.

Científico de datos es probablemente el puesto de trabajo más conocido y mencionado entre los tres. Un concepto erróneo sobre este rol es que debes tener un doctorado. en Machine Learning o un campo similar. Esto es cierto para un subgrupo de científicos de datos, los que se centran en el modelado y los algoritmos. Estos científicos de datos (~ 30% entre todos los científicos de datos de una empresa) suelen tener antecedentes académicos muy sólidos y altamente cuantitativos y tienen un amplio conocimiento teórico y experiencia práctica en temas avanzados de aprendizaje automático. Sin embargo, la mayoría (~ 70%) de los científicos de datos provienen de entornos más diversos. Dedican la mayor parte de su tiempo a realizar pruebas AB y análisis relacionados con diferentes métricas comerciales; es probable que los modelos que construyan sean para previsión de la demanda o análisis ad hoc en lugar de aprendizaje por refuerzo o redes neuronales profundas. Este artículo se referirá al último grupo al mencionar a los científicos de datos.

Analista de datos se usa indistintamente con Data Scientist en muchas empresas, ya que ambos grupos trabajan en estrecha colaboración con métricas y análisis ad hoc. Si se debe hacer una distinción, es probable que los analistas de datos trabajen más en las interpretaciones comerciales y la visualización de las métricas, mientras que los científicos de datos pasan mucho tiempo haciendo análisis estadísticos sobre ellas.

Superposiciones son comunes entre los tres roles. Todos los que han trabajado en proyectos de ciencia de datos saben que generalmente ~ 80% del tiempo se dedica a la limpieza de datos y la regresión o clasificación al final solo toma ~ 20%, si no menos. Por eso es tan importante que los científicos de datos y los analistas de datos trabajen en estrecha colaboración con los ingenieros de datos; pueden salvar a cualquiera de los datos incorrectos estructurando y limpiando los datos por adelantado antes de que se incluyan en las tablas.

Yo a los ingenieros de datos en cada proyecto (GIF de GIPHY)

Para ilustrar mejor cómo estos tres roles funcionan juntos, imagine una empresa que quiere implementar una prueba AB para una nueva función en su aplicación; Los científicos de datos liderarán el esfuerzo de dimensionando el experimento y decidir cómo dividir el grupo de control y el de prueba; Los ingenieros de datos configurarán la base de datos en segundo plano para asegurarse de que cuando se inicie la prueba AB, se registren la actividad y los eventos del usuario y los datos fluyen a la base de datos en el formato y estructura adecuados. Después del experimento, los científicos de datos y los analistas de datos realizarán Análisis estadístico en los resultados de la prueba AB y profundizar en algunas de las métricas que les interesan, así como crear visualizaciones para fines de informes.

Requerimientos técnicos

Cierto grado de habilidad de codificación es imprescindible para los tres, pero ¿exactamente qué lenguaje de programación y qué plataforma de análisis es imprescindible para cada uno?

GIF de GIPHY

Ingenieros de datos somos expertos en diferentes almacenes de datos y plataformas de computación en la nube, así como en cómo construir tuberías de datos de extracción / transformación / carga (ETL). Trabajan con AWS, Google Cloud, Snowflake y muchas otras herramientas para su trabajo diario. Los ingenieros de datos están familiarizados con SQL y Python, y algunos son buenos en C ++ y Java.

Científicos de datos poseen un profundo conocimiento estadístico y no son ajenos a SQL, R y Python. Un buen científico de datos también conoce, a un alto nivel, algunos algoritmos básicos de aprendizaje automático en teoría y también sabe cómo aplicarlos.

Analistas de datos son profesionales en SQL y tienen un nivel práctico de conocimiento estadístico. Saben cómo traducir rápidamente las preguntas comerciales en analíticas y cómo utilizar herramientas como Tableau y Looker para crear buenas visualizaciones.

Otras habilidades importantes

Saber cómo utilizar Google. En serio, sepa qué y cómo buscar en Google. Inevitablemente te quedarás atascado y cuando lo hagas, Google y StackOverflow serán tus amigos.

Aprendiendo en el trabajo. Esto está algo ligado al último punto. Mucha gente aprende en el trabajo buscando en Google o hablando con colegas de toda la empresa. Cada empresa tiene diferentes bases de datos y herramientas, diferentes culturas de datos (no siempre perfectas), flujos de trabajo y mejores prácticas; por lo que ser abierto y capaz de aprender constantemente en el trabajo es esencial para cualquier persona en la organización de datos de las empresas.

Gestión de los interesados. Todos los esfuerzos analíticos eventualmente se utilizarán para impulsar las decisiones comerciales. Por lo tanto, explicar los resultados y conceptos analíticos a las partes interesadas del negocio y relacionarlos con los resultados del negocio es una parte importante de la descripción del trabajo de los talentos de datos. Los buenos talentos de datos son aquellos que tienen suficiente conocimiento de análisis y al mismo tiempo poseen perspicacia comercial.

Entonces, ¿cómo sabes qué rol perseguir?

Para responder a esto, hay dos factores separados en juego: 1. ¿Qué quieres hacer? y 2. ¿Para qué roles califica según su experiencia y habilidades actuales?

¿Qué es lo que quieres hacer?

Los tres roles discutidos en este artículo tienen diversos grados de exposición al lado comercial, lo que significa que requieren diferentes niveles de gestión de las partes interesadas. O dicho de manera menos abstracta, más interacción humana y más reuniones de Zoom, lo que muchos de nosotros, los introvertidos analíticos, tememos. Pero, por otro lado, una mayor exposición comercial también significa un impacto y una exposición más tangibles / visibles para los tomadores de decisiones.

Quizás este experimento mental ayude: Piense en nuestro ejemplo de prueba AB; ¿Estaría usted más contento y satisfecho si lleva a cabo análisis estadísticos exhaustivos para tener en cuenta el sesgo en los grupos de control de prueba o si construye modelos para evitar que el efecto de red contamine los resultados de las pruebas AB (científicos de datos)? ¿O cuando pasa semanas codificando canalizaciones de datos y depurando, pero finalmente puede ver el flujo de datos en la base de datos cuidadosamente estructurada como por arte de magia (ingenieros de datos)? O tal vez cuando monitorea de cerca las métricas que ayudó a la empresa a definir y sabe que sus visualizaciones ayudaron a tomar la decisión cuando escuche a sus amigos hablar sobre la nueva función que tanto disfrutan en la aplicación (Analistas de datos).

¿Para qué rol calificas?

O, ¿para qué rol tiene tiempo para desarrollar las habilidades? Sin tener en cuenta los factores que no puede cambiar o compensar por años de experiencia (y, afortunadamente, la mayoría de los roles relacionados con los datos no tienen un requisito estricto de antecedentes o especialización en la escuela), la mayoría de las diferencias entre la descripción del trabajo y su currículum pueden estar compuesto por clases en línea y preparación para entrevistas (estaré escribiendo una publicación separada sobre cómo prepararme para las entrevistas para esos roles pronto, ¡así que estad atentos!). Varias semanas de clases en línea en SQL y R / Python básico y la práctica de estudios de casos al estilo McKinsey le ayudarán a pasar la sección de evaluación técnica y perspicacia comercial de la entrevista. Pero si desea estar equipado con suficiente conocimiento de programación y ETL para roles de ingeniero de datos, o si desea convertirse en un experto en áreas estadísticas y de modelado para roles de científico de datos más avanzados, podría llevarle meses o años.

Pero la buena noticia es que la mayoría de las empresas facilitan enormemente la transferencia entre diferentes roles de datos; y debido a lo transferible que es el conjunto de habilidades de datos, casi nunca puede encasillarse en la trayectoria profesional equivocada. Entonces … si realmente no tiene idea de qué rol desea, comience con cualquier rol relacionado con los datos, pruébelo y gire como una startup en una etapa temprana.

Tratando de averiguar mi lugar en el mundo de los datos como…. (GIF de GIPHY)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WkYsdqubhiNtek9inDnmc7 1200 80

Las mejores impresoras de gran formato de 2021: impresoras de gran formato para todos los presupuestos

Fragmentación de Oracle