in

La entrevista con el científico de datos de Twitter

La entrevista con el científico de datos de Twitter

TPreguntas de la entrevista de Witter Data Science

Jay Feng

15 de enero de 2020·6 min de lectura

Entrevistas en Twitter

Twitter es conocido por sus noticias y debates y ostenta el título de SMS del mundo. Creado en 2006 por Jack Dorsey, Noah Glass, Evan Williams y Biz Stone, ha crecido hasta tener más de 321 millones de usuarios activos por mes, así como 1.600 millones de consultas de búsqueda por día.

Aparte de ser uno de los mayores compañeros tecnológicosIes, Twitter también tiene uno de los los conjuntos de datos en tiempo real más grandes del mundo. Para administrar cantidades tan grandes de datos, Twitter cuenta con equipos de análisis y ciencia de datos dedicados que emplean herramientas avanzadas de análisis y aprendizaje automático para mejorar sus productos y funciones y ofrecer contenido más relevante en sus feeds.

¿Cuál es la función de la ciencia de datos?

El puesto de trabajo de científico de datos en Twitter se divide en ambos roles de científico de datos e investigación. Los roles de ciencia de datos de Twitter se adaptan específicamente a los equipos a los que están asignados. La función de ciencia de datos de cada Twitter también es diferente entre sí. Los roles de trabajo de científico de datos en Twitter dependen en gran medida de los equipos a los que están asignados en funciones o servicios específicos, y el rol puede abarcar desde roles basados ​​en análisis hasta diseño de modelos y construcción de sistemas pesados ​​de aprendizaje automático.

Habilidades requeridas

Como la mayoría de las grandes empresas de tecnología, Twitter prefiere contratar solo a personas capacitadas con un mínimo de más de 2 años (más de 5 años para científicos de datos senior) con algo de experiencia en infraestructura de datos o sistemas de back-end. Esto significa Tener experiencia en ingeniería o comprender los sistemas de datos es útil. a menos que el puesto sea específico de análisis.

Otras calificaciones básicas incluyen:

  • Licenciatura, maestría o doctorado en Ciencias de la Computación, Estadística, Matemáticas, Ingeniería u otras disciplinas cuantitativas.
  • Experiencia trabajando con / analizando grandes conjuntos de datos y arquitecturas Map Reduce como Hadoop y otros proyectos de minería de datos de código abierto y aprendizaje automático.
  • Amplia experiencia en el uso de lenguajes de programación numérica como Python, SQL, R, Sparks o Scalding para escribir flujos de datos complejos.
  • Gran conocimiento de uno o más de estos lenguajes de programación orientados a objetos Scala, C ++ o Java.
  • Competencia en el uso de Tableau o Zeppelin para análisis, modelado y visualización de datos.
  • Experiencia en la aplicación de técnicas estadísticas avanzadas para modelar el comportamiento del usuario, identificar el impacto causal y la atribución, construir y comparar métricas.

¿Cuáles son los tipos de científicos de datos en Twitter?

Twitter tiene un departamento de análisis y ciencia de datos con científicos de investigación y científicos de datos que trabajan en una amplia gama de equipos. Ya sea en el el equipo de heurística de cumplimiento escalado, el equipo de productos de consumo o el equipo de hogar y exploración, Los científicos de datos de estos equipos utilizan las herramientas de análisis y los modelos de aprendizaje automático más recientes y avanzados para proporcionar recomendaciones de impacto empresarial y mejorar los productos. Dependiendo de los equipos, la función laboral puede incluir lo siguiente:

  • Cree modelos estadísticos sofisticados que aprendan y escalen para transmitir datos.
  • Cree e interprete consultas SQL sofisticadas para funciones de minería de datos estándar e improvisadas.
  • Interpretar e influir en los procedimientos de crowdsourcing y de cálculo humano para el etiquetado de datos.
  • Asóciese estrechamente con equipos de productos e ingeniería para crear y evaluar hojas de ruta de productos basadas en datos.

El proceso de la entrevista

Momentos de Twitter. Intente usar la aplicación antes de cada entrevista.

La entrevista de ciencia de datos de Twitter está muy estandarizada. Generalmente, el proceso de entrevista comienza con una selección de llamadas telefónicas de reclutamiento que se basa en el currículum. Después de esto, hay una breve entrevista técnica con un gerente de contratación y luego una pantalla técnica con un científico de datos en Twitter. Finalmente, la última entrevista consistirá en una entrevista presencial de 5 a 6 entrevistadores.

Proyección de teléfono

La pantalla inicial del teléfono debe durar entre 10 y 30 minutos. Se le harán muchas preguntas que van desde habilidades técnicas hasta experiencia pasada, así como su conocimiento sobre Twitter. El reclutador también responderá preguntas y explicará cómo funcionan los equipos de ciencia de datos en Twitter mientras evalúa si su experiencia actual es un buen papel para el equipo de Twitter.

Proyección técnica

Después de la entrevista telefónica inicial, la siguiente ronda es una pantalla técnica con un científico de datos. Las preguntas de esta entrevista pueden involucrar la teoría del aprendizaje automático, intuición del producto con un enfoque en la experimentacióny codificación basada en SQL o Python. Asegúrese de estudiar cómo funciona el producto de Twitter y piense en preguntas relacionadas con cómo sacar resultados de las pruebas basadas en experimentos.

Ejemplos de preguntas de pantalla tecnológica:

  • ¿Qué funciones utilizaría para crear un algoritmo de recomendación para los usuarios de Twitter?
  • Digamos que queremos implementar un nuevo sistema de notificaciones push para ver si podemos retener a más usuarios. ¿Cómo haríamos esto?

Entrevista in situ

El proceso de entrevista in situ implica entrevistas individuales con 5 a 6 personas (generalmente científicos de datos e ingenieros de datos de Twitter) con una duración de 45 minutos cada uno. Esta entrevista requerirá codificación de pizarra, así como preguntas de algoritmo que pueden variar desde aprendizaje automático hasta estadísticas / probabilidad y preguntas basadas en productos.

  • Entrevista estadística y probabilística (principalmente estudio de caso)
  • Entrevista sobre aprendizaje automático y sistemas de modelado experimental
  • Intuición del producto (estudio de caso)
  • Entrevista sobre estructuras de datos y / o diseño de sistemas
  • Entrevista con un científico de datos durante el almuerzo.
  • Entrevista conductual que gira principalmente en torno a la experiencia previa y el ajuste cultural.

La entrevista in situ es una combinación de una amplia gama de conceptos técnicos. Estudie preguntas de diseño de pruebas A / B y experimentales, SQL, preguntas de aprendizaje automático y preguntas sobre el tipo de producto.

Pruebe la siguiente pregunta sobre ciencia de datos en Consulta de entrevista:

0*kZHrkd67XF5RGsTl

Digamos que queremos construir un recomendador ingenuo. Se nos dan dos tablas, una tabla llamada `amigos` con las columnas user_id y friend_id que representan a los amigos de cada usuario, y otra tabla llamada` page_likes` con un user_id y un page_id que representa la página que le gustó a cada usuario.

Escriba una consulta SQL para crear una métrica para recomendar páginas para cada usuario en función de las recomendaciones de las páginas que le gustaron a sus amigos.

Nota: No debería recomendar páginas que ya le gusten al usuario.

Ejemplos de preguntas de la entrevista sobre ciencia de datos de Twitter

  • ¿Qué cambiarías en la aplicación de Twitter? ¿Cómo probaría si el cambio propuesto es efectivo o no?
  • Diseñe un sistema para encontrar los diez mejores hashtags de Twitter en los últimos 1 minuto, 10 minutos y 1 hora.
  • ¿Cómo mediría la participación del usuario teniendo en cuenta todos los datos de seguimiento y análisis de Twitter?
  • Escriba una consulta en SQL para medir la cantidad de anuncios que se vieron en momentos en comparación con el suministro de noticias.
  • Dado un archivo de dos columnas con códigos de usuario y recuentos, recupere los primeros k usuarios en función de una puntuación que sea una función del número de veces que aparecen en el archivo y estos recuentos.
  • Dada una lista de todos los seguidores en formato: 123, 345; 234, 678; 345, 123; … donde la primera columna contiene el ID del seguidor, y la segunda es el ID de quién ha seguido, busque todos los seguimientos mutuos (par 123, 345 en el ejemplo anterior). Haga lo mismo en el caso, cuando esta lista no cabe en la memoria.
  • Si consiguiera el trabajo en Twitter y tuviera acceso a todos sus datos, ¿qué tipo de análisis de datos le gustaría realizar?
  • ¿Cómo se puede ilustrar un sistema basado en árboles con una consulta SQL?

Gracias por leer

  • ¿Está interesado en más preguntas de entrevistas de Twitter con las soluciones? Consulte las preguntas sobre Consulta de entrevista.
  • Echa un vistazo a mi canal de Youtube para obtener más trucos de entrevistas de ciencia de datos, consejos y ejemplos de entrevistas simuladas.
  • Si está interesado en más guías de ciencia de datos, consulte la Google entrevista de ciencia de datos, Facebook entrevista de ciencia de datos, y Snapchat preguntas de la entrevista de ciencia de datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

mensaje hangouts

¿Qué significa «Activo hoy» en Google Hangouts?

Notas de la versión de SQL Developer 20.4.1