De los Data Lakes a las plataformas de Machine Learning

AWS

El mercado de los datos evoluciona muy deprisa

Hasta hace poco, las plataformas de ingeniería de datos se dedicaban a procesar información y enrutar datos. Hoy, más de la mitad de nuestros clientes buscan una plataforma global que integre la capa de ciencia de datos con los Data Lakes y los pipeline de datos.

La industrialización de herramientas para científicos de datos e ingenieros de datos, para ayudarles a preparar modelos y ponerlos en producción, es ahora una fuerte tendencia del mercado.

Los Data Lake son ahora un activo cuyas mejores prácticas se conocen y dominan. La situación es diferente para la ciencia de datos, donde lo que podría considerarse el estado del arte aún no está consolidado. En estas plataformas, nuestro trabajo se sitúa entre el I+D y la industrialización. Nuestro objetivo es reconocer las mejores prácticas y aplicarlas en estas plataformas, además de ayudar a nuestros clientes a adoptarlas. Se trata de una fase de transición antes de una mayor industrialización.

Dentro de cinco años, las plataformas de operaciones de aprendizaje automático (ML Ops) se implementarán de forma automatizada en AWS; las prácticas se estandarizarán y ya no habrá incógnitas sobre «cómo hacerlo».

En este whitepaper te ofrecemos una visión general de los retos que plantean los datos:

  • Las mejores prácticas de los Data Lakes.
  • Aparición de ML Ops.
  • Comentarios sobre la experiencia de nuestros clientes: caso práctico del Olympique de Marsella.
  • Caso práctico de detección de anomalías.
  • Enfoque en la profesión de científico de datos

Descarga el whitepaper rellenando el formulario.

Si necesitas más información, no dudes en ponerte en contacto con nosotros.