¿Ser un ingeniero de datos en lugar de un científico de datos?

Solo quiero decir que si elige la ciencia de datos o la ingeniería de datos, en última instancia, debe depender de sus intereses y de dónde radica su pasión. Sin embargo, si no estás seguro de cuál elegir porque tienen el mismo interés, ¡sigue leyendo!

La ciencia de datos ha sido un tema importante durante un tiempo, pero ha llegado un nuevo rey de la jungla: los ingenieros de datos. En este artículo, voy a compartir con ustedes varias razones por las que es posible que desee considerar la ingeniería de datos en lugar de la ciencia de datos.

Tenga en cuenta que este ES un artículo con opiniones y tome lo que quiera de esto. Dicho esto, ¡espero que lo disfruten!

1. ¿La ingeniería de datos es fundamentalmente más importante que la ciencia de datos?

Todos hemos escuchado el dicho “basura entra, basura sale”, pero solo ahora las empresas están comenzando a comprender realmente el significado de esto. El aprendizaje automático y el aprendizaje profundo pueden ser poderosos, pero solo en circunstancias muy especiales. Aparte del hecho de que debe haber una cantidad sustancial de datos y un uso práctico para ML y DL, las empresas deben satisfacer la jerarquía de necesidades de datos de abajo hacia arriba.

Imagen creada por el autor

De la misma manera que tenemos necesidades físicas (es decir, alimentos y agua) antes que las necesidades sociales (es decir, la necesidad de relaciones), las empresas deben satisfacer varios requisitos que generalmente caen bajo el paraguas de la ingeniería de datos. Observe cómo la ciencia de datos, específicamente el aprendizaje automático y el aprendizaje profundo, son las últimas cosas que importan.

En pocas palabras, no puede haber ciencia de datos sin ingeniería de datos. La ingeniería de datos es la base de una empresa basada en datos de éxito.

2. La demanda de ingenieros de datos está creciendo … mucho.

Como dije anteriormente, las empresas se están dando cuenta de la necesidad de ingenieros de datos. Por lo tanto, existe una creciente demanda de ingenieros de datos en este momento y hay pruebas.

Según el informe de entrevistas de ciencia de datos de Interview Query , la cantidad de entrevistas de ciencia de datos solo creció en un 10% de 2019 a 2021, mientras que la cantidad de entrevistas de ingeniería de datos creció en un 40% en el mismo período de tiempo.

Además, Mihail Eric realizó un análisis sobre las ofertas de trabajo de Y-Combinator y descubrió que había aproximadamente un 70% más de roles de ingeniería de datos para contratar que de científicos de datos .

Quizás se esté preguntando, “seguro que el crecimiento es mucho mayor, pero ¿qué pasa en términos de números absolutos?”

Me tomé la libertad de rastrear en la web todas las ofertas de trabajo de Data Scientist e Data Engineer de Indeed, Monster y SimplyHired, ¡y descubrí que la cantidad de ofertas de trabajo es aproximadamente la misma para ambos!

En general, hubo 16577 listados de trabajo de científico de datos y 16262 listados de trabajo de ingeniero de datos.

Imagen creada por el autor

3. Las habilidades de ingeniería de datos son extremadamente útiles como científico de datos.

En empresas más establecidas, el trabajo suele estar segregado para que los científicos de datos puedan centrarse en el trabajo de ciencia de datos y los ingenieros de datos puedan centrarse en el trabajo de ingeniería de datos.

Pero, en general, este no es el caso de la mayoría de las empresas. Yo diría que la mayoría de las empresas realmente requieren que sus científicos de datos conozcan cierta cantidad de habilidades en ingeniería de datos.

Muchos científicos de datos terminan requiriendo habilidades de ingeniería de datos.

También es increíblemente beneficioso conocer las habilidades de ingeniería de datos como científico de datos y le daré un ejemplo: si es un analista de negocios que no conoce SQL, tendrá que pedirle a un analista de datos que consulte información cada vez que lo haga, desea recopilar información, lo que crea un cuello de botella en su flujo de trabajo. Del mismo modo, si es un científico de datos sin el conocimiento fundamental de un ingeniero de datos, seguramente habrá ocasiones en las que tendrá que confiar en otra persona para arreglar una tubería ETL o limpiar datos en lugar de hacerlo por su cuenta.

4. ¿La ciencia de datos es más fácil de aprender que la ingeniería de datos?

En mi opinión, es mucho más fácil aprender ciencia de datos como ingeniero de datos que aprender habilidades de ingeniería de datos como científico de datos. ¿Por qué? Bueno, simplemente hay más recursos disponibles para la ciencia de datos, y hay una serie de herramientas y bibliotecas que se han creado para facilitar la ciencia de datos .

Entonces, si está comenzando su carrera, personalmente creo que vale más la pena invertir su tiempo en aprender ingeniería de datos que en ciencia de datos porque tiene más tiempo para invertir. Cuando tiene un trabajo de tiempo completo y un par de años en su carrera, es posible que descubra que no tiene la capacidad o la energía para invertir tanto tiempo en aprender. Entonces, desde esa perspectiva, creo que es mejor aprender primero el ámbito más difícil. Algunos cursos recomendados Data Science y Data Engineer.

5. Abarca un mercado de oportunidades sin explotar.

No estoy hablando solo de oportunidades laborales, sino de oportunidades para innovar y facilitar la ingeniería de datos con nuevas herramientas y metodologías.

Cuando la ciencia de datos se promocionó inicialmente, las personas encontraron varias barreras para aprender ciencia de datos, como el modelado de datos y la implementación de modelos. Posteriormente, surgieron empresas como PyCaret y Gradio para solucionar estos problemas.

Actualmente, nos encontramos en esa etapa inicial con la ingeniería de datos y preveo una serie de oportunidades para facilitar la ingeniería de datos.

¡Gracias por leer!

Si bien este es un artículo obstinado, espero que esto arroje un poco de luz sobre por qué es posible que desee ser ingeniero de datos. Quiero reiterar que si elige la ciencia de datos o la ingeniería de datos, en última instancia, debe depender de sus intereses y de dónde radica su pasión. Como siempre, ¡les deseo la mejor de las suertes en sus esfuerzos!

Referencia: https://towardsdatascience.com/why-you-should-consider-being-a-data-engineer-instead-of-a-data-scientist-2cf4e19dc019

Inicia hoy en Bootcamp AI: bootcampai.org

--

--

--

bootcampai.org

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Bootcamp AI

Bootcamp AI

bootcampai.org

More from Medium

Machine learning model partitioning for multi-tenant data in Python

SETTING UP AN EXPERIMENTATION DATA SCIENCE ENVIRONMENT IN AZURE

First dive into the data lake

If I can do ML in Spark, so can you!