Ser científico de datos no consiste conocer uno, dos o tres lenguajes de programación. Se trata de tener y sacar provecho a una visión holística del mundo de los datos y de tu negocio. Al igual que nunca he recomendado ser experto en una herramienta de analítica web, tampoco se trata de ser el mayor experto en R.
- Un buen analista web (de datos, en definitiva) puede comenzar a explotar otro tipo de fuentes de información; uno malo, dudo mucho que consiga avanzar en su carrera profesional, ¿has evolucionado, aunque sea un poco, en estos años? ¿eres un buen analista digital?
- Más que centrarte en R, Python y/o SQL, me preocuparía mucho más por entender cómo funciona una base de datos. Estoy seguro que, en 2017, todavía hay muchos analistas digitales que no saben esto. Y se tiran el rollo bigdata.
- También aprendería, de forma conceptual, cómo funciona un lenguaje de programación. Desde la base, no aprendiendo un lenguaje concreto.
- Entonces sí, SQL, Python y quizás R. Por este orden.
- No dejes de formarte. Hay tres vías: bases de datos, programación y estadística.
- Data scientist, ¿ para qué?: No olvides el negocio al que te dedicas.
Coincido contigo en cuanto a que lenguajes, herramientas, etc son sólo el medio que usa el analista para lo que de verdad es su función.
Sin embargo pienso que el orden en el que debe formarse un analista depende en gran medida de la empresa en la que trabaja y más concretamente responsabilidades y funciones, nivel de acceso a los datos (los tiene que extraer o los pide a BI y se los hacen llegar…).
Si como en mi caso, no tienes que preocuparte de la BBDD sino únicamente solicitar lo que necesitas a BI, las prioridades pasan por saber como preparar los datos, modelarlos, evaluarlos y visualizar los resultados.
Como consecuencia de ello, para mi, las prioridades son estadística, R, Python (idealmente R+Python) y SQL sólo por si llegado el caso BI no puede suministrarme los datos.
Estoy seguro que otros analistas en otras empresas tendrán otras prioridades basadas en las particularidades de la empresa, puestos, etc.
Saludos,
jl
Hola Jose,
De acuerdo con lo que comentas. Sin embargo, hay que extraerse de trabajar en una empresa concreta. Hoy estás aquí, mañana allí.
Mis líneas iban dirigidas justamente a eso, a tener una visión más holística y menos ad hoc. Y te pongo un ejemplo: ¿qué pasa si un día BI no te quiere/no puede pasarte unos datos? ¿Serías capaz de sacártelos tú mismo? O, a la inversa, ¿qué pasaría si BI decide comenzar a modelizar y preparar los datos?
Ya sabes cómo funcionan las empresas: un día sois dos departamentos y al siguiente uno, un día tienes curro y al otro no, un día sale una oportunidad y tienes que estar listo para aprovecharla…
Abrazote grande,
Gracias por responder Fran.
Creo que no me expresé bien: no digo que SQL no sea importante, pero el core de un analista digital es el análisis de datos y extraer conclusiones para dar recomendaciones que mejoren los resultados de la empresa. Y para ello, si se quiere hacer bien hay tirar de estadística (y por ende R).
No se trata de ser el mayor experto pero si de saber como cargar, transformar, analizar y visualizar datos en R sabiendo y para ello hay que saber lo que son cosas como las regresiones, ANOVA y ANCOVA, k-means.
Te dejo un post que creo es interesante respecto a este tema: https://www.linkedin.com/pulse/should-digital-analysts-become-more-data-scientific-y-tim-wilson
Mencionabas la amenaza de que BI comenzara a modelar, pero que me dices de la amenaza para el analista tradicional que proviene del hecho de que las herramientas de analítica web (G y AA principalmente) sean cada vez más fáciles de utilizar?
La democratización del análisis web es una amenaza para aquellos analistas digitales que no aporten un plus en los análisis. No te parece?
Saludos,
jl
En lo único que no estamos de acuerdo es en el punto de que el analista sólo analiza; mi visión es más amplia: el analista debe saber valorar diferentes fuentes de datos, dimensionar su valor, ser capaz de explotar esa información esté donde esté, analizarla y convertirla en conocimiento para llevarla al resto de la empresa. En mi opinión, ojo.
De acuerdo en que ser analista digital ahora es más fácil que antes pero, por eso mismo: ¿no llegará el momento que las herramientas ofrecerán análisis avanzados de forma más fácil? Lo que una herramienta no podrá hacer es lo que te comento más arriba; o lo hará peor que un humano. Siempre.
Gracias por comentar, que no lo puse en el anterior comentario.
Abrazote,
Buf! Has tocado mi tema y no se por donde empezar. 🙂
Para mi un científico de datos es una persona con conocimientos en varios campos. No entiendo al científico de datos como alguien que sólo conoce una o dos de ellos, sino que debe tener conocimientos en todos ellos, aunque lógicamente podrá destacar o sentirse más cómodos en determinados aspectos:
(No en orden de importancia)
1. Programador. Si no te desenvuelves en alguno de los lenguajes propios de DS, puedes olvidarte de determinadas tareas complejas, como desarrollar aplicaciones, apis o poner modelos es producción. R y/o python mandan.
2. Manejar datos. Tanto grandes como pequeños. Los datos vendrán sucios, en archivos excel intratables, de fuentes online, bases de datos, apis, etc. y habrá que torturarlos de diversas formas. Ya no es suficiente con saber Excel. Aquí de nuevo R o Python mandan. SQL, también es necesario, pero cada vez más es posible conectarse a una BD con R y extraer datos sin tener idea de SQL.
3. Conocer diversas tecnologías. No basta con R y Python. Muchas veces hay que recurrir a línea de comandos, a utilides del sistema operativo y combinar lenguajes y herramientas. Además, cada vez más nos movemos con arquitecturas Big Data y es necesario saber desenvolverse en esos entornos.
4. Modelador de datos. Si no tienes conocimientos estadística, no puedes ser un científico de datos. Así de claro. Se trata de tener claros los objetivos del proyecto y el modelo de negocio para saber cuál de las diversas técnicas de modelado pueden dar respuesta a tu pregunta, y, si existen varios métodos, cuál es el más adecuado o viable para su puesta en producción.
5. Visualizador. Debe ser creativo, dominar las herramientas de visualización con el fin de aprender de los datos e ir descubriendo caminos en una fase exploratoria y finalmente a la hora de comunicar sus resultados.
6. Comunicador. Y esta sí que es difícil. Si no sabes explicar lo que has hecho a alguien que no tiene ni idea de todo esto, todo tu esfuerzo será en vano. Y créeme, tratar de convencer a alguien de la potencia de tu descubrimiento, de un modelo, es complicado cuando el destinatario sólo entiende un gráfico de tartas y una media.
Desde mi punto de vista, y resumiendo, veo dos carencias que dificultan el salto de muchos analistas a científicos de datos:
– Falta de conocimientos de un lenguaje
– Falta de conocimientos estadísticos
Los más valientes son capaces de salir de su zona de comfort y pelearse con algo nuevo por que saben que es el futuro y además, muy divertido. Y conozco un@s cuant@s.
Desde luego, animo a todos los analistas a que realicen este esfuerzo. Vale la pena… y mucho!