Q:
Quels sont les quatre fondements pour devenir un bon data scientist?
UNE:Comme le soulignent de nombreux experts, devenir un grand scientifique des données nécessite une combinaison de compétences et d'expérience acquise grâce à l'apprentissage et à l'analyse dédiés d'un domaine complexe. Les scientifiques des données en tant qu'administrateurs et conservateurs de ressources de données précieuses sont aujourd'hui très recherchés. Voyons ce que certaines de ces compétences fondamentales impliquent.
La première des quatre composantes fondamentales du travail de data scientist est la mathématique et la statistique. Les bons scientifiques des données devraient apprendre à maîtriser divers concepts mathématiques liés à l'apprentissage automatique supervisé et non supervisé, y compris les types d'algorithmes tels que les arbres de décision, la forêt aléatoire, la régression logistique, le clustering et l'utilisation de la dimensionnalité dans l'apprentissage automatique (ML). En général, ils devraient avoir une bonne maîtrise de l'utilisation des équations mathématiques et des statistiques à l'aide de ressources d'analyse statistique.
Le deuxième élément fondamental du travail en science des données concerne la programmation et la gestion des bases de données. Les individus doivent être forts dans les langages de script comme Python et les langages statistiques comme R, ainsi que l'expérience et les compétences en base de données et en sémantique SQL et en techniques opérationnelles. La connaissance des composants logiciels tels que Hadoop, MapReduce, Hive et Pig est également attrayante pour les employeurs.
La troisième composante fondamentale pour devenir un bon scientifique des données est la composante théorique et philosophique de la compréhension de la science des données et de l'apprentissage automatique. Ces individus devraient être des résolveurs de problèmes autonomes avec des esprits curieux - après tout, ils combinent une analyse quantitative brute avec une compréhension créative des processus d'apprentissage automatique et de science des données. Plutôt que d'être simplement des personnes techniques, ils devraient avoir une connaissance approfondie de ce que signifie créer des projets d'apprentissage automatique et travailler sur des initiatives de science des données en termes d'objectifs finaux et de résultats finaux.
Un quatrième pilier majeur pour apprendre à être un bon scientifique des données consiste à travailler avec les gens et à être en mesure d'utiliser les données de manière sensée pour les autres.
Les bons scientifiques des données peuvent être des conteurs - ils peuvent traduire des données quantitatives en récits et en idées. En tant que tels, ils devraient avoir de bonnes compétences en communication pour pouvoir apporter leur travail à la table et le diffuser efficacement auprès de plusieurs parties prenantes ou d'un public donné. Ce sont quelques-uns des principaux types de compétences qui construisent un bon scientifique des données qui est prêt à participer à l'industrie informatique en évolution rapide et en évolution rapide.