Accueil It-Business Comment nourrir un data scientist

Comment nourrir un data scientist

Anonim

Parmi les startups technologiques, data scientist est un terme de plus en plus utilisé pour désigner les data geeks capables de combler des domaines fonctionnels traditionnellement séparés de l'intelligence des données. Un data scientist est quelqu'un qui est à l'aise pour exécuter plusieurs (sinon tous) les aspects des projets de data intelligence:

  1. Acquisition de données: cela peut impliquer l'écriture d'analyseurs et de robots d'indexation personnalisés ou de scripts qui ciblent des services Web ou des API spécifiques pour des sources de données non traditionnelles.
  2. Gestion des données: ETL, manipuler, interroger et maintenir des données dans des bases de données, des magasins de valeurs-clés ou Hadoop.
  3. Visualisation de l'information: découvrir des modèles grâce à l'utilisation de boîtes à outils de visualisation statique et / ou de plateformes interactives basées sur Flash, JavaScript ou Processing.
  4. Analytics: cela peut aller de techniques simples à complexes en statistiques multivariées, en apprentissage automatique et en PNL.
  5. Insight: Extraire, résumer et présenter les principales conclusions à un large public.

Il existe de nombreux outils, compétences et détails techniques, et on peut passer des années à maîtriser chacun des éléments énumérés ci-dessus. Bien qu'un scientifique des données puisse ne pas posséder de véritables connaissances spécialisées dans aucun des domaines, il ou elle est à l'aise de sauter d'avant en arrière et d'effectuer des tâches de base dans chacun d'eux. Le résultat est un geek de données suffisamment agile pour enquêter rapidement sur un projet de données et produire des réponses aux questions (de haut niveau) de la direction. (sur les scientifiques des données dans Data Scientists: The New Rock Stars of the Tech World.)

Pour nourrir les scientifiques des données, les entreprises doivent se concentrer davantage sur la culture et la structure organisationnelle. De nombreux travailleurs des données ont suffisamment de compétences et de formation pour devenir rapidement productifs dans plusieurs domaines de l'intelligence des données. Le problème est que la plupart ne travaillent pas dans des environnements qui les encouragent à devenir des scientifiques des données. Ils sont coincés dans des silos et limités à un ou deux domaines de l'intelligence des données. Souvent, ils sont limités à utiliser des outils "approuvés" par leurs responsables.

Comment nourrir un data scientist