Data Scientist et langage R Exploitation intelligente des Big Data (2e édition)

Tous les experts s'accordent à dire que 90% des usages du Big Data proviennent de l'utilisation des data sciences et que celles-ci contribuent à l'essor de l'Intelligence Artificielle. L'objectif de ce livre est de proposer une formation complète et opérationnelle sur les data sciences qui permet de délivrer des solutions via l'usage du langage R.

Ainsi, les auteurs proposent un parcours didactique et professionnalisant qui, sans autre pré-requis qu'un niveau Bac en mathématiques et une grande curiosité, permet au lecteur :

-  de s'intégrer à une équipe de data scientists,
-  d'aborder la lecture d'articles de recherche en IA ou data sciences,
-  le cas échéant de développer en langage R, y compris ses propres algorithmes, des graphiques complexes et des tableaux de bord interactifs,
-  ou tout simplement de manager une équipe projet comprenant des data scientists, en étant à même de dialoguer avec eux de façon efficace.

Le livre ne se cantonne pas aux algorithmes classiques du "machine learning" (arbres de décision, réseaux neuronaux…), il aborde divers sujets importants comme le traitement du langage naturel, les séries temporelles, la logique floue, la manipulation des images.

Avec cette nouvelle édition, le livre s'enrichit de nouveaux sujets comme le développement full-stack avec R (bases de données, processus parallèles, programmation fonctionnelle, API), le partage de résultats d'analyse avec R Markdown et les dashboard Shiny, l'étude des représentations cartographiques et l'implémentation de graphes Deep Learning avec TensorFlow.

La dynamique de l'ouvrage soutient le lecteur pas à pas dans sa découverte des data sciences et l'évolution de ses compétences théoriques et pratiques. Le praticien en exercice y découvrira également de nombreux savoir-faire à acquérir et le manager pourra surfer sur l'ouvrage après avoir lu attentivement le bestiaire des data sciences de l'introduction, qui sans vulgarisation excessive présente le sujet en faisant l'économie de mathématiques ou de formalismes dissuasifs.

Les programmes R décrits dans le livre sont accessibles en téléchargement sur cette page et peuvent être exécutés pas à pas.


Les chapitres du livre :
Introduction – Premiers pas avec R – Maîtriser les bases – Techniques et algorithmes incontournables – Cadre méthodologique du data scientistTraitement du langage naturel – Graphes et réseaux – Autres problèmes, autres solutions – Feature Engineering – Compléments utiles – Full Stack R – Partager ses analyses – Cartographie – TensorFlow – Annexes – Conclusion

Henri LAUDE - Eva LAUDE

Henri LAUDE est un professionnel reconnu des Computer Sciences. Il a encadré de nombreux travaux de R&D autour des data sciences, connexes à l'intelligence économique, à l'IA, aux FinTech, à la détection de fraudes et à la cyberdéfense. Président de l'APIEC (Association pour la Promotion de l'Intelligence Economique), il est co-fondateur de la startup Advanced Research Partners, où il anime la conception d'algorithmes très novateurs primés au Data Intelligence Forum sous le nom DxM (pour Deus eX Machina). Il est également Chief Data Scientist des startups ExorIAr (un exosquelette robotique intelligent), SysScale (un écosystème complet de développement digital/devops/IA) et du Laboratoire de Data Sciences StradaLabs (Intelligence Artificielle et IOT pour les transporteurs et logisticiens).

Eva LAUDE est consultante R&D Data Science chez BlueDsX, le laboratoire Big Data et Data sciences du groupe BlueSoft. Titulaire depuis 2015 d'une certification IBM professional (relative aux technologies Big Data), elle intervient au sein du laboratoire sur des sujets comme le criblage automatique de molécules pour identifier des composants actifs et aider la conception de nouveaux médicaments (High-Throughput-Screening) ou la recherche de patterns liés à la cybersécurité. En tant que chef de projet elle anime également des projets comportant une part de data sciences (marketing digital, CRM, réseaux sociaux, intelligence économique, gamification et IA). Geek et passionnée de R et de DataViz, elle n'hésite pas à partager ses connaissances au travers de nombreux tutoriels.