Data Scientist et langage R Exploitation intelligente des Big Data (2e édition)
Tous les experts s'accordent à dire que 90% des usages du Big
Data proviennent de l'utilisation des data sciences et que celles-ci contribuent
à l'essor de l'Intelligence Artificielle. L'objectif de ce livre est de
proposer une formation
complète et opérationnelle sur les data sciences qui permet de
délivrer des solutions
via l'usage du langage R.
Ainsi, les auteurs proposent un parcours didactique et professionnalisant qui,
sans autre pré-requis qu'un niveau Bac en mathématiques et une grande
curiosité, permet au lecteur :
- de s'intégrer à une équipe de data scientists,
- d'aborder la lecture d'articles de recherche en IA ou data sciences,
- le cas échéant de développer en langage R, y compris ses propres
algorithmes, des graphiques complexes et des tableaux de bord interactifs,
- ou tout simplement de manager une équipe projet comprenant des
data scientists, en étant à même de dialoguer avec eux de façon efficace.
Le livre ne se cantonne pas aux algorithmes classiques du "machine
learning" (arbres
de décision, réseaux neuronaux…), il aborde divers sujets
importants comme le traitement
du langage naturel, les séries
temporelles, la logique
floue, la manipulation
des images.
Avec cette nouvelle édition, le livre s'enrichit de nouveaux sujets comme le
développement full-stack
avec R (bases de données, processus parallèles, programmation fonctionnelle,
API), le partage de résultats d'analyse avec R Markdown et les dashboard Shiny,
l'étude des représentations
cartographiques et l'implémentation de graphes Deep Learning
avec TensorFlow.
La dynamique de l'ouvrage soutient le lecteur pas à pas dans sa découverte des data sciences
et l'évolution de ses compétences théoriques et pratiques. Le praticien en
exercice y découvrira également de nombreux
savoir-faire à acquérir et le manager pourra surfer sur
l'ouvrage après avoir lu attentivement le bestiaire des data sciences de
l'introduction, qui sans vulgarisation excessive présente le sujet en faisant
l'économie de mathématiques ou de formalismes dissuasifs.
Les programmes R décrits dans le livre sont accessibles en téléchargement
sur cette page et peuvent être exécutés pas à pas.
Les chapitres du livre :
Introduction – Premiers pas avec R – Maîtriser les bases – Techniques et
algorithmes incontournables – Cadre méthodologique du data scientist –
Traitement du langage naturel – Graphes et réseaux – Autres problèmes, autres
solutions – Feature Engineering – Compléments utiles – Full Stack R – Partager
ses analyses – Cartographie – TensorFlow – Annexes – Conclusion
Henri LAUDE - Eva LAUDE Henri LAUDE est
un professionnel reconnu des Computer Sciences. Il a encadré de nombreux
travaux de R&D autour des data sciences, connexes à l'intelligence
économique, à l'IA, aux FinTech, à la détection de fraudes et à la
cyberdéfense. Président de l'APIEC (Association pour la Promotion de
l'Intelligence Economique), il est co-fondateur de la startup Advanced
Research Partners, où il anime la conception d'algorithmes très novateurs primés au Data Intelligence Forum sous
le nom DxM (pour Deus eX Machina). Il est également Chief Data Scientist des
startups ExorIAr (un exosquelette robotique intelligent), SysScale (un
écosystème complet de développement digital/devops/IA) et du Laboratoire de
Data Sciences StradaLabs (Intelligence Artificielle et IOT pour les
transporteurs et logisticiens). |
