Cet ouvrage est destiné à tous les collaborateurs chargés d’exploiter des données au sein de l’entreprise, qu’ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Il a pour but de faciliter l’acquisition des compétences nécessaires à la mise en place d’un data lab. L’ouvrage commence par présenter les notions théoriques (traitement statistique des données, calcul distribué…) et les outils à mettre en œuvre notamment les distributions Hadoop, Storm… Des exemples de « machine learning » et d’une organisation typique d’un projet de data science complètent l’ouvrage.

Pirmin Lemberger, Marc Batty, Médéric Morel et Jean-Luc Raffaëlli, Éditions Dunod, 240 pages, 29,90 €