Déroulé

Partie 1 (Hélène Coullon)

Partie 2 (Guillaume Rosinosky)

  • [3h45] 11/02 matin
    • MapReduce et Spark Core
    • Spark SQL
  • [3h45] 17/02 aprem
    • Spark streaming
    • Kafka
  • Projets par 4/5
    • [3h45] 24/02 aprem
      • Quiz NoSQL (20 min)
    • [3h45] 03/03 aprem
    • [3h45] 10/03 aprem
    • [3h45] 17/03 aprem
      • Quiz Spark (20 min)

Evaluations

  • Oraux tutoriels NoSQL 24/03
  • Oraux projets + TA le 27/03

Consignes tutoriels NoSQL

Présenter un tutoriel à l’oral pendant 15 minutes.

6 sujets

  • REDIS (key-value store)
  • ClickHouse (columnar)
  • InfluxDB (time series)
  • Elasticsearch (search)
  • Milvus (Vector)
  • Sharding with MongoDB

Rendus

  • tutoriel conteneurisé
  • repo GitHub et README du tuto
  • utilisation d’un dataset dispo en ligne de votre choix
  • visualisation des données (si vous avez le temps)

Consignes projet Spark

à venir