Aller au contenu principal

IFT-7201 Apprentissage par renforcement

Outils théoriques expliquant les raisons, les conditions et les garanties de fonctionnement d'un algorithme; formulation d'un problème réel (instance d'apprentissage par renforcement interactif); caractérisation empirique des algorithmes; environnements simples (Multi-Armed Bandit) communément utilisés pour aborder des problèmes d'apprentissage par renforcement interactif; algorithmes fondamentaux (Upper Confidence Bound, Thompson Sampling) permettant d'aborder le compromis exploration-exploitation en apprentissage par renforcement; utilisation efficace de l'information structurelle par la régression paramétrique ou non et par les réseaux de neurones; variantes dans les dynamiques des environnements et applications associées, y compris l'optimisation bayésienne; prise de décision séquentielle dans les processus de décision markoviens (MDP). L'étudiant qui a réussi le cours IFT-4201 ne peut s'inscrire à ce cours.

  • 3 Crédits

  • Cycles du cours

    • Deuxième cycle
    • Troisième cycle
  • Modes d'enseignement

    • Régulier
  • Cours pouvant être offert en formule hybride

Responsables

  • Faculté des sciences et de génie
  • Département d'informatique et de génie logiciel

Restrictions à l'inscription

Cycle d'études

Doit être inscrit à:

  • Deuxième cycle
  • Troisième cycle

Certaines sections de cours peuvent comporter des restrictions additionnelles.

Cours équivalents ou jumelés ULaval

Les cours équivalents sont des activités de même cycle dont le contenu est identique ou très semblable. La réussite de l'un entraîne la reconnaissance de l'autre. Si, à l’une des sessions indiquées, vous avez réussi un cours équivalent, vous n’avez pas à vous inscrire au cours présenté sur cette page. Le cours équivalent vous sera reconnu.

Les cours jumelés sont des activités de cycles différents. Si vous avez suivi un cours de 1er cycle de niveau 4000, vous ne pouvez pas suivre le cours correspondant de niveau 6000 ou 7000 si vous poursuivez des études au 2e ou au 3e cycle et vous ne pouvez pas demander à la direction de votre programme de le reconnaître.

Cette page constitue la description officielle de cette activité. L'Université Laval se réserve le droit de modifier l'activité sans préavis. Tous les horaires indiqués sont sujets à changement.

Répartition hebdomadaire

  • 3h Cours
  • 0h Laboratoire ou travaux pratiques
  • 6h Travail personnel
  • 9h Total

Horaire

Pour vous inscrire, accédez à monPortail.

Hiver 2025 – 1 section offerte

NRC 15939 Capacité maximale: 71 étudiants

Cette section de cours est offerte en formule hybride et combine des séances en présence dans un lieu physique commun et, selon le cas, des séances en ligne synchrones à une date et une heure précises ou des activités de formation en ligne qui se déroulent en temps différé.

Plages horaires

    • Type: Sur Internet
    • Dates: Du 13 jan. 2025 au 25 avr. 2025
    • Type: En classe
    • Dates: Du 13 jan. 2025 au 25 avr. 2025
    • Journée: Mardi
    • Horaire: De 9h30 à 12h20
    • Pavillon: Adrien-Pouliot

Automne 2023 – 1 section offerte

NRC 85790 Capacité maximale: 47 étudiants

La formation hybride combine, en proportion variable, des activités de formation offertes en présence physique des étudiants et de l’enseignant ainsi que des activités de formation à distance. La partie en ligne du cours se déroule sur monPortail. La partie en présentiel se déroule sur le campus de l’Université Laval à des jours, heures et locaux déterminés. Plus de détails seront fournis sur le plan de cours.

Plages horaires

    • Type: Sur Internet
    • Dates: Du 5 sept. 2023 au 15 déc. 2023
    • Type: En classe
    • Dates: Du 5 sept. 2023 au 15 déc. 2023
    • Journée: Jeudi
    • Horaire: De 9h30 à 12h20
    • Pavillon: Adrien-Pouliot