Stochastic Control

Assignments
Assignment 8

Course Outline
Stochastic Optimization
MDPs
POMDPs
Approx DP
Risk sensitive MDPs
Linear systems
Stochastic Approximation
- 36 Stochastic approximation
- 37 Rate of convergence for stochastic approximation
RL
- 38 The learning setup
- 39 Q-Learning
Dec-POMDPs
- 40 Designer’s Approach
Analysis Appendix
- 41 Convergence of sequences
- 42 Inequalities
Probability Appendix
Linear Algebra Appendix
Convexity Appendix
- 57 Convex sets and convex functions
- 58 Convex Duality
References
Assignments

Assignments
Assignment 8

Assignment 8

Author

Affiliation

McGill University

Updated

July 15, 2026

Exercise 16.2 from the notes on MDP algorithms.

59 Grading rubric for the report

Edit this page