LQR(線形システム・二次コスト)の設定で動的なシステムの確率分布を最適制御する問題の解を簡明な形で明らかにしました。現代制御論を勉強すれば出会うであろう基本的なLQRの設定でも、分布に関する制約が追加されると途端に複雑な問題になり、離散時間システムでの最適制御方策は私たちの
前作まで知られていませんでした。本論文はその前作の完全版という立ち位置です。細かな証明は正直ヘビーですが、得られた結果は通常のLQR同様、非常に美しいものだと思います。また本問題は最適輸送、拡散モデル、強化学習(最大エントロピー制御)と繋がりがあるトピックで、制御以外の分野の方にも拡がりのある内容になっていますので、是非この綺麗な結果だけでもご覧いただけると幸いです。