Solving infinite-horizon POMDPs with memoryless stochastic policies in state-action space

Published in 5th Multi-disciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2022), 2022

Recommended citation: Johannes Müller, Guido Montúfar. Solving infinite-horizon POMDPs with memoryless stochastic policies in state-action space. 5th Multi-disciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2022) (2022). https://arxiv.org/abs/2205.14098