Transition-based versus state-based reward functions for MDPs with Value-at-Risk

Transition-based versus state-based reward functions for MDPs with Value-at-Risk | IEEE Conference Publication | IEEE Xplore