2 Art�culos

Learning State-Specific Action Masks for Reinforcement Learning

Acceso

en l�nea

Ziyi Wang, Xinran Li, Luoyang Sun, Haifeng Zhang, Hualin Liu and Jun Wang

Efficient yet sufficient exploration remains a critical challenge in reinforcement learning (RL), especially for Markov Decision Processes (MDPs) with vast action spaces. Previous approaches have commonly involved projecting the original action space int... ver m�s

Revista: Algorithms Formato: Electr�nico

Tabla de contenido: Vol: 17 Num: 0 Par: 2 A�o: 2024

« Anterior P�gina: 1 de 1 Siguiente »