یادگیری تقویتی یا Reinforcement Learning و کاربردهایش چیست؟
یادگیری تقویتی چه محدودیتهایی دارد؟ کارایی نمونه (Sample Efficiency): الگوریتمهای RL معمولاً به مقدار قابل توجهی از تعامل با محیط برای یادگیری سیاستهای بهینه نیاز دارند و از نظر محاسباتی گران و وقتگیر هستند.