All content for Amlek.AI: ML & AI Podcast is the property of Marketech and is served directly from their servers
with no modification, redirects, or rehosting. The podcast is not affiliated with or endorsed by Podjoint in any way.
בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.
קישורים שהוזכרו:
שיתוף פעולה בין סוכנים במשחק המחבואים
שיתוף פעולה בין סוכנים במשחק תפוס את הדגל
סדרת הרצאות של David Silver
Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים
BRETT- הרובוט שמרכיב לגו
MuJoCo מנוע המדמה את חוקי הפיסיקה