Episode 02: Reinforcement Learning - Introduction

Episode 2 September 02, 2020 00:22:34
Episode 02: Reinforcement Learning - Introduction
Amlek.AI: ML & AI Podcast
Episode 02: Reinforcement Learning - Introduction
/

Hosted By

Ariel Munafo

Show Notes

בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

Episode Transcript

No transcript available...

Other Episodes

Episode 0

August 19, 2020 00:06:09

Episode 00: Who are we and what do we want?

זהו פרק מבוא קצרצר בו אנו מספרים מי הוא תמיר נווה ומי הוא אורי גורן, למה החלטנו להתחיל עם הפודקאסט, ומה היינו רוצים שיהיה בפרקים הבאים. ...

Listen

Episode 4

September 30, 2020 00:16:39

Episode 04: All Multi's

בפרק זה נדבר על כל ה-Multi's וננסה לעשות סדר במושגים שנוטים לבלבל: multi class classification, multi label classification, multi task learning, Multi objective, Multiple modality. נגדיר כל מושג, ניתן דוגמאות ונדון בסוגיות ומימושים סביב כל מושג. קישורים רלוונטיים: https://ruder.io/multi-task/ ...

Listen

Episode 8

November 25, 2020 00:23:57

Episode 8: הורדת מימדים

בפרק זה נדבר על הורדת מימדים - Dimensionality reduction. נעסוק במוטיבציות (קללת המימדים), ובאלגוריתמים PCA, T-SNE, AutoEncoders, SOM. קישורים רלוונטיים: https://onlinecourses.science.psu.edu/stat505/lesson/11 https://distill.pub/2016/misread-tsne/ ...

Listen