Episode 02: Reinforcement Learning - Introduction

Episode 2 September 02, 2020 00:22:34
Episode 02: Reinforcement Learning - Introduction
Amlek.AI: ML & AI Podcast
Episode 02: Reinforcement Learning - Introduction

Sep 02 2020 | 00:22:34

/

Hosted By

Ariel Munafo

Show Notes

בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

Other Episodes

Episode 4

September 30, 2020 00:16:39
Episode Cover

Episode 04: All Multi's

בפרק זה נדבר על כל ה-Multi's וננסה לעשות סדר במושגים שנוטים לבלבל: multi class classification, multi label classification, multi task learning, Multi objective, Multiple...

Listen

Episode 8

November 25, 2020 00:23:57
Episode Cover

Episode 8: הורדת מימדים

בפרק זה נדבר על הורדת מימדים - Dimensionality reduction. נעסוק במוטיבציות (קללת המימדים), ובאלגוריתמים PCA, T-SNE, AutoEncoders, SOM. קישורים רלוונטיים: https://onlinecourses.science.psu.edu/stat505/lesson/11 https://distill.pub/2016/misread-tsne/

Listen

Episode 14

February 16, 2021 00:17:04
Episode Cover

Episode 14: Graph Neural Nets - שיכון גרפים

בפרק זה נארח את אלה בור, שתספר לנו על מהם גרפים (קשתות וצמתים), על בעיות המיוצגות ע"י גרפים ועל שיכון גרפים במרחב אוקלידי (GNN,...

Listen