Episode 02: Reinforcement Learning - Introduction

Episode 2 September 02, 2020 00:22:34
Episode 02: Reinforcement Learning - Introduction
Amlek.AI: ML & AI Podcast
Episode 02: Reinforcement Learning - Introduction

Sep 02 2020 | 00:22:34

/

Hosted By

Ariel Munafo

Show Notes

בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

Other Episodes

Episode 16

March 16, 2021 00:15:47
Episode Cover

Episode 16: GAN - Generative Adversarial Networks

בפרק זה, נדבר על מודלים ג'נרטיביים, ובפרט על מהפכת ה-GAN=Generative Adversarial Networks. איך עובד הקסם? תחרות בין מודלים - האחד שמזייף, והשני שמגלה זיופים....

Listen

Episode 15

March 02, 2021 00:19:31
Episode Cover

Episode 15: Transformers - האבולוציה של ניתוח סדרות בזמן

בפרק זה, נסקור את ההשתלשלות של ניתוח סדרות בזמן החל מ-RNN, דרך Attention Models ועד ל-Transformers.נדבר על Self Attention, Multi Headed Attention, LSTM, RNN,...

Listen

Episode 9

December 09, 2020 00:18:06
Episode Cover

Episode 9: Adversarial Training - איך לבלבל מודלים?

בפרק זה, נדבר על Adversarial Attacks, על איך מייצרים Adversarial Examples בשיטת FGSM, על התקפות White or Black box models ונזכיר Certifiable Robustness. FGSM...

Listen