Episode 02: Reinforcement Learning - Introduction

Episode 2 September 02, 2020 00:22:34
Episode 02: Reinforcement Learning - Introduction
Amlek.AI: ML & AI Podcast
Episode 02: Reinforcement Learning - Introduction

Sep 02 2020 | 00:22:34

/

Hosted By

Ariel Munafo

Show Notes

בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

Other Episodes

Episode 10

December 23, 2020 00:14:12
Episode Cover

Episode 10: Fourier Transform - אינטרו לפורייה

בפרק זה, נשוחח על מהי התמרת פורייה. מוטיבציות, שימושים, Time Series והקשר ללמידה עמוקה.קישורים רלוונטיים:  But what is the Fourier Transform? A visual introduction...

Listen

Episode 1

August 19, 2020 00:21:00
Episode Cover

Episode 01: The Lottery Ticket Hypothesis

בפרק זה, נעסוק ב-Neural Network Pruning, כאשר נתקמד בפרט במאמר פורץ דרך מ2019, שנקרא "THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE TRAINABLE NEURAL NETWORKS", מבית...

Listen

Episode 12

January 19, 2021 00:15:13
Episode Cover

Episode 12: Gaussian process regression/ Kriging

בפרק זה נדבר על שיטת רגרסיה, שנקראת Kriging או Gaussian process regression - שיטה בייסיאנית שהחלה במטרה לאתר מכרות זהב. נדבר על מושגי מבוא,...

Listen