Episode 02: Reinforcement Learning - Introduction

Episode 2 September 02, 2020 00:22:34
Episode 02: Reinforcement Learning - Introduction
Amlek.AI: ML & AI Podcast
Episode 02: Reinforcement Learning - Introduction
/

Hosted By

Ariel Munafo

Show Notes

בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.
נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.

קישורים שהוזכרו:

שיתוף פעולה בין סוכנים במשחק המחבואים

שיתוף פעולה בין סוכנים במשחק תפוס את הדגל

סדרת הרצאות של David Silver

Agent57 - מודל אחד שמשחק ברמה אנושית ב 57 משחקים

BRETT- הרובוט שמרכיב לגו

MuJoCo מנוע המדמה את חוקי הפיסיקה

Episode Transcript

No transcript available...

Other Episodes

Episode 17

April 07, 2021 00:16:22
Episode Cover

Episode 17: Models Discrimination

בפרק זה, נארח את אופיר יוקטן - שמתעסק בניבוי התאמה של קורות חיים. אופיר יציג כיצד הוא מתמודד עם מודלים מפלים על רקע מגדרי\גזעני. נעסוק בשיטות להתמודדות עם הבעיה הזו: העלמת או הינדוס פיצ'רים, אימון עם Database מאוזן, ושיטת Gradient reversal layer. קישורים:  "What is Adverse Impact? And Why Measuring It Matters." 26 Mar. 2018, https://www.hirevue.com/blog/hiring/what-is-adverse-impact-and-why-measuring-it-matters. Accessed 15 Dec. 2020.  "Bias in Natural Language Processing (NLP): A Dangerous But ...." 1 Sep. 2020, https://towardsdatascience.com/bias-in-natural-language-processing-nlp-a-dangerous-but-fixable-problem-7d01a12cf0f7. Accessed 15 Dec. 2020.  "Adversarial Removal of Demographic Attributes from Text Data." 20 Aug. 2018, https://arxiv.org/abs/1808.06640.  "Unsupervised Domain Adaptation by Backpropagation." 26 Sep. 2014, https://arxiv.org/abs/1409.7495.  ...

Listen

Episode 0

August 19, 2020 00:06:09
Episode Cover

Episode 00: Who are we and what do we want?

זהו פרק מבוא קצרצר בו אנו מספרים מי הוא תמיר נווה ומי הוא אורי גורן, למה החלטנו להתחיל עם הפודקאסט, ומה היינו רוצים שיהיה בפרקים הבאים. ...

Listen

Episode 10

December 23, 2020 00:14:12
Episode Cover

Episode 10: Fourier Transform - אינטרו לפורייה

בפרק זה, נשוחח על מהי התמרת פורייה. מוטיבציות, שימושים, Time Series והקשר ללמידה עמוקה.קישורים רלוונטיים:  But what is the Fourier Transform? A visual introduction Fourier Convolutional Neural Networks ...

Listen