یادگیری تقویتی

نگاهی (طولانی) به یادگیری تقویتی – بخش اول

چند خبر هیجان انگیز در زمینه هوش مصنوعی (AI) به تازگی در سال های اخیر اتفاق افتاده است. AlphaGo بهترین بازیکن حرفه ای انسان را در بازی Go شکست داد. خیلی زود الگوریتم توسعه یافته AlphaGo Zero بدون نظارت بر دانش بشری، AlphaGo را ۱۰۰-۰ شکست داد.