صفحه اصلی

هوش مصنوعی

فرایند تصمیم‌گیری مارکوف (MDP) و Value Iteration

فرایند تصمیم‌گیری مارکوف (MDP) و Value Iteration

استاد محمد انصاری

توضیحات

در آخرین جلسه (جلسه بیست ودوم) درس هوش مصنوعی استاد انصاری با عنوان «فرایند تصمیم‌گیری مارکوف (MDP) و Value Iteration»، مفاهیم مربوط به انجام تصمیم‌گیری‌های پیچیده تدریس می‌شود. سه مطلب مهم در این جلسه مورد بحث و بررسی قرار می‌گیرند: 1) فرایند تصمیم‌گیری مارکوف (MDP) 2) الگوریتم Value Iteration. در فصل سوم درس درباره نحوه حل مسائل جستجو و در فصل پنجم به مسائلی که در آنها با عامل‌های دیگر مواجه هستیم، پرداخته شد. در این جلسه به مسائلی پرداخته خواهدشد که در محیط‌های غیرقطعی تعریف می‌شوند و به مسائل تصمیم‌گیری ترتیبی معروف هستند که در آنها سودمندی عامل به دنباله‌ای از تصمیم‌ها بستگی دارد. در بخش اول این فصل این مسائل به طور دقیق تعریف شده و سپس الگوریتم‌هایی برای حل آنها معرفی خواهد گردید. ابتدا مسائل تصمیم گیری ترتیبی و مدل مارکوف (Markov Model) و فرایند تصمیم گیری مارکوف (MDP Markov decision Process) با چند مثال متعدد معرفی می‌شوند. سپس رسم درخت جستجو و بعد از آن حل مسائل MDP با چندین مثال مورد بحث و بررسی دقیق قرار می‌گیرند. در انتها الگوریتم Value Iteration با یک مثال شرح داده خواهد شد و بعد از آن یک تست مطرح و حل تشریحی آن ارائه خواهد شد.

هزینه دوره:

1,500,000 تومان600,000 تومان

هوش مصنوعی

مفاهیم اولیه هوش مصنوعی37 دقیقه

عامل‌های هوشمند157 دقیقه

حل مسئله به کمک جستجو - بخش یکم242 دقیقه

حل مسئله به کمک جستجو - بخش دوم160 دقیقه

حل مسئله به کمک جستجو - بخش سوم140 دقیقه

فراتر از جستجوهای کلاسیک198 دقیقه

جستجوهای تخاصمی و بازی‌ها204 دقیقه

ارضای محدودیت، جستجوی عقبگرد و انتشار محدودیت163 دقیقه

تعمیم سازگاری، عقبگرد کارا و ساختار گراف محدودیت158 دقیقه

عامل‌های مبتنی بر دانش و مفاهیم منطق و استنتاج218 دقیقه

الگوریتم‌های استنتاجی، ارضاپذیری و دنیای ومپس 124 دقیقه

منطق مرتبه اول167 دقیقه

استنتاج منطق مرتبه اول و ویژگی‌های زبان‌های بازنمایی159 دقیقه

برنامه‌نویسی منطقی و الگوریتم رزولوشن143 دقیقه

برنامه‌ریزی کلاسیک، زبان PDDL و گراف برنامه‌ریزی152 دقیقه

الگوریتم گراف‌پلن، مسئله ارضاپذیری و برنامه‌ریزی جزئی102 دقیقه

مفاهیم نظریه احتمال130 دقیقه

عدم قطعیت132 دقیقه

شبکه‌های بیز و یافتن استقلال‌های شرطی173 دقیقه

استنتاج‌های احتمالی کارا و تقریبی131 دقیقه

یادگیری ماشین، الگوریتم بیز ساده و درخت تصمیم170 دقیقه

فرایند تصمیم‌گیری مارکوف (MDP) و Value Iteration129 دقیقه