انواع روش های یادگیری ماشین
انواع روش های یادگیری ماشین
یادگیری ماشین زیرمجموعه ای از هوش مصنوعی است که به ماشین این امکان را می دهد تا به طور خودکار از داده ها یاد بگیرد، عملکرد خود را از تجربیات قبلی بهبود داده و پیش بینی مورد نظر را انجام دهد. یادگیری ماشین شامل مجموعهای از الگوریتمها است که این توانایی را دارند تا بر روی حجم عظیمی از دادهها کار کنند. مجموعه داده ها برای آموزش به این الگوریتم ها داده می شود و بر اساس یادگیری از این داده ها، مدلی را ساخته تا کار مورد نظر ما را انجام دهد.
یادگیری ماشین بر اساس روش ها و نحوه ی یادگیری، عمدتاً به سه نوع تقسیم می شود که عبارتند از:
یادگیری ماشین با نظارت
یادگیری ماشین بدون نظارت
یادگیری تقویتی
در این مطلب تنها به تشریح یادگیری ماشین با نظارت و یادگیری ماشین بدون نظارت خواهیم پرداخت:
1. یادگیری ماشین تحت نظارت
همانطور که از نام این روش پیداست، مبنای این روش بر اساس نظارت است. بدین معنا که در تکنیک یادگیری نظارت شده، ما ماشینها را با استفاده از مجموعه داده های “برچسبدار” آموزش میدهیم تا بر اساس این آموزش، ماشین خروجی مورد نیاز را پیشبینی نماید. دقیق تر اینکه ابتدا ماشین را با ورودی و خروجی مربوطه آموزش می دهیم و سپس از ماشین می خواهیم با استفاده از مجموعه داده آزمایشی خروجی را پیش بینی کند.
بیایید یادگیری تحت نظارت را با یک مثال بهتر درک کنیم. فرض کنید یک مجموعه داده از تصاویر متفاوت گربه و سگ داریم. ابتدا این تصاویر را به الگوریتم یادگیری ماشین وارد می کنیم و علاوه بر اصل تصاویر برای الگوریتم این را نیز مشخص می کنیم که هر یک از تصاویر عکس سگ است یا عکس گربه. به اطلاعاتی که در مورد محتوای هر تصویر (اینکه سگ است یا گربه) به الگوریتم می دهیم اصطلاحا برچسب داده ها گفته می شود. سپس الگوریم بر اساس ویژگی های داده ها یاد می گیرد که تصاویر سگ ها را از تصاویر گربه ها تشخیص دهد و پیش بینی مورد نیاز ما را انجام دهد. در مرحله بعد هنگامی که با یک تصویر جدید سگ یا گربه مواجه شود می تواند آن را از نظر نوع پیش بینی کند. نکته مهم اینکه هنگامی که ما علاوه بر داده های اصلی، برچسب داده ها را نیز به عنوان ورودی به الگوریتم می دهیم نوع یادگیری اصطلاحا یادگیری با نظارت است.
به طور کلی هدف روش با نظارت کشف رابطه بین داده های ورودی (X) و برچسب داده ها (Y) است.
برخی از کاربردهای واقعی یادگیری تحت نظارت عبارتند از: ارزیابی ریسک، تشخیص کلاهبرداری، فیلتر کردن هرزنامه ها، تشخیص های پزشکی و …
الف) کلاس بندی
الگوریتمهای کلاسبندی برای حل مسائلی استفاده می شوند که پیش بینی در آن از برای مشخص نمودن دسته یا طبقه هر داده است، مثلا پیش بینی هایی مانند بله یا خیر، مرد یا زن، قرمز یا آبی و… از این نوع مسائل می باشند. الگوریتمهای کلاسبندی عملا دستههای متفاوت موجود در مجموعه داده را پیشبینی میکنند. برخی از نمونههای واقعی کاربرد الگوریتمهای کلاسبندی عبارتند از: تشخیص هرزنامه، تشخیص بیماری و…
ب) رگرسیون
در مسائل کلاس بندی ما از قبل تعدادی کلاس مشخص برای پیش بینی داریم مثلا کلاس سگ/گربه ، کلاس بیمار/سالم و … اما پیش بینی رگرسیون برای مواردی است که خروجی مورد انتظار برای پیش بینی دیگر مقادیر گسسته مانند 1،2،3،… یا سگ، گربه، و… نیست بلکه مقدار مورد انتظار برای پیش بینی مقداری پیوسته است. مانند پیش بینی دما، پیش بینی میزان بارش در یک شهر، پیش بینی ارزش یک سهم و مسائلی از قبیل است. به عنوان مثال دمای یک شهر می تواند 25.41سانتیگراد پیش بینی شود و یا مقدار بارش می تواند 9.852 میلیمتر باشد .
2.یادگیری ماشین بدون نظارت
یادگیری بدون نظارت با تکنیک یادگیری تحت نظارت از نظر شیوه آموزش و خروجی مورد انتظار متفاوت است. همانطور که از نامش پیداست نیازی به نظارت ندارد بدین معنی که در یادگیری ماشین بدون نظارت، ماشین با استفاده از مجموعه داده های بدون برچسب (نوع کلاس یا مقدار خروجی داده ها به الگوریتم داده نمی شود) یادگیری را انجام می دهد.
در یادگیری بدون نظارت، مدلها با دادههایی که نه طبقهبندی شدهاند و نه برچسبگذاری آموزش داده میشوند و مدل بدون هیچ نظارتی بر روی آن دادهها عمل میکند.
هدف اصلی الگوریتم های یادگیری بدون نظارت، گروه بندی یا دسته بندی مجموعه داده های دسته بندی نشده بر اساس شباهت ها، الگوها و تفاوت ها است. در چنین روشی از ماشین انتظار داریم تا الگوهای پنهان را در مجموعه داده ورودی پیدا کنند.
برای درک بهتر مثالی بزنیم. فرض کنید تصاویری از چند نوع میوه مختلف داریم و آن را به مدل یادگیری ماشین می دهیم. تصاویر کاملاً برای مدل ناشناخته هستند و وظیفه دستگاه یافتن الگوها و دسته بندی اشیا است.
بنابراین ماشین الگوها و تفاوتهای خود، مانند شباهت و تفاوت هایی که در رنگ، شکل، اندازه و… میوه ها وجود دارد را در تصاویر شناسایی کرده و بر اساس شباهت ها دسته بندی این داده ها را انجام می دهد و انتظار داریم که ماشین زمانی که با یک داده جدید مواجه می شود بتواند آن نمونه را در دسته مشابه خود قرار دهد.
عملکردهای یادگیری ماشین بدون نظارت
عملکردهای یادگیری بدون نظارت را می توان به دو نوع طبقه بندی کرد :
خوشه بندی
قوانین انجمنی
1) خوشه بندی
تکنیک خوشه بندی زمانی استفاده می شود که بخواهیم شباهت های ذاتی بین داده ها را پیدا کنیم. این تکنیک روشی است برای گروه بندی اشیاء در یک خوشه، به طوری که مواردی که بیشترین شباهت را با هم دارند در یک خوشه قرار می گیرند و همچنین داده های این خوشه کمترین شباهت را با داده های موجود در دیگر خوشه ها دارند. یکی از کاربردهای بسیار رایج الگوریتم خوشه بندی، دسته بندی مشتریان بر اساس رفتار خرید آنهاست.
2)قوانین انجمنی
قوانین انجمنی یک تکنیک یادگیری بدون نظارت است که روابط جالبی را بین متغیرها در یک مجموعه داده بزرگ پیدا می کند. هدف اصلی این الگوریتم، یافتن وابستگی یک نمونه داده به نمونه داده دیگر و تدوین یک قانون بر اساس این وابستگی است تا بتواند حداکثر منفعت را ایجاد کند. این الگوریتم عمدتاً در تحلیل سبد خرید مشتریان، وب کاوی، و … کاربرد دارد.
دیدگاهتان را بنویسید