یادگیری ماشین (Machine Learning) چیست؟

یادگیری ماشین (Machine Learning) یکی از زیرشاخه‌های هوش مصنوعی محسوب می‌شود که در دنیای امروزه، جزو مطرح‌ترین تکنولوژی‌های دنیا بشمار می‌رود. در این مقاله قصد داریم تا با مفهوم یادگیری ماشین بیشتر آشنا شویم.

آنچه در این مقاله خواهید آموخت:

یادگیری ماشین چیست؟
چرا یادگیری ماشین مهم است؟
انواع شاخه‌های یادگیری ماشین
یادگیری ماشین با نظارت چگونه کار می کند؟
یادگیری ماشین بدون نظارت چگونه کار می کند؟
یادگیری نیمه نظارتی چگونه کار می کند؟
یادگیری تقویتی چگونه کار می کند؟
چه کسانی از یادگیری ماشینی استفاده می کنند و برای چه مواردی استفاده می شود؟

یادگیری ماشین (Machine Learning ) چیست؟

یادگیری ماشین شاخه‌ای از هوش مصنوعی (AI) و علوم کامپیوتر است که با استفاده از داده‌ها و الگوریتم‌ها بر تقلید از روشی که انسان‌ها یاد می‌گیرند تمرکز دارد و به تدریج دقت آن را بهبود می‌بخشد تا بتواند به پیش بینی ها و تصمیمات مشابه یا بهتر از انسان ها دست یابد .الگوریتم‌های یادگیری ماشینی مدلی را بر اساس داده‌های نمونه می‌سازند که به داده‌های آموزشی معروف می‌باشند. این مدل بدون کدنویسی عمیق توسط برنامه نویس، خودش از مثال‌ ها یاد می‌گیرد و می‌تواند به تنهایی از داده‌ها، نتایجِ دقیق استخراج کند. البته که دانش تجربی در مدل‌های ماشین لرنینگ، بسیار می‌تواند در جهت بهبود مدل کمک کند. معمولا از داده های تاریخی به عنوان ورودی برای پیش بینی مقادیر خروجی جدید استفاده می‌شود. یادگیری خودکار، مزیت اصلی ماشین لرنینگ در مقابل برنامه‌ نویسی سنتی است.

یک مثال آشنا از یادگیری ماشین، اینستاگرام است. وقتی در اینستاگرام یک موضوع مشخص را سرچ می‌کنید، از دفعات بعد که وارد سایت می‌شوید، مطالب مرتبط با آن سرچ را بیشتر به شما نشان می دهد. سیستم، این کار را بر اساس دیتای ذخیره شده از طرف شما انجام می‌دهد و در واقع از رفتار شما یاد می‌گیرد تا طبق ترجیحات و نیاز شما رفتار کند. این همان معجزه یادگیری ماشین است. این تکنیک را موتور پیشنهاد دهنده (recommendation engine ) می نامند. سایر کاربردهای محبوب عبارتند از: تشخیص تقلب، فیلتر هرزنامه، تشخیص تهدید بدافزار، اتوماسیون کسب و کار و… .

تصویر زیر پروسه یادگیری ماشین را نشان می دهد.

چرا یادگیری ماشین مهم است؟

یادگیری ماشینی مهم است زیرا به شرکت ها دیدی از روند رفتار مشتری و الگوهای عملیاتی تجاری می دهد و همچنین از توسعه محصولات جدید پشتیبانی می کند.

بسیاری از شرکت‌های پیشرو امروزی، مانند فیس‌بوک، گوگل و اوبر، یادگیری ماشینی را به بخش مرکزی عملیات خود تبدیل می‌کنند زیرا این ابزار به یک تمایز رقابتی مهم برای بسیاری از شرکت ها تبدیل شده است.

انواع شاخه‌های یادگیری ماشین

یادگیری ماشین کلاسیک اغلب بر اساس اینکه یک الگوریتم چگونه می آموزد تا به پیش‌بینی بهتری دست یابد، به چهار گروه اساسی طبقه‌بندی می‌شود.

یادگیری با نظارت، یادگیری بدون نظارت ، یادگیری نیمه نظارتی و یادگیری تقویتی. نوع الگوریتمی که دانشمندان داده‌های الگوریتمی برای استفاده انتخاب می‌کنند بستگی به نوع داده‌هایی دارد که می‌خواهند پیش‌بینی کنند.

یادگیری نظارت شده (Supervised):

در این نوع یادگیری، مدل با استفاده از داده های آموزشی برچسب گذاری شده و داشتن جواب های درست، یاد می گیرد.

یک نمونه عالی از یادگیری تحت نظارت، مسائل طبقه بندی متن است. در این مسائل، هدف پیش‌بینی برچسب کلاس برای یک قطعه متن داده شده است. یکی از موضوعات محبوب در طبقه‌بندی متن، پیش‌بینی احساس یک قطعه متن، مانند یک توییت است.

یادگیری بدون نظارت (Unsupervised):

این نوع یادگیری ماشینی شامل الگوریتم هایی است که روی داده های بدون برچسب آموزش می بینند. این الگوریتم مجموعه داده ها را اسکن می کند تا هر گونه ارتباط معنی دار را بیابد. در واقع مدل به دنبال الگوهای ناشناخته در یک دسته داده‌ی بی برچسب می گردد. حوزه‌های کاربردی یادگیری بدون نظارت شامل تحلیل سبد بازار، سیستم‌های توصیه‌گر و غیره است.

یادگیری نیمه نظارت شده (Semi-supervised) :

در این رویکرد، یادگیری ماشینی شامل ترکیبی از دو نوع قبلی است. به طور مثال دانشمندان داده ممکن است مدل را با داده های برچسب دار تغذیه کنند، اما از طرفی این مدل آزاد است که خودش نیز به تنهایی الگوهای داده ها را کشف کند و درک خود را از مجموعه داده توسعه دهد. بنابراین مدل برای یاد گرفتن هم از برچسبها استفاده می کند و هم خودش الگوها را کشف می کند و از آنها هم یاد می گیرد. یک مثال رایج از کاربرد یادگیری نیمه نظارتی، طبقه‌بندی‌ اسناد متنی است. در این شرایط است که در آن یادگیری نیمه نظارتی ایده آل است زیرا یافتن مقدار زیادی از اسناد متنی برچسب دار تقریباً غیرممکن است.

یادگیری تقویتی (Reinforcement learning):

معمولاً از یادگیری تقویتی برای آموزش به ماشین برای تکمیل یک فرآیند چند مرحله ای استفاده می شود که قوانین مشخصی برای آن وجود دارد. دانشمندان داده، الگوریتمی را برای تکمیل یک کار برنامه ریزی می کنند و به آن نشانه های مثبت یا منفی می دهند که چگونه کار را کامل کند. اما در بیشتر موارد، الگوریتم به تنهایی تصمیم می گیرد که چه مراحلی را در طول مسیر بردارد. برای مثال، اینکه چگونه یک سگ رباتیک، حرکات بازوهای خود را یاد می گیرد نمونه ای از یادگیری تقویتی است.

یادگیری ماشین با نظارت چگونه کار می کند؟

یادگیری ماشینی نظارت شده به یک دانشمند داده نیاز دارد که الگوریتم را با ورودی های برچسب دار و خروجی های دلخواه آموزش دهد. الگوریتم های یادگیری نظارت شده برای کارهای زیر مناسب هستند:

طبقه بندی باینری: تقسیم داده ها به دو دسته.
طبقه بندی چند کلاسه: انتخاب بین بیش از دو نوع پاسخ.
مدل سازی رگرسیون: پیش بینی مقادیر پیوسته.
روش (Ensembling)
ترکیب پیش‌بینی‌های چندین مدل یادگیری ماشین، برای تولید یک پیش‌بینی دقیق.

یادگیری ماشین بدون نظارت چگونه کار می کند؟

الگوریتم های یادگیری ماشینی بدون نظارت نیازی به برچسب گذاری داده ها ندارند. آنها داده های بدون برچسب را غربال می کنند تا به دنبال الگوهایی باشند که می توانند برای گروه بندی نقاط داده در زیر مجموعه ها استفاده شوند. اکثر انواع یادگیری عمیق، از جمله شبکه های عصبی از نوع الگوریتم های بدون نظارت هستند. الگوریتم های یادگیری بدون نظارت برای کارهای زیر مناسب هستند:

خوشه بندی: تقسیم مجموعه داده ها به گروه ها بر اساس شباهت.
تشخیص ناهنجاری: شناسایی نقاط داده غیرعادی در یک مجموعه داده.
ارتباط کاوی: شناسایی مجموعه ای از رخدادها و آیتم ها در یک مجموعه داده، که اغلب با هم اتفاق می افتد.
کاهش ابعاد: کاهش تعداد متغیرها در یک مجموعه داده.

یادگیری نیمه نظارتی چگونه کار می کند؟

در این روش دانشمندان داده مقدار کمی از داده های برچسب دار را به الگوریتم تغذیه می کنند. الگوریتم از این طریق، ابعاد مجموعه داده‌ها را می‌آموزد، سپس آن را برای داده‌های جدید و بدون برچسب، به کار می گیرد. عملکرد الگوریتم‌ها معمولاً زمانی بهبود می‌یابد که روی مجموعه داده‌های برچسب‌گذاری شده آموزش ببینند. اما برچسب زدن داده ها می تواند زمان بر و پرهزینه باشد. یادگیری نیمه نظارتی بین عملکردهای یادگیری تحت نظارت و یادگیری بدون نظارت یک حد وسط ایجاد می کند. برخی از زمینه هایی که در آن از یادگیری نیمه نظارتی استفاده می شود عبارتند از:

ترجمه ماشینی: آموزش الگوریتم ها برای ترجمه زبان بر اساس کمتر از یک فرهنگ لغت کامل از کلمات.
تشخیص تقلب: شناسایی موارد تقلب زمانی که فقط چند نمونه مثبت داشته باشید.
برچسب گذاری داده ها: الگوریتم های آموزش داده شده بر روی مجموعه داده های کوچک می توانند بطور اتوماتیک از همان برچسبهای دیتا برای آموزش مجموعه داده های بزرگتر استفاده کنند.

یادگیری تقویتی چگونه کار می کند؟

یادگیری تقویتی، یک الگوریتم با هدف متمایز و مجموعه ای از قوانین تعیین شده برای دستیابی به آن هدف است. دانشمندان داده این الگوریتم را طوری برنامه‌ریزی می‌کنند که به دنبال پاداش‌های مثبتی باشد که هنگام انجام عملی که برای هدف نهایی سودمند است دریافت می‌کند و از مجازات‌هایی که هنگام انجام عملی دریافت می‌کند که آن را از هدف نهایی دور می‌کند اجتناب می کند.

یادگیری تقویتی اغلب در حوزه هایی نظیر زیر استفاده می شود:

رباتیک: ربات ها می توانند با استفاده از این تکنیک انجام وظایف دنیای فیزیکی را بیاموزند.
بازیهای ویدیویی: از یادگیری تقویتی برای آموزش ربات ها برای انجام تعدادی بازی ویدیویی استفاده شده است.
مدیریت منابع: با توجه به منابع محدود و یک هدف تعریف شده، یادگیری تقویتی می تواند به شرکت ها در برنامه ریزی نحوه تخصیص منابع کمک کند.

چه کسانی از یادگیری ماشین استفاده می کنند و برای چه مواردی استفاده می شود؟

امروزه یادگیری ماشین در طیف وسیعی از کاربردها استفاده می شود. شاید یکی از شناخته شده ترین نمونه های یادگیری ماشینی در عمل شامل موارد زیر است:

موتورهاي توصیه the recommendation engine که خوراک خبری فیس بوک را تقویت می کنند. فیس بوک از یادگیری ماشینی برای شخصی سازی نحوه ارائه خوراک هر عضو استفاده می کند. اگر عضوی مکرراً برای خواندن پست‌های یک گروه خاص توقف کند، موتور توصیه شروع به نمایش بیشتر فعالیت آن گروه، به عنوان خوراک برای آن عضو می‌کند. در پشت صحنه، موتور در حال تلاش برای تقویت الگوهای شناخته شده در رفتار آنلاین اعضا است. اگر عضو الگوهای خود را تغییر دهد و نتواند پست‌های آن گروه را در هفته‌های آینده بخواند، خوراک اخبار مطابق با آن تنظیم می‌شود.

مدیریت ارتباط با مشتری :(Customer relationship management) نرم‌افزار CRM می‌تواند از مدل‌های یادگیری ماشین برای تجزیه و تحلیل ایمیل استفاده کند و اعضای تیم فروش را ترغیب کند که ابتدا به مهم‌ترین پیام‌ها پاسخ دهند. سیستم های پیشرفته تر حتی می توانند پاسخ های بالقوه موثر را توصیه کنند.

هوش تجاریBusiness intelligence (BI):

هوش تجاری (BI) فرآیندی مبتنی بر فناوری، برای تجزیه و تحلیل داده‌ها و ارائه اطلاعات عملی است. فروشندگان BI از یادگیری ماشین در نرم افزار خود برای شناسایی نقاط بالقوه مهم در داده ها، الگوهای نقاط داده و ناهنجاری ها استفاده می کنند.

سیستم های اطلاعات منابع انسانی:Human resource information system

این سیستمها می‌تواند از مدل‌های یادگیری ماشین برای فیلتر کردن برنامه‌ها و شناسایی بهترین نامزدها برای موقعیت‌های مختلف استفاده کند

ماشین های خودران:

الگوریتم‌های یادگیری ماشینی حتی می‌توانند این امکان را برای یک خودروی نیمه‌خودران فراهم کنند که یک شی نیمه قابل مشاهده را تشخیص دهد و به راننده هشدار دهد.

دستیاران مجازی:

دستیارهای هوشمند معمولاً مدل‌های یادگیری ماشینی تحت نظارت و بدون نظارت را برای تفسیر گفتار طبیعی و تهیه متن ترکیب می‌کنند.

یادگیری ماشین (Machine Learning) چیست؟

نویسنده : خدیجه عابدی، عضو تیم IMT

جهت مشاهده مقالات بیشتر کلیک کنید.

پاسخ‌ها

نویسنده : خدیجه عابدی، عضو تیم IMT

جهت مشاهده مقالات بیشتر کلیک کنید.

مقالات مرتبط

پاسخ‌ها