یادگیری ماشین (Machine Learning) چیست؟
یادگیری ماشین (Machine Learning) یکی از زیرشاخههای هوش مصنوعی محسوب میشود که در دنیای امروزه، جزو مطرحترین تکنولوژیهای دنیا بشمار میرود. در این مقاله قصد داریم تا با مفهوم یادگیری ماشین بیشتر آشنا شویم.
آنچه در این مقاله خواهید آموخت:
- یادگیری ماشین چیست؟
- چرا یادگیری ماشین مهم است؟
- انواع شاخههای یادگیری ماشین
- یادگیری ماشین با نظارت چگونه کار می کند؟
- یادگیری ماشین بدون نظارت چگونه کار می کند؟
- یادگیری نیمه نظارتی چگونه کار می کند؟
- یادگیری تقویتی چگونه کار می کند؟
- چه کسانی از یادگیری ماشینی استفاده می کنند و برای چه مواردی استفاده می شود؟
یادگیری ماشین (Machine Learning ) چیست؟
یادگیری ماشین شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که با استفاده از دادهها و الگوریتمها بر تقلید از روشی که انسانها یاد میگیرند تمرکز دارد و به تدریج دقت آن را بهبود میبخشد تا بتواند به پیش بینی ها و تصمیمات مشابه یا بهتر از انسان ها دست یابد .الگوریتمهای یادگیری ماشینی مدلی را بر اساس دادههای نمونه میسازند که به دادههای آموزشی معروف میباشند. این مدل بدون کدنویسی عمیق توسط برنامه نویس، خودش از مثال ها یاد میگیرد و میتواند به تنهایی از دادهها، نتایجِ دقیق استخراج کند. البته که دانش تجربی در مدلهای ماشین لرنینگ، بسیار میتواند در جهت بهبود مدل کمک کند. معمولا از داده های تاریخی به عنوان ورودی برای پیش بینی مقادیر خروجی جدید استفاده میشود. یادگیری خودکار، مزیت اصلی ماشین لرنینگ در مقابل برنامه نویسی سنتی است.
یک مثال آشنا از یادگیری ماشین، اینستاگرام است. وقتی در اینستاگرام یک موضوع مشخص را سرچ میکنید، از دفعات بعد که وارد سایت میشوید، مطالب مرتبط با آن سرچ را بیشتر به شما نشان می دهد. سیستم، این کار را بر اساس دیتای ذخیره شده از طرف شما انجام میدهد و در واقع از رفتار شما یاد میگیرد تا طبق ترجیحات و نیاز شما رفتار کند. این همان معجزه یادگیری ماشین است. این تکنیک را موتور پیشنهاد دهنده (recommendation engine ) می نامند. سایر کاربردهای محبوب عبارتند از: تشخیص تقلب، فیلتر هرزنامه، تشخیص تهدید بدافزار، اتوماسیون کسب و کار و… .
تصویر زیر پروسه یادگیری ماشین را نشان می دهد.
چرا یادگیری ماشین مهم است؟
یادگیری ماشینی مهم است زیرا به شرکت ها دیدی از روند رفتار مشتری و الگوهای عملیاتی تجاری می دهد و همچنین از توسعه محصولات جدید پشتیبانی می کند.
بسیاری از شرکتهای پیشرو امروزی، مانند فیسبوک، گوگل و اوبر، یادگیری ماشینی را به بخش مرکزی عملیات خود تبدیل میکنند زیرا این ابزار به یک تمایز رقابتی مهم برای بسیاری از شرکت ها تبدیل شده است.
انواع شاخههای یادگیری ماشین
یادگیری ماشین کلاسیک اغلب بر اساس اینکه یک الگوریتم چگونه می آموزد تا به پیشبینی بهتری دست یابد، به چهار گروه اساسی طبقهبندی میشود.
یادگیری با نظارت، یادگیری بدون نظارت ، یادگیری نیمه نظارتی و یادگیری تقویتی. نوع الگوریتمی که دانشمندان دادههای الگوریتمی برای استفاده انتخاب میکنند بستگی به نوع دادههایی دارد که میخواهند پیشبینی کنند.
یادگیری نظارت شده (Supervised):
در این نوع یادگیری، مدل با استفاده از داده های آموزشی برچسب گذاری شده و داشتن جواب های درست، یاد می گیرد.
یک نمونه عالی از یادگیری تحت نظارت، مسائل طبقه بندی متن است. در این مسائل، هدف پیشبینی برچسب کلاس برای یک قطعه متن داده شده است. یکی از موضوعات محبوب در طبقهبندی متن، پیشبینی احساس یک قطعه متن، مانند یک توییت است.
یادگیری بدون نظارت (Unsupervised):
این نوع یادگیری ماشینی شامل الگوریتم هایی است که روی داده های بدون برچسب آموزش می بینند. این الگوریتم مجموعه داده ها را اسکن می کند تا هر گونه ارتباط معنی دار را بیابد. در واقع مدل به دنبال الگوهای ناشناخته در یک دسته دادهی بی برچسب می گردد. حوزههای کاربردی یادگیری بدون نظارت شامل تحلیل سبد بازار، سیستمهای توصیهگر و غیره است.
یادگیری نیمه نظارت شده (Semi-supervised) :
در این رویکرد، یادگیری ماشینی شامل ترکیبی از دو نوع قبلی است. به طور مثال دانشمندان داده ممکن است مدل را با داده های برچسب دار تغذیه کنند، اما از طرفی این مدل آزاد است که خودش نیز به تنهایی الگوهای داده ها را کشف کند و درک خود را از مجموعه داده توسعه دهد. بنابراین مدل برای یاد گرفتن هم از برچسبها استفاده می کند و هم خودش الگوها را کشف می کند و از آنها هم یاد می گیرد. یک مثال رایج از کاربرد یادگیری نیمه نظارتی، طبقهبندی اسناد متنی است. در این شرایط است که در آن یادگیری نیمه نظارتی ایده آل است زیرا یافتن مقدار زیادی از اسناد متنی برچسب دار تقریباً غیرممکن است.
یادگیری تقویتی (Reinforcement learning):
معمولاً از یادگیری تقویتی برای آموزش به ماشین برای تکمیل یک فرآیند چند مرحله ای استفاده می شود که قوانین مشخصی برای آن وجود دارد. دانشمندان داده، الگوریتمی را برای تکمیل یک کار برنامه ریزی می کنند و به آن نشانه های مثبت یا منفی می دهند که چگونه کار را کامل کند. اما در بیشتر موارد، الگوریتم به تنهایی تصمیم می گیرد که چه مراحلی را در طول مسیر بردارد. برای مثال، اینکه چگونه یک سگ رباتیک، حرکات بازوهای خود را یاد می گیرد نمونه ای از یادگیری تقویتی است.
یادگیری ماشین با نظارت چگونه کار می کند؟
یادگیری ماشینی نظارت شده به یک دانشمند داده نیاز دارد که الگوریتم را با ورودی های برچسب دار و خروجی های دلخواه آموزش دهد. الگوریتم های یادگیری نظارت شده برای کارهای زیر مناسب هستند:
- طبقه بندی باینری: تقسیم داده ها به دو دسته.
- طبقه بندی چند کلاسه: انتخاب بین بیش از دو نوع پاسخ.
- مدل سازی رگرسیون: پیش بینی مقادیر پیوسته.
- روش (Ensembling)
- ترکیب پیشبینیهای چندین مدل یادگیری ماشین، برای تولید یک پیشبینی دقیق.
یادگیری ماشین بدون نظارت چگونه کار می کند؟
الگوریتم های یادگیری ماشینی بدون نظارت نیازی به برچسب گذاری داده ها ندارند. آنها داده های بدون برچسب را غربال می کنند تا به دنبال الگوهایی باشند که می توانند برای گروه بندی نقاط داده در زیر مجموعه ها استفاده شوند. اکثر انواع یادگیری عمیق، از جمله شبکه های عصبی از نوع الگوریتم های بدون نظارت هستند. الگوریتم های یادگیری بدون نظارت برای کارهای زیر مناسب هستند:
- خوشه بندی: تقسیم مجموعه داده ها به گروه ها بر اساس شباهت.
- تشخیص ناهنجاری: شناسایی نقاط داده غیرعادی در یک مجموعه داده.
- ارتباط کاوی: شناسایی مجموعه ای از رخدادها و آیتم ها در یک مجموعه داده، که اغلب با هم اتفاق می افتد.
- کاهش ابعاد: کاهش تعداد متغیرها در یک مجموعه داده.
یادگیری نیمه نظارتی چگونه کار می کند؟
در این روش دانشمندان داده مقدار کمی از داده های برچسب دار را به الگوریتم تغذیه می کنند. الگوریتم از این طریق، ابعاد مجموعه دادهها را میآموزد، سپس آن را برای دادههای جدید و بدون برچسب، به کار می گیرد. عملکرد الگوریتمها معمولاً زمانی بهبود مییابد که روی مجموعه دادههای برچسبگذاری شده آموزش ببینند. اما برچسب زدن داده ها می تواند زمان بر و پرهزینه باشد. یادگیری نیمه نظارتی بین عملکردهای یادگیری تحت نظارت و یادگیری بدون نظارت یک حد وسط ایجاد می کند. برخی از زمینه هایی که در آن از یادگیری نیمه نظارتی استفاده می شود عبارتند از:
- ترجمه ماشینی: آموزش الگوریتم ها برای ترجمه زبان بر اساس کمتر از یک فرهنگ لغت کامل از کلمات.
- تشخیص تقلب: شناسایی موارد تقلب زمانی که فقط چند نمونه مثبت داشته باشید.
- برچسب گذاری داده ها: الگوریتم های آموزش داده شده بر روی مجموعه داده های کوچک می توانند بطور اتوماتیک از همان برچسبهای دیتا برای آموزش مجموعه داده های بزرگتر استفاده کنند.
یادگیری تقویتی چگونه کار می کند؟
یادگیری تقویتی، یک الگوریتم با هدف متمایز و مجموعه ای از قوانین تعیین شده برای دستیابی به آن هدف است. دانشمندان داده این الگوریتم را طوری برنامهریزی میکنند که به دنبال پاداشهای مثبتی باشد که هنگام انجام عملی که برای هدف نهایی سودمند است دریافت میکند و از مجازاتهایی که هنگام انجام عملی دریافت میکند که آن را از هدف نهایی دور میکند اجتناب می کند.
یادگیری تقویتی اغلب در حوزه هایی نظیر زیر استفاده می شود:
- رباتیک: ربات ها می توانند با استفاده از این تکنیک انجام وظایف دنیای فیزیکی را بیاموزند.
- بازیهای ویدیویی: از یادگیری تقویتی برای آموزش ربات ها برای انجام تعدادی بازی ویدیویی استفاده شده است.
- مدیریت منابع: با توجه به منابع محدود و یک هدف تعریف شده، یادگیری تقویتی می تواند به شرکت ها در برنامه ریزی نحوه تخصیص منابع کمک کند.
چه کسانی از یادگیری ماشین استفاده می کنند و برای چه مواردی استفاده می شود؟
امروزه یادگیری ماشین در طیف وسیعی از کاربردها استفاده می شود. شاید یکی از شناخته شده ترین نمونه های یادگیری ماشینی در عمل شامل موارد زیر است:
موتورهاي توصیه the recommendation engine که خوراک خبری فیس بوک را تقویت می کنند. فیس بوک از یادگیری ماشینی برای شخصی سازی نحوه ارائه خوراک هر عضو استفاده می کند. اگر عضوی مکرراً برای خواندن پستهای یک گروه خاص توقف کند، موتور توصیه شروع به نمایش بیشتر فعالیت آن گروه، به عنوان خوراک برای آن عضو میکند. در پشت صحنه، موتور در حال تلاش برای تقویت الگوهای شناخته شده در رفتار آنلاین اعضا است. اگر عضو الگوهای خود را تغییر دهد و نتواند پستهای آن گروه را در هفتههای آینده بخواند، خوراک اخبار مطابق با آن تنظیم میشود.
مدیریت ارتباط با مشتری :(Customer relationship management) نرمافزار CRM میتواند از مدلهای یادگیری ماشین برای تجزیه و تحلیل ایمیل استفاده کند و اعضای تیم فروش را ترغیب کند که ابتدا به مهمترین پیامها پاسخ دهند. سیستم های پیشرفته تر حتی می توانند پاسخ های بالقوه موثر را توصیه کنند.
هوش تجاریBusiness intelligence (BI):
هوش تجاری (BI) فرآیندی مبتنی بر فناوری، برای تجزیه و تحلیل دادهها و ارائه اطلاعات عملی است. فروشندگان BI از یادگیری ماشین در نرم افزار خود برای شناسایی نقاط بالقوه مهم در داده ها، الگوهای نقاط داده و ناهنجاری ها استفاده می کنند.
سیستم های اطلاعات منابع انسانی:Human resource information system
این سیستمها میتواند از مدلهای یادگیری ماشین برای فیلتر کردن برنامهها و شناسایی بهترین نامزدها برای موقعیتهای مختلف استفاده کند
ماشین های خودران:
الگوریتمهای یادگیری ماشینی حتی میتوانند این امکان را برای یک خودروی نیمهخودران فراهم کنند که یک شی نیمه قابل مشاهده را تشخیص دهد و به راننده هشدار دهد.
دستیاران مجازی:
دستیارهای هوشمند معمولاً مدلهای یادگیری ماشینی تحت نظارت و بدون نظارت را برای تفسیر گفتار طبیعی و تهیه متن ترکیب میکنند.
پاسخها