ریاضیات ماشین لرنینگ

در دنیای امروز، موضوع هوش مصنوعی و ماشین لرنینگ، به عنوان یکی از مهمترین، کاربردی ترین و ترندترین مباحث علمی شناخته میشه و یادگیری این علم، از واجبات هر انسان دغدغه مندی هست.

اما یکی از نکاتی که همیشه باعث ترس در بین علاقه مندان هوش مصنوعی و ماشین لرنینگ میشه، شنیدن این موضوع هست که میگن، ماشین لرنینگ همش ریاضیه. فکر میکنن که این ریاضیات مباحث خیلی سنگین، پیچیده و سختی هست که نمیتونن از پسش بربیان. یاد دوران تحصیلات خودشون و مباحث سنگین مثل انتگرال های چندگانه، معادلات دیفرانسیل مرتبه دوم، سری فوریه، اعداد مختلط و … اینا میوفتن.

درحالی که اصلا این شکلی نیست و برعکس، ریاضیات کار بشدت ساده و قابل فهمه. در این زمینه شما نیاز ندارید که فرمول هارو یک به یک حفظ کنید یا یک به یک پیاده سازی کنید. بلکه صرفا یک درک، یک شهود عملی از ریاضیات کار کافیه.

نکته ای که وجود داره اینه که ریاضیات، زبان اصلی طبیعته. یعنی برای بهتر درک کردن آنچه که در طبیعت رخ میده، بهتره که به کمک ریاضیات به این درک برسیم.

از طرفی اکثر پروژه ها و مسائل ماشین لرنینگ، مربوط به دنیای اطرافمون و طبیعت هست، پس لازمه درک بهتر این پروژه‌ها درک زبان ریاضیاته.

تو این مقاله، سعی بر این شده که با مهم‌ترین و کاربردی ترین مباحث ریاضیات شمارو آشنا کنیم.

 

مباحث مهم و پرکاربرد ریاضیات

 

جبر خطی (Linear Algebra)

یکی از اصلی‌ترین مباحثی که خیلی ازش استفاده میشه و باید به عنوان یک اصل و آیتم مهم اونو یاد بگیریم، جبر خطی هست. جبر خطی نشون دهنده رفتار دیتاها و روابط خطی بین آن‌هاست. به کمک این مبحث، شما میتونید جریان‌های موجود در دیتاها به اضافه تاثیر هر متغیر بر متغیر دیگری رو پیدا کنید. همچنین حتما در این مبحث، رفتارهای غیرخطی رو هم مطالعه کنید.

 

ماتریس (Matrices)

از مهم‌ترین ساختارهای ریاضیاتی دنیای ماشین لرنینگ و دیتاساینس، بحث ماتریس و آرایه‌ها هست. اصولا ما مفهوم ریاضیاتی دیتاهارو به زبان ماتریس ها تحلیل میکنیم. میدونیم که دیتاها، قلب تپنده هر پروژه ماشین لرنینگی هست و ما برای اینکه بتونیم پس از دسترسی به دیتاها، از اونها به خوبی استفاده کنیم، اونهارو در دیتافریم قرار میدیم که جنس سازه‌ای این دیتافریم‌ها به زبان ماتریس معرفی میشه. پس ما از ابتدایی ترین کار که مبحث دیتافریم سازی هست، از ماتریس ها استفاده میکنیم.

 

محاسبات برداری (Vector Calculus)

محاسبات برداری و عملیات هایی که مربوط به شناخت ریاضیات درون بردارها میشه، عملا با این مبحث از ریاضیات قابل فهمه و ما میتونیم بررسی کنیم که در یک مجموعه‌ای از داده‌ها، چه رفتاری وجود داره و بر اساس نوع رفتارهای مشاهده شده، تصمیم به انتخاب الگوریتم و فیت سازی مدل خود بگیریم.

 

آمار و احتمالات و توزیع دیتاها (Probability and Distributions)

یکی از مباحث بسیار مهم در دنیای ماشین لرنینگ، بحث احتمالات و توزیع دیتاها هست. گونه ای از دیتاها وجود دارند که لیبل یا برچسب ندارند و ما بر اساس توزیع و احتمال وقوع آنها قصد بررسی خروجی و پیش بینی یک مدل را داریم. در این مواقع، آمار و احتمالات و زیر شاخه های آن، خیلی به کمک مدلسازی میاد و به همین دلیل باید این مبحث رو به خوبی مطالعه کنیم.

 

بهینه سازی (Optimization)

یکی از مهمترین کارهایی که ماشین لرنینگ برای ما انجام میده، بحث بهینه سازی هست. در مبحث بهینه سازی، ما قصد داریم که با کمترین ورودی، به بهترین خروجی برسیم. پس دانش این موضوع و درک ریاضیاتی این آیتم، بسیار مهمه. یکی از مهمترین و پرکاربردترین مباحث بهینه سازی، بهینه سازی پیوسته (Continuous Optimization) هست. که حتما این موضوع رو به صورت جامع یاد بگیرید.

 

رگرسیون خطی (Linear Regression)

نوعی از دیتاها هستند که یک پیوستگی مشخصی بین پارامترهای مختلفش وجود داره. منظور از این پیوستگی، در ارتباط و دنبال هم رفتن دیتاها هست. یعنی متناسب با زمان، رفتار دیتاها نسبت به دیتای قبلی خودشون، وابستگی داره. در این مواقع، تابع رگرسیون، هم حالت خطی و هم حالت غیرخطی به خودش میگیره (اکثر مواقع غیرخطی) و برای این موضوع باید با ریاضیات این مبحث به خوبی آشناییت داشته باشیم.

 

طبقه بندی یا دسته بندی (Classification)

بر خلاف رگرسیون که میان داده ها، پیوستگی وجود دارد، در برخی از دیتاست ها، انواع داده ها در تعدادی دسته بندی مشخص قرار میگیرند. مثلا دیتاها یا زن هستند یا مرد. در این مواقع دیگر استفاده از مباحث رگرسیون پاسخگو نیست و باید از نوع دیگری از ریاضیات به اسم دسته بندی ها، استفاده شود.

 

همانطور که مشاهده میکنید، ریاضیات موجود، ریاضیات قابل فهم و ساده ای هستند. پس به هیچ عنوان از ترس سخت بودن ریاضیات کار، یادگیری را پشت گوش نندازید.

مقالات مرتبط

پاسخ‌ها

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *