ما را دنبال کنید:
image

دوره آموزشی آنالیز داده و یادگیری ماشین با پایتون

آنچه یاد خواهید گرفت

♦ سرفصل‌های آنالیز داده و یادگیری ماشین با پایتون

♦ فصل اول: کتابخانه‌ی numpy

  • مقدمه - یادگیری ماشینی چیست؟
  • آموزش پکیج numpy در numpy - array ها و ماتریس‌ها
  • broadcasting در numpy
  • جمع، تفریق، تقسیم و جذر در numpy
  • متدها و فیلتر کردن در numpy
  • میانگین، واریانس، میانه، کواریانس و مقدار تعداد تکرار

♦ فصل دوم: ‌کتابخانه‌ی pandas

  • پکیج pandas
  • دیتافریم (data frame) چیست؟
  • متدهای دیتافریم
  • مرتب کردن داده‌ها

♦ فصل سوم: کتابخانه‌ی matplotlib

  • نمودار در matplotlib
  • رسم نمودار
  • آموزش رسم نمودار جزییات در نمودار رنگ‌ها
  • رسم دو نمودار همزمان و اضافه کردن جزییات
  • رسم چند نمودار در کنار هم
  • پکیج seaborn
  • پکیج boxplot
  • jointplot ها و pairplot ها

♦ فصل چهارم: مباحث آمار.

  • اهمیت آمار
  • نمودار ECDF
  • کمیت‌های آماری
  • کواریانس
  • correlation
  •  (pearson)
  • روش‌‌های غیرپارامتریک correlation
  • chi-square
  • کاربرد chi-square
  • تست chi-square با پایتون
  • مفهوم احتمال
  • توزیع نرمال

♦ فصل پنجم: پیش‌پردازش داده‌ها

  • preprocessing چیست؟
  • preprocessing در پایتون
  • داده‌های خالی (nan)
  • پر کردن داده‌های خالی
  • داده‌های تکراری
  • تبدیل داده‌های غیرعددی به عددی
  • Crosstab ها و pivot_table ها
  • متغیرهای ساختگی (dummy variables)
  • نرمال کردن داده‌ها
  • نویز و داده پرت و تفاوت آن‌ها

♦ فصل ششم: یادگیری نظارت‌ شده (Supervised Learning)

  • یادگیری نظارت‌شده (Supervised Learning)
  • وارد کردن دیتاست iris
  • الگوریتم knn
  • متریک در الگوریتم KNN
  • چگونگی بررسی عملکرد یک الگوریتم
  • overfitting و underfitting
  • رگرسیون خطی چیست؟
  • دیتاست boston و تمرین برای linear regression
  • خطا در linear regression چگونه محاسبه می‌شود؟
  • تقسیم کردن اطلاعات به چند بخش (K_fold cross validation)
  • تابع جریمه, Regularization term ,ridge regression ,Lasso regression
  • confusion matrix
  • لجیستیک رگرسیون چیست؟
  • threshold در Logistic regression
  • روشی برای پیداکردن هایپر پارامترها
  • تعیین هایپر پارامترها Random search cross validation
  • Naive Bayes
  • الگوریتم شبکه عصبی چیست؟

فصل هفتم: یادگیری نظارت نشده (Unsupervised Learning)

  • یادگیری غیر نظارت شده ، clustering و k_means چیست؟
  • نحوه کد زدن k_means و انتخاب تعداد cluster یا inertia
  • خوشه‌بندی سلسله مراتبی یا Hierarchical Clustering
  • الگوریتم Mean Shift
  • الگوریتم DBSCAN

پیش نیاز

آشنایی با کامپیوتر و تسلط اولیه به زبان برنامه نویسی پایتون

مخاطبان دوره

  • تمامی افراد علاقه مند به دیتا آنالیز و یادگیری ماشین

توانایی پس ازگذراندن دوره