Scikit-Learn

Scikit-learn หรือ Sklearn เป็นชุดคำสั่งเสริมที่ใช้ภาษา Python เพื่อเป็นเครื่องมือช่วยสำหรับการประมวลผลข้อมูลและการเรียนรู้ของเครื่อง (machine learning) ทั้งในลักษณะของการจัดแบ่งข้อมูล (preprocessing), การเรียนรู้แบบมีผู้สอน (supervised learning), การเรียนรู้แบบไม่มีผู้สอน (unsupervised learning), และการประเมินผล (model evaluation) ดังนี้

การจัดแบ่งข้อมูล (Preprocessing):

ชุดคำสั่งนี้อยู่ในหมวด sklearn.model_selection ซึ่งมีคลาสที่ช่วยอำนวยความสะดวกในการสร้างชุดข้อมูลสำหรับการทดลองต่างได้แก่ KFold, LeaveOneOut, ShuffleSplit, StratifiedKFold, TimeSeriesSplit เป็นต้น

  • sklearn.model_selection.train_test_split(): ฟังก์ชันอำนวยความสะดวกในการแบ่งข้อมูลเป็นชุดฝึกและชุดทดสอบ

การแปลงข้อมูล

การเรียนรู้แบบมีผู้สอน (Supervised Learning):

Linear Models:

sklearn.linear_model.LinearRegression(): สร้างโมเดล Linear Regression

sklearn.linear_model.LogisticRegression(): สร้างโมเดล Logistic Regression

Support Vector Machines (SVM):

Decision Trees:

Ensemble Methods:

การเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning):

Clustering:

Dimensionality Reduction:

การประเมินผล (Model Evaluation):

Cross-validation:

Hyperparameter Tuning:

Pipeline:

  • sklearn.pipeline.Pipeline(): สร้างลำดับขั้นตอนการประมวลผลข้อมูลที่สามารถใช้ได้ต่อเนื่อง

Feature Selection: