แผนการเรียนรู้
/

ภาษาโปรแกรมสำหรับ
วิทยาการข้อมูล

Python • Pandas • NumPy • Matplotlib • Seaborn

ผลลัพธ์การเรียนรู้

1
อธิบายโครงสร้างพื้นฐานของภาษา Python สำหรับการวิเคราะห์ข้อมูลได้
2
ใช้ Pandas และ NumPy เพื่อจัดการข้อมูลเชิงตารางได้
3
สร้าง visualization ด้วย Matplotlib หรือ Seaborn ได้
4
เชื่อมต่อโค้ดเข้ากับเครื่องมือ MCP เพื่อวิเคราะห์ข้อมูลอัตโนมัติ
สัปดาห์ที่ 5

ทำไมต้องใช้
Python ในงานวิทยาการข้อมูล?

จุดเด่นที่ทำให้ Python เป็นภาษาหลักของนักวิทยาการข้อมูลทั่วโลก

ไลบรารีครบเครื่อง

มีเครื่องมือพร้อมใช้ เช่น Pandas, NumPy, SciPy, Matplotlib, Seaborn, Scikit-Learn ทำให้งานตั้งแต่ data wrangling ถึง machine learning ทำได้ครบจบในภาษาเดียว

อ่านง่าย พัฒนาง่าย

โครงสร้างภาษากระชับ เข้าใจง่าย และรองรับการเขียนแบบ scripting ช่วยลดเวลา ในการพัฒนาโค้ดสำหรับการทดลองและการวิเคราะห์ข้อมูล

ชุมชนแข็งแกร่ง

มีตัวอย่าง โปรเจกต์ และบทความจำนวนมหาศาล ช่วยแก้ปัญหาและเรียนรู้เทคนิคใหม่ได้อย่างรวดเร็ว

ทำงานร่วมกับ AI/MCP ได้ดี

Python ใช้งานร่วมกับ Model Context Protocol (MCP) และ Agent AI ได้อย่างมีประสิทธิภาพ ทำให้สามารถสร้าง workflow อัตโนมัติและ agent ช่วยวิเคราะห์ข้อมูลได้

ภาพรวมของ
Ecosystem ภาษา Python

ไลบรารีและเครื่องมือที่สำคัญสำหรับงานวิทยาการข้อมูล

Data Handling

  • Pandas
  • NumPy
  • Polars

Visualization

  • Matplotlib
  • Seaborn
  • Plotly

Modeling & Automation

  • Scikit-Learn
  • PyTorch / TensorFlow
  • MCP + Agent AI
Python ช่วยให้นักวิทยาการข้อมูลสามารถสร้าง workflow ที่ครบวงจรตั้งแต่การดึงข้อมูลจนถึงการสร้างโมเดลและอัตโนมัติด้วย AI

ทำความรู้จัก
Pandas

ไลบรารีหลักสำหรับการจัดการข้อมูลเชิงตาราง (Tabular Data)

จุดเด่นของ Pandas

  • จัดการข้อมูลในรูปแบบ DataFrame ได้สะดวก
  • รองรับการอ่านไฟล์ CSV, Excel, JSON และฐานข้อมูล
  • มีฟังก์ชันสำหรับการทำความสะอาดข้อมูล (cleaning)
  • สามารถเชื่อมต่อ workflow กับ NumPy, Matplotlib และ MCP ได้

คำสั่งพื้นฐานที่ควรรู้

  • 1read_csv() สำหรับโหลดข้อมูล
  • 2head() และ info() สำหรับตรวจสอบข้อมูล
  • 3dropna() สำหรับลบค่าที่หายไป
  • 4loc[] และ iloc[] สำหรับเลือกข้อมูลตามแถวและคอลัมน์
Pandas เป็นหัวใจของการวิเคราะห์ข้อมูล เนื่องจากช่วยจัดการข้อมูลได้ง่าย และเป็นจุดเริ่มต้นในการเชื่อมโค้ดเข้ากับ AI Agents หรือ MCP เพื่อสร้างการวิเคราะห์แบบอัตโนมัติ

ทำความรู้จัก
Pandas

ไลบรารีหลักสำหรับการจัดการข้อมูลเชิงตาราง (Tabular Data)

จุดเด่นของ Pandas

  • จัดการข้อมูลในรูปแบบ DataFrame ได้สะดวก
  • รองรับการอ่านไฟล์ CSV, Excel, JSON และฐานข้อมูล
  • มีฟังก์ชันสำหรับการทำความสะอาดข้อมูล (cleaning)
  • สามารถเชื่อมต่อ workflow กับ NumPy, Matplotlib และ MCP ได้

คำสั่งพื้นฐานที่ควรรู้

  • 1read_csv() สำหรับโหลดข้อมูล
  • 2head() และ info() สำหรับตรวจสอบข้อมูล
  • 3dropna() สำหรับลบค่าที่หายไป
  • 4loc[] และ iloc[] สำหรับเลือกข้อมูลตามแถวและคอลัมน์
Pandas เป็นหัวใจของการวิเคราะห์ข้อมูล เนื่องจากช่วยจัดการข้อมูลได้ง่าย และเป็นจุดเริ่มต้นในการเชื่อมโค้ดเข้ากับ AI Agents หรือ MCP เพื่อสร้างการวิเคราะห์แบบอัตโนมัติ

ทำความเข้าใจ
NumPy

พื้นฐานสำคัญของการคำนวณเชิงตัวเลข (Numerical Computing)

บทบาทของ NumPy

  • เป็นพื้นฐานของไลบรารีอื่น เช่น Pandas, SciPy, Scikit-Learn
  • จัดการข้อมูลแบบอาเรย์หลายมิติด้วย ndarray
  • รองรับการคำนวณความเร็วสูง (vectorization)
  • เหมาะสำหรับงาน simulation, numerical analysis และ preprocessing

คำสั่งที่ต้องรู้

  • 1np.array() สร้างอาเรย์
  • 2np.arange() สร้างลำดับตัวเลข
  • 3np.mean(), np.std() คำนวณค่าทางสถิติ
  • 4reshape() ปรับรูปแบบมิติของข้อมูล
NumPy ทำให้การคำนวณเชิงตัวเลขเป็นไปได้อย่างรวดเร็วและแม่นยำ และเป็นองค์ประกอบสำคัญในการเตรียมข้อมูลก่อนเชื่อมต่อกับ AI Agents หรือ MCP เพื่อสร้างระบบวิเคราะห์ข้อมูลแบบอัตโนมัติ

การสร้างภาพข้อมูลด้วย
Matplotlib & Seaborn

เปลี่ยนข้อมูลดิบให้เป็นภาพที่เข้าใจง่ายและสื่อความหมายได้ทันที

Matplotlib

  • ไลบรารีพื้นฐานสำหรับการวาดกราฟทุกรูปแบบ
  • ควบคุมรายละเอียดได้ลึก เช่น สี เส้น ขนาด แกน
  • ใช้บ่อยสำหรับงานวิชาการและงานที่ต้องการความยืดหยุ่นสูง
  • คำสั่งหลัก: plot(), bar(), hist(), scatter()

Seaborn

  • สร้างกราฟที่สวยงามด้วยโค้ดที่กระชับกว่า Matplotlib
  • เหมาะสำหรับการวิเคราะห์ข้อมูลและค้นหารูปแบบ
  • รองรับการ plot จาก DataFrame โดยตรง
  • คำสั่งหลัก: sns.lineplot(), sns.barplot(), sns.heatmap()
Visualization ช่วยให้เรามองเห็นแนวโน้ม ความผิดปกติ และความสัมพันธ์ในข้อมูล ซึ่งเป็นขั้นตอนสำคัญก่อนนำข้อมูลไปวิเคราะห์ด้วย AI, Agent AI หรือเชื่อมต่อกับ workflow ของ MCP

การเชื่อมต่อโค้ด Python กับ
Model Context Protocol (MCP)

ทำให้โค้ดเข้าใจบริบทข้อมูลและให้ AI วิเคราะห์ได้อย่างชาญฉลาด

MCP คืออะไร?

  • โปรโตคอลที่ทำให้ AI เข้าถึงข้อมูล เครื่องมือ และไฟล์ได้อย่างปลอดภัย
  • ช่วยให้ Python scripts และ AI agents ทำงานร่วมกันได้
  • ใช้เพื่อสร้าง workflow อัตโนมัติในการวิเคราะห์ข้อมูล

สิ่งที่ทำได้ด้วย MCP

  • 1ให้ AI อ่านไฟล์ CSV หรือ DataFrame ได้โดยตรง
  • 2ให้ AI วิเคราะห์โค้ด Python พร้อม understand context
  • 3สร้าง agent ทำงานแทน เช่น ทำความสะอาดข้อมูลอัตโนมัติ
MCP ทำให้ Python กลายเป็นส่วนหนึ่งของระบบ AI แบบเต็มรูปแบบ นักศึกษาสามารถสร้างระบบที่ AI เข้าใจข้อมูล โปรเจกต์ และบริบททั้งหมดได้ ช่วยลดงานที่ซ้ำซ้อนและเพิ่มประสิทธิภาพในการวิเคราะห์ข้อมูล

ตัวอย่างการใช้งาน
MCP กับโค้ด Python

ทำให้ AI เข้าใจข้อมูลจาก DataFrame และช่วยวิเคราะห์ได้อัตโนมัติ

ตัวอย่างโค้ด

import pandas as pd

df = pd.read_csv("sales.csv")

# ส่ง DataFrame ให้ AI วิเคราะห์ผ่าน MCP
context.send("dataset", df)

analysis = ai.run(
    "วิเคราะห์ยอดขายและหาความผิดปกติจากข้อมูลนี้ให้หน่อย"
)

print(analysis)
        

สิ่งที่เกิดขึ้น

  • DataFrame ถูกส่งให้ AI ผ่าน MCP อย่างปลอดภัย
  • AI เข้าใจ schema, columns, และโครงสร้างข้อมูลอัตโนมัติ
  • AI สามารถสรุป วิเคราะห์ และหา pattern ได้จากข้อมูลจริง
  • ทำให้งานวิเคราะห์ข้อมูลเร็วขึ้นหลายเท่า โดยไม่ต้องเขียนโค้ดทั้งหมดเอง
การผสาน MCP ทำให้ Python กลายเป็นเครื่องมือที่ช่วยสื่อสารกับ AI เพื่อให้ AI ช่วยวิเคราะห์ ทำ EDA หรือค้นหาความผิดปกติในข้อมูลแบบอัตโนมัติ เหมาะสำหรับงาน Data Science รุ่นใหม่ที่ใช้ AI เสริมพลังการทำงาน

จากการเขียนโค้ดสู่
AI-Assisted Workflow

เมื่อ Python, MCP และ Agent AI ทำงานร่วมกัน

1. เตรียมข้อมูล

ใช้ Pandas และ NumPy โหลด ตรวจสอบ และทำความสะอาดข้อมูล เพื่อให้พร้อมสำหรับการวิเคราะห์

2. ใส่บริบทด้วย MCP

ส่ง dataset, schema และ metadata ให้ AI เข้าใจบริบทของข้อมูล และขอบเขตของงานที่ต้องการวิเคราะห์

3. ใช้ Agent AI

สร้าง agent ให้ช่วยทำงานซ้ำ ๆ เช่น EDA, visualization, anomaly detection หรือสรุปผลอัตโนมัติ

แนวคิดนี้ช่วยให้นักวิทยาการข้อมูลเปลี่ยนบทบาทจาก “ผู้เขียนโค้ดทั้งหมดด้วยตนเอง” ไปสู่ “ผู้ออกแบบ workflow ที่ทำงานร่วมกับ AI” ซึ่งเป็นทักษะสำคัญในสาย Data Science และ Software Innovation

กิจกรรมในชั้นเรียน
MCP Learning Path: From Zero to Hero

เส้นทางการเรียนรู้ Model Context Protocol สำหรับผู้เริ่มต้นอย่างแท้จริง

https://modelcontextprotocol.info/docs/learning-path/

Learning Path นี้ถูกออกแบบมาสำหรับผู้ที่ ไม่มีพื้นฐานด้าน AI หรือ Protocol มาก่อน โดยจะค่อย ๆ พัฒนาองค์ความรู้ตั้งแต่ระดับพื้นฐาน ไปจนถึงการสร้างระบบที่ใช้งาน MCP ได้จริงในงาน Data Science และ Software Innovation

Learning Goal

เมื่อจบเส้นทางนี้ นักศึกษาจะสามารถเข้าใจแนวคิดของ MCP, ใช้งาน MCP Server ที่มีอยู่แล้ว และพัฒนา Custom MCP Integration เพื่อเชื่อมต่อ AI กับข้อมูลและเครื่องมือของตนเองได้

Foundation

  • 1เข้าใจแนวคิด Context และ AI Tools
  • 2รู้จักโครงสร้าง MCP

Application

  • 3ใช้งาน MCP Server ที่มีอยู่
  • 4เชื่อม MCP กับ Python Data Workflow

Creation

  • 5ออกแบบ Custom MCP Integration
  • 6พัฒนา AI Agent สำหรับงานจริง
เส้นทางนี้จะช่วยให้นักศึกษาก้าวจาก ผู้ใช้งานเครื่องมือ ไปสู่ ผู้ออกแบบระบบ AI ที่เข้าใจบริบทข้อมูลอย่างแท้จริง ซึ่งเป็นทักษะสำคัญของนักวิทยาการข้อมูลในยุคใหม่