แผนการเรียนรู้
/

บทนำสู่
ชุดเครื่องมือสำหรับวิทยาการข้อมูล

Python • Git • Docker • Jupyter Notebook • MCP • Agent AI

ผลลัพธ์การเรียนรู้

1
อธิบายแนวคิดพื้นฐานของวิทยาการข้อมูลได้
2
ระบุเครื่องมือสำคัญที่ใช้ในงานวิทยาการข้อมูลได้อย่างน้อย 3 รายการ
3
เข้าใจการใช้ Git และ GitHub สำหรับจัดการโค้ดและโครงการ
4
ติดตั้งและใช้งานสภาพแวดล้อมสำหรับการวิเคราะห์ข้อมูลเบื้องต้นได้
5
เชื่อมโยงแนวคิดของ MCP และ Agent AI เข้ากับงานวิทยาการข้อมูลเบื้องต้นได้
สัปดาห์ที่ 1

ภาพรวมของ
วิทยาการข้อมูลและการใช้งานในโลกจริง

จากข้อมูลสู่ความรู้ • จากความรู้สู่การตัดสินใจ • จากการตัดสินใจสู่นวัตกรรม

สาระสำคัญของสัปดาห์ที่ 1 (ตอนที่ 2)

  • ทำความเข้าใจองค์ประกอบของวงจรการทำงานด้านวิทยาการข้อมูล (Data Science Workflow)
  • สำรวจบทบาทของนักวิทยาการข้อมูล (Data Scientist), นักวิเคราะห์ข้อมูล (Data Analyst), และวิศวกรข้อมูล (Data Engineer)
  • เรียนรู้ตัวอย่างการประยุกต์ใช้วิทยาการข้อมูลในธุรกิจ เช่น การตลาด การเงิน และสุขภาพ
  • แนะนำเครื่องมือยอดนิยม เช่น Python, R, SQL, Jupyter, และ Cloud-based Tools
  • อภิปรายถึงความสำคัญของความถูกต้องและจริยธรรมของข้อมูล

ผลลัพธ์การเรียนรู้ย่อย

1
อธิบายวงจรการทำงานของวิทยาการข้อมูลได้
2
ระบุบทบาทของผู้ที่เกี่ยวข้องในทีมวิทยาการข้อมูลได้อย่างถูกต้อง
3
ยกตัวอย่างการประยุกต์ใช้วิทยาการข้อมูลในสถานการณ์จริงได้
4
ตระหนักถึงความสำคัญของจริยธรรมในการใช้ข้อมูล

เครื่องมือหลักใน
ชุดเครื่องมือวิทยาการข้อมูล

เครื่องมือสำคัญที่ช่วยให้นักวิทยาการข้อมูลทำงานได้อย่างมีประสิทธิภาพ

เครื่องมือพื้นฐานที่ต้องรู้จัก

🔹 ภาษาโปรแกรม

  • Python — ภาษาหลักของงาน Data Science
  • R — การวิเคราะห์เชิงสถิติ
  • SQL — การดึงและจัดการข้อมูลจากฐานข้อมูล

🔹 เครื่องมือพัฒนาและวิเคราะห์

  • Jupyter Notebook — สำหรับทดลองและนำเสนอการวิเคราะห์
  • Google Colab — เครื่องมือบนคลาวด์สำหรับการคำนวณข้อมูล
  • VS Code — เครื่องมือพัฒนาโค้ดที่ยืดหยุ่น

🔹 การควบคุมเวอร์ชัน

  • Git & GitHub — จัดการเวอร์ชันของโค้ดและทำงานร่วมกัน
  • GitHub Copilot — ใช้ AI ช่วยเขียนโค้ด

🔹 การจำลองสภาพแวดล้อม

  • Docker — จัดการสภาพแวดล้อมการทำงานแบบพกพา
  • Virtual Environments (venv, conda) — แยก dependencies ของโปรเจกต์

ผลลัพธ์การเรียนรู้ย่อย

1
ระบุเครื่องมือสำคัญใน Data Science Toolbox ได้อย่างน้อย 5 รายการ
2
อธิบายหน้าที่ของแต่ละเครื่องมือในกระบวนการทำงานข้อมูลได้
3
ตั้งค่าสภาพแวดล้อมสำหรับการวิเคราะห์ข้อมูลด้วย Python และ Jupyter ได้
4
ใช้ Git เพื่อบันทึกและติดตามการเปลี่ยนแปลงของโค้ดได้

การติดตั้งสภาพแวดล้อมสำหรับ
วิทยาการข้อมูล

เตรียมเครื่องมือพื้นฐานสำหรับเริ่มต้นงานด้าน Data Science

ขั้นตอนการติดตั้งและตั้งค่าสภาพแวดล้อม

  1. ติดตั้ง Python: ดาวน์โหลดจาก python.org และตรวจสอบด้วยคำสั่ง python --version.
  2. ติดตั้ง Anaconda หรือ Miniconda: เพื่อจัดการแพ็กเกจและสภาพแวดล้อมการทำงาน.
  3. ติดตั้ง VS Code: ใช้เป็นเครื่องมือหลักในการพัฒนาโค้ด พร้อมติดตั้งส่วนขยาย Python และ Jupyter.
  4. ติดตั้ง Git และสร้างบัญชี GitHub: เพื่อควบคุมเวอร์ชันและทำงานร่วมกันกับทีม.
  5. ติดตั้ง Jupyter Notebook / JupyterLab: สำหรับเขียนและนำเสนอการวิเคราะห์ข้อมูล.
  6. ติดตั้ง Docker (เสริม): สำหรับจำลองสภาพแวดล้อมที่เหมือนกันทุกเครื่อง.

คำสั่งเบื้องต้นที่ควรรู้

🐍 Python / Conda

  • conda create -n dsenv python=3.11 — สร้างสภาพแวดล้อมใหม่
  • conda activate dsenv — เปิดใช้งานสภาพแวดล้อม
  • pip install numpy pandas matplotlib — ติดตั้งไลบรารีพื้นฐาน

🧰 Git / Jupyter

  • git init — สร้าง repository ใหม่
  • git clone <url> — คัดลอกโปรเจกต์จาก GitHub
  • jupyter notebook — เปิดใช้งาน Jupyter Notebook

ผลลัพธ์การเรียนรู้ย่อย

1
ติดตั้งและตั้งค่าสภาพแวดล้อม Python สำหรับ Data Science ได้สำเร็จ
2
ใช้ Jupyter Notebook เพื่อทดลองโค้ดและวิเคราะห์ข้อมูลได้
3
ใช้ Git เพื่อจัดการโครงการและอัปโหลดโค้ดขึ้น GitHub ได้
4
เข้าใจแนวคิดของ Docker และสามารถใช้งานเบื้องต้นได้

สรุปและแบบฝึกหัดท้ายบท
บทนำสู่ชุดเครื่องมือวิทยาการข้อมูล

ทบทวนเนื้อหาและฝึกใช้เครื่องมือจริง เพื่อเตรียมพร้อมสำหรับสัปดาห์ถัดไป

สรุปประเด็นสำคัญของสัปดาห์ที่ 1

  • เข้าใจภาพรวมของวิทยาการข้อมูลและบทบาทในโลกยุคดิจิทัล
  • รู้จักวงจรการทำงานของ Data Science (Data → Knowledge → Action)
  • แนะนำเครื่องมือสำคัญ เช่น Python, Git, Docker, Jupyter Notebook
  • สามารถติดตั้งและตั้งค่าสภาพแวดล้อมเบื้องต้นสำหรับการทำงานข้อมูลได้
  • เริ่มต้นใช้ Git และ GitHub สำหรับการจัดการโค้ดและโครงงานกลุ่มได้

แบบทดสอบทบทวนความเข้าใจ (Quick Quiz)

  1. เครื่องมือใดใช้สำหรับควบคุมเวอร์ชันของโค้ดในงานวิทยาการข้อมูล?
  2. Docker มีประโยชน์อย่างไรในงาน Data Science?
  3. เหตุใด Jupyter Notebook จึงเป็นที่นิยมในการวิเคราะห์ข้อมูล?
  4. จงยกตัวอย่างการประยุกต์ใช้วิทยาการข้อมูลในชีวิตประจำวัน 1 ตัวอย่าง
  5. Model Context Protocol (MCP) และ Agent AI เกี่ยวข้องกับ Data Science อย่างไร?

แบบฝึกหัดปฏิบัติ (Assignment)

1
ติดตั้ง Python, VS Code, Git และ Jupyter Notebook บนเครื่องของคุณ
2
สร้างโฟลเดอร์โปรเจกต์ชื่อ ds-toolbox-week1 และเริ่มต้น repository ด้วย Git
3
เขียนโค้ด Python สั้น ๆ ใน Jupyter Notebook เพื่ออ่านและแสดงข้อมูลจากไฟล์ CSV
4
อัปโหลดโปรเจกต์ขึ้น GitHub และแชร์ลิงก์ในห้องเรียน
🎯 ภารกิจ: สร้างสภาพแวดล้อมที่พร้อมสำหรับการเรียนรู้ Data Science และเตรียมโครงงานขนาดเล็กสำหรับสัปดาห์ถัดไป “Version Control System”