Mã lớp: PYT_LV2
Hiệu lực áp dụng: Từ ngày 01/05/2025
Thông tin chung
Thời lượng: 07 buổi
- 06 buổi học qua video theo dự án nâng cao (project-based learning)
- 01 buổi Project Day (tự thực hiện & trình bày sản phẩm cuối khoá)
Hình thức học:
- Video bài giảng + Notebook hướng dẫn thực hành từng bước
- Hình thức: học trực tuyến, hỗ trợ qua zalo/telegram/email/Google Drive
Syllabus chi tiết
Buổi Học/Hoạt động | Mục tiêu | Nội dung chi tiết |
Buổi 1 | Tổng quan & chuẩn bị môi trường Machine Learning. | – Tổng quan về AI, các loại học máy và lịch sử phát triển. – Giới thiệu quy trình triển khai một dự án dữ liệu thực tế. – Phân loại: học có giám sát, không giám sát, học tăng cường. – Hướng dẫn cài đặt môi trường, thư viện: Scikit-learn, Pandas, Matplotlib. – Ứng dụng ChatGPT để phân tích bài toán & hỗ trợ cài đặt nhanh môi trường. |
Buổi 2 | Linear Regression – Dự đoán biến số liên tục. | – Lý thuyết hồi quy tuyến tính: đơn biến, đa biến, polynomial. – Xây dựng model từ đầu: pipeline, feature scaling. – Đánh giá mô hình bằng MAE, RMSE, R2. – Case Study: Dự đoán điểm lead score cho hệ thống CRM. – Hướng dẫn sinh mã code bằng Gemini và kiểm tra dữ liệu bằng Copilot. |
Buổi 3 | Tối ưu hóa mô hình hồi quy & đánh giá tự động. | – Gradient Descent cơ bản & biểu diễn trực quan. – Điều chỉnh tham số tự động với GridSearchCV. – Visual hóa quá trình huấn luyện. – Dùng ChatGPT để viết lại hàm đánh giá theo yêu cầu doanh nghiệp. |
Buổi 4 | Case Study – Dự đoán giá nhà (Boston Housing). | – Phân tích bộ dữ liệu Boston, trực quan hóa tương quan. – Huấn luyện mô hình từ đầu & với sklearn. – So sánh mô hình hồi quy đa biến vs. polynomial. – Sử dụng AI để đề xuất cải tiến mô hình, sinh dashboard tự động hóa phân tích. |
Buổi 5 | Logistic Regression – Phân loại khách hàng. | – Lý thuyết Logistic Regression, hàm sigmoid. – Phân biệt mô hình hồi quy tuyến tính vs phân loại nhị phân. – Confusion Matrix, Accuracy, Precision, Recall, F1-score, ROC/AUC. – Case Study: Dự đoán khách hàng rời bỏ (Churn Analytics). – ChatGPT giúp tối ưu pipeline và sinh bảng đánh giá mô hình. |
Buổi 6 | Unsupervised Learning – Phân khúc khách hàng. | – Khác biệt giữa supervised vs. unsupervised. – Thuật toán chính: PCA, KMeans, Hierarchical Clustering. – Case Study: Phân loại khách hàng (RFM + Clustering). – Ứng dụng Gemini tạo báo cáo RFM & visualize kết quả. |
Buổi 7: Project Day | Trình bày dự án, bảo vệ kết quả và nhận phản hồi. | – Use case lựa chọn: Lead Score Prediction, Credit Score Classification, Customer Segmentation. – Hoạt động: Xây dựng pipeline, tạo báo cáo trình bày kết quả cuối khoá. |
Tài nguyên đi kèm
- Video hướng dẫn chi tiết + notebook thực hành mỗi buổi
- Dữ liệu mẫu (Boston Housing, CRM Leads, Banking Customers)
- Prompt mẫu cho ChatGPT & Gemini (phân tích, sinh mã, debug)
- Template báo cáo cuối khoá (notebook + presentation slide)
- Nhóm hỗ trợ qua Zalo / Telegram / Email / Google Drive
Hỗ trợ sau khóa học
- Coaching/Mentoring 1-1 (tối đa 1h/tuần, kéo dài 01 thán sau khi học xong)
- Hướng dẫn học chuyên sâu: TensorFlow/Keras, Recommendation System, MLOps