Skip to main content

Học máy cho Khoa học Dữ liệu

Enrollment in this course is by invitation only

Thông tin Chung

Mã môn học: DSP303x
Tên môn học: Học máy cho Khoa học Dữ liệu
Số tín chỉ: 3
Thời gian học: 6 tuần

Môn học thứ 3 của chương trình Data Science đi sâu vào các phần kiến thức cơ bản của học máy và ứng dụng của nó trong các lĩnh vực khác nhau như chăm sóc sức khỏe, ngân hàng, viễn thông, v.v. Bạn sẽ tìm hiểu về các kỹ thuật học máy hiệu quả nhất, cách sử dụng và tinh chỉnh các mô hình học máy cho bài toán cụ thể mà bạn cần giải quyết. Quan trọng hơn, bạn sẽ học không chỉ về nền tảng lý thuyết mà còn học được bí quyết thực tế cần thiết để áp dụng nhanh chóng và mạnh mẽ các kỹ thuật này vào các vấn đề mới.

Để bắt đầu, chúng tôi khuyên bạn nên dành một vài phút để khám phá trang web khóa học. Xem lại tài liệu chúng tôi sẽ đề cập mỗi tuần và xem trước các bài tập / dự án / câu hỏi bạn cần hoàn thành để vượt qua khóa học.

Các khái niệm chính được truyền tải thông qua các video, các bản demo và các bài tập thực hành.

MỤC TIÊU MÔN HỌC

  • Có cái nhìn tổng quan về các định nghĩa và các chủ đề khác nhau trong Machine Learning: học có giám sát, học không giám sát.
  • Có cái nhìn tổng quan và kiến thức cơ bản về Hồi quy, Phân loại, Phân cụm và Hệ thống Đề xuất, ARIMA, sau đó áp dụng được các loại thuật toán ở trên vào giải quyết các bài toán thực tế.
  • Thao tác thành thạo các thư viện điển hình và cơ bản trong học máy với Python: Numpy, sklearn, pandas, matplotlib.
  • Hiểu các phương pháp đánh giá và số liệu trong các vấn đề và bài toán khác nhau của học máy.
  • Có thể áp dụng Ensemble Learning (Học máy kết hợp) trong việc tăng độ chính xác của mô hình.

CẤU TRÚC MÔN HỌC

Phần 1 - Học máy là gì?

  • Bài 1 - Giới thiệu về Machine Learning

Phần 2 - Hồi quy

  • Bài 2 - Hồi quy tuyến tính
  • Lab 1 - Hồi quy tuyến tính cơ bản
  • Bài 3 -  Hồi quy nâng cao
  • Lab 2 - Hồi quy nâng cao

Project 1 - Dự đoán số người trúng tuyển American College

Phần 3 - Phân loại

  • Bài 4 - Tổng quan về phân loại
  • Lab 3 - KNN
  • Bài 5 - Hồi quy logistic
  • Lab 4 - Liệu khách hàng có quay lưng với chúng ta?
  • Bài 6 - Cây quyết định
  • Lab 5 - Phân loại nấm Bắc Mỹ sử dụng DT
  • Bài 7 - Support Vector Machine
  • Lab 6 - Dự đoán bệnh nhân mắc Parkinson với SVM

Project 2 - Dự đoán khả năng mắc bệnh tiểu đường loại 2 tại Arizona

Phần 4 - Phân cụm

  • Bài 8 - Phân cụm k-Means
  • Lab 7 - Sử dụng k-Means để phân tập khách hàng
  • Bài 9 - Phân cụm phân cấp
  • Lab 8 - Agglomerative clustering
  • Bài 10 - DBSCAN
  • Lab 9 - Quan sát kết quả phân cụm với DBSCAN

Project 3 - Phân cụm hành vi di chuyển dựa theo dữ liệu điện thoại

Phần 5 - Hệ thống Đề xuất

  • Bài 11 - Hệ thống khuyến nghị dựa trên nội dung
  • Lab 10 - Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo nội dung mặt hàng
  • Bài 12 - Lọc cộng tác
  • Lab 11: Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo lọc cộng tác

Phần 6 - Dự báo chuỗi thời gian

  • Bài 13 -  ARIMA

ĐỘI NGŨ THIẾT KẾ MÔN HỌC

THIẾT KẾ MÔN HỌC

M.Sc. Nguyễn Hải Nam

  • Chief mentor & chuyên gia thiết kế khóa học tại FUNiX
  • Thạc sĩ Khoa học Máy tính, Đại học Cassino, Ý
  • Cử nhân Khoa học ứng dụng, Kỹ thuật viễn thông, PTIT
  • Lĩnh vực nghiên cứu: Deep Learning, Computer vision, Handwritting OCR, Abnormal detection
  • Online profile: https://www.linkedin.com/in/hai-nam-nguyen-474587119/ 

M.S. Vũ Thương Huyền

  • Nhà khoa học dữ liệu tại FPT Software - FPT
  • Thạc sĩ Kỹ thuật phần mềm, Đại học Công nghệ, Đại học Quốc gia Hà Nội
  • Cử nhân Kỹ thuật, Toán ứng dụng và Tin học, Đại học Bách Khoa Hà Nội
  • Lĩnh vực nghiên cứu: Machine learning, Deep learning, Reinforcement Learning, Natural Language Processing…
  • Profile online: https://www.linkedin.com/in/thuong-huyen-3969747a/ 

CHUYÊN GIA PHẢN BIỆN 

Chuyên gia phản biện chi tiết

 

 

Kiểm thử

 

 

Ph.D. Đặng Hoàng Vũ

  • Giám đốc khoa học FPT
  • Tiến sĩ Toán học, Đại học Cambridge
  • Thành viên nòng cốt của các hoạt động R&D tại Tập đoàn FPT
  • Chịu trách nhiệm chính trong lĩnh vực phân tích của Platform quản lý dữ liệu  và nghiên cứu khoa học dữ liệu của FPT

B.A. Hồ Quốc Bảo

  • Trợ lý Nghiên cứu, học viên cao học về Công nghệ Micro và Nano, Đại học Đông Nam, Na Uy 
  • Học viên Cao học Kỹ thuật Viễn thông, ĐHBK HCM
  • Cử nhân Kỹ thuật Điện tử Viễn thông, ĐHBK
  • Lĩnh vực nghiên cứu: Signal Processing, Modelling, Machine Learning, Optical cable, Ultrasound Signal
  • Hồ sơ online: https://www.linkedin.com/in/quoc-bao-ho-bb239288/

CHUYÊN GIA PHẢN BIỆN KHUNG CHƯƠNG TRÌNH

 Assoc. Prof. Từ Minh Phương

Ph.D. Nguyễn Văn Vinh

Ph.D. Trần Thế Trung

  • Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
  • Chuyên gia tư vấn công nghệ AI & machine learning
  • Trưởng phòng Lab Học máy & Ứng dụng của PTIT
  • Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
  • Chuyên gia  tư vấn AI cho DPS, Fsoft
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân CNTT, Đại học Công nghệ, VNU
  • Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
  • Bằng tiến sĩ Vật lý tính toán, UVSQ Université de Versailles 
  • Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
  • Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne

NGUỒN HỌC LIỆU 

      Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.

      Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nghiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.

      Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: CourseraedX trainingtutorialpointsMachine Learning cơ bảnTowards Data ScienceÔng Xuân HồngMedium, Data Novia.


      Kênh phản hồi

      FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email [email protected].