Skip to main content

Giới thiệu về Khoa học Dữ liệu

Giới thiệu về Khoa học Dữ liệu

Xin chào các bạn!

Khóa học đầu tiên của Chương trình Khoa học Dữ liệu được xây dựng với mục đích cung cấp một cái nhìn khái quát cùng các kiến thức nền tảng và thiết yếu về Khoa học Dữ liệu. Trong khóa học này, các chuyên gia Khoa học dữ liệu sẽ giới thiệu tới người học các khái niệm về khoa học dữ liệu, những nhiệm vụ chính của nhà khoa học dữ liệu cũng như các công cụ và thuật toán cơ bản được sử dụng thường xuyên. Người học cũng có cơ hội khám phá những kỹ năng cần thiết để theo đuổi lĩnh vực này. Bạn sẽ tìm hiểu những gì một doanh nghiệp cần chuẩn bị để bắt đầu với khoa học dữ liệu, cũng như những phẩm chất phân biệt các nhà khoa học dữ liệu với các ngành nghề khác. Quan trọng hơn, người học sẽ tìm hiểu về kỹ năng phân tích và vai trò quan trọng của các nhà khoa học dữ liệu trong quá trình này, cũng như về cách "kể chuyện" thông qua dữ liệu (story telling) và truyền đạt kết quả của dự án một cách hiệu quả.

Chúc các bạn học tốt!


MỤC TIÊU MÔN HỌC

Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:

  • Nắm vững các khái niệm về Khoa học dữ liệu
  • Nắm vững các công cụ dành cho Khoa học dữ liệu
  • Nắm vững về phương pháp luận trong Khoa học dữ liệu và có thể vận dụng vào quy trình giải quyết dự án về Khoa học dữ liệu
  • Vận dụng được Python cơ bản, cấu trúc dữ liệu bằng Python
  • Vận dụng được làm việc với dữ liệu văn bản thông qua Numpy, Pandas
  • Hiểu rõ cách làm việc với dữ liệu hình ảnh, âm thanh trong Python
  • Vận dụng được làm việc với dữ liệu Web thông qua Regex và Json


TRẢI NGHIỆM HỌC TẬP

Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 4 phần với 14 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.

Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.


CẤU TRÚC MÔN HỌC

Phần 1: Khoa học dữ liệu là gì?

  • Bài 1 – Định nghĩa về Khoa học dữ liệu
  • Bài 2 – Chủ đề Khoa học Dữ liệu
  • Bài 3 – Jupyter Notebooks

Phần 2: Phương pháp luận Khoa học dữ liệu

  • Bài 4 – Từ bài toán đến hướng tiếp cận giải quyết
  • Bài 5 – Từ xác định yêu cầu đến thu thập các nguồn dữ liệu
  • Bài 6 – Từ hiểu dữ liệu đến chuẩn bị dữ liệu
  • Bài 7 – Từ mô hình hóa đến việc đánh giá mô hình
  • Bài 8 – Từ triển khai mô hình đến nhận phản hồi

Assignment 1 - Phương pháp luận Khoa học Dữ liệu

Phần 3: Công cụ cho Khoa học Dữ liệu

  • Bài 9 – Ngôn ngữ lập trình cho Khoa học Dữ liệu
  • Bài 10 – Git/Github

Phần 4: Python cho Khoa học Dữ liệu

  • Bài 11 – Python cơ bản: Cấu trúc dữ liệu
  • Bài 12 – Numpy trong Python
  • Bài 13 – Làm việc với dữ liệu trong Pandas
  • Bài 14 – Làm việc với dữ liệu Web trong Python

Assignment 2 – Tính toán và phân tích điểm thi (Test Grade Calculator)


CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC

THIẾT KẾ MÔN HỌC: Th.S Vũ Thương Huyền

  • Trình độ chuyên môn: Thạc sĩ Kỹ thuật phần mềm, Đại học Công nghệ, Đại học Quốc gia Hà Nội
  • Nghề nghiệp: Senior Data Scientist
  • Nơi công tác: FPT Software - FPT
  • Lĩnh vực nghiên cứu: Machine learning, Deep learning, Reinforcement Learning, Natural Language Processing
  • Online profile: https://www.linkedin.com/in/thuong-huyen-3969747a/

PHẢN BIỆN MÔN HỌC: T.S Đặng Hoàng Vũ

  • Trình độ chuyên môn: Tiến sĩ Toán học, Đại học Cambridge
  • Nghề nghiệp: Giám đốc khoa học FPT
  • Nơi công tác: FPT Software - FPT
  • Công việc hiện tại: Chịu trách nhiệm chính trong lĩnh vực phân tích của Platform quản lý dữ liệu và nghiên cứu khoa học dữ liệu của FPT

CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH DS

T.S Từ Minh Phương

  • Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
  • Chuyên gia tư vấn công nghệ AI & machine learning
  • Trưởng phòng Lab Học máy & Ứng dụng của PTIT

T.S Nguyễn Văn Vinh

  • Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
  • Chuyên gia tư vấn AI cho DPS, Fsoft
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân CNTT, Đại học Công nghệ, VNU

T.S Trần Thế Trung

  • Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
  • Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne

NGUỒN HỌC LIỆU

Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.

Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.

Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.


KÊNH PHẢN HỒI

FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email [email protected]

Enroll