Data Analysis

1. Giới thiệu chung chương trình

Bối cảnh và xu hướng

Phân tích dữ liệu là một quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, thông báo kết luận và hỗ trợ ra quyết định. Phân tích dữ liệu có nhiều khía cạnh và cách tiếp cận, bao gồm các kỹ thuật đa dạng dưới nhiều tên khác nhau và được sử dụng trong các lĩnh vực kinh doanh, khoa học và khoa học xã hội khác nhau. Trong thế giới kinh doanh ngày nay, phân tích dữ liệu đóng vai trò giúp đưa ra quyết định khoa học hơn và giúp doanh nghiệp hoạt động hiệu quả hơn.Bên cạnh đó, dữ liệu là một trong những yếu tố quan trọng trong kinh doanh vì dữ liệu giúp chúng ta hiểu các vấn đề mà tổ chức đang gặp phải và việc sử dụng dữ liệu hiệu quả sẽ giúp doanh nghiệp cải thiện kết quả kinh doanh, đưa ra chiến lược thị trường tốt hơn, giảm chi phí, giúp doanh nghiệp ra quyết định nhanh và chính xác hơn,..

khoá học data analysis

Chuyên viên phân tích dữ liệu (Data Analyst) là người thực hiện các phân tích sâu dữ liệu (deep dive analytics) ở dạng đồ thị, biểu đồ, sơ đồ, bảng biểu và báo cáo; sau đó sử dụng các dữ liệu đó để xác định xu hướng và tạo mô hình dự đoán những gì có thể xảy ra trong tương lai.

Data Analyst là một trong những công việc có nhu cầu tuyển dụng cao nhất ở thời điểm hiện tại. Không khó để nhận thấy vai trò của họ trong hầu hết các ngành nghề, các tổ chức doanh nghiệp, từ sản xuất, kinh doanh, marketing cho tới các lĩnh vực về y tế, chăm sóc sức khỏe. Theo diễn đàn kinh tế thế giới, nhu cầu tuyển dụng nhân sự ngành phân tích dữ liệu tăng mạnh vào năm 2020, gấp 6 lần so với 5 năm trước. Trong 5 năm tới, tỉ lệ này sẽ tiếp tục tăng cao hơn nữa do lượng dữ liệu con người tạo ra ngày càng nhiều. Nhờ đó mà cơ hội việc làm và phát triển sự nghiệp của những người theo đuổi ngành phân tích dữ liệu cũng vô cùng rộng mở.

Mô tả ngắn về chương trình

Chương trình này có tên gọi “Chuyên viên phân tích dữ liệu” (Data Analysis). Chương trình bắt đầu bằng việc cung cấp các nguyên tắc cốt lõi nhất của phân tích dữ liệu (hệ sinh thái dữ liệu, phương pháp luận và vòng đời của một dự án phân tích dữ liệu, các công việc cụ thể và các hướng công việc chuyên sâu cho một chuyên viên phân tích dữ liệu) , sau đó sẽ giúp bạn thành thục các kỹ năng thiết yếu nhất mà một Data Analyst cần nắm được như các ngôn ngữ lập trình (Python với Pandas, Matplotlib, seaborn, plotly, SQL với MySQL, ERD, advance querries), BI tool (Excel, Power BI) hay các thuật toán học máy (hồi quy, phân loại và phân cụm)..

Bên cạnh đó, một trong những kỹ năng đặc trưng cho các chuyên viên phân tích dữ liệu là khả năng truyền đạt ý nghĩa thực tế của các phân tích định lượng cho stakeholder (các bên liên quan). Trong chương trình này, bạn sẽ học cách trở thành bậc thầy trong việc truyền đạt các hàm ý liên quan đến kinh doanh của các phân tích dữ liệu cho các bên liên quan, đảm bảo thành quả làm việc và phân tích dữ liệu của bạn có hiệu quả cao nhất bằng những câu chuyện được kể bằng dữ liệu thông qua các data dashboard.

Vào cuối chương trình, các bạn có thể chọn một trong 2 lựa chọn sau: Kết hợp các kỹ năng của mình để hoàn thành một dự án capstone hoặc đi thực tập tại danh nghiệp.

2. Học viên học xong có thể làm gì?

Sau khi học xong, người học có cơ hội:

Công việc

Vị trí tuyển dụng: Data Analyst, Business Inteligent Analyst.

Một số đơn vị tuyển dụng: Viettel, FPT Software, MB Bank, Momo.

Học chuyển tiếp

Học tiếp các Chứng chỉ tiếp theo về dữ liệu của Funix để nắm vững hơn về hệ sinh thái dữ liệu trong doanh nghiệp như: Kỹ thuật dữ liệu, khoa học dữ liệu, học máy.

Học viên có thể tiếp tục theo học để có thể lấy bằng Kỹ sư phần mềm của FPT University và các trường đại học quốc tế khác (Deakin, City University of Seatle).

3. Học viên học xong có năng lực gì?

O1: Hiểu rõ về hệ sinh thái dữ liệu của doanh nghiệp.

O2: Có góc nhìn toàn diện về tính chất công việc, nghiệp vụ của một DA/BI, từ đó định hướng được career path phù hợp nhất cho bản thân.

O3: Nắm được một quy trình hoàn chỉnh và chi tiết khi làm việc với dữ liệu, từ phân tích/đưa ra bài toán nghiệp vụ, trao đổi với stake holders (khách hàng và các bên liên quan) đến mô hình hóa dữ liệu thông qua các mô hình học máy.

O4: Sử dụng thành thạo các ứng dụng sau cho các bài toán thu thập, xử lý và phân tích dữ liệu: Excel, Power BI, Python và một số framework đặc thù khác (scikit-learn, pandas, …).

O5: Làm việc tốt với các hệ cơ sở dữ liệu quan hệ: Từ thiết kế và xây dựng hệ CSDL, viết truy vấn SQL, đến thiết kế và tối ưu Data Warehouse và các tiến trình ETL.

O6: Có thể thực hiện được 1 dự án thực tế về DA/BI hoàn chỉnh.

4. Yêu cầu đầu vào đối với học viên

Điều kiện tiên quyết

Trong trường hợp chưa có đầy đủ các kiến thức điều kiện, các bạn cần học thêm các môn học sau trong chứng chỉ điều kiện của chương trình Data Analysis:

Môn học này giới thiệu các khái niệm phân tích dữ liệu, vai trò của Nhà phân tích dữ liệu và các công cụ được sử dụng để thực hiện các chức năng hàng ngày. Bạn sẽ hiểu được hệ sinh thái dữ liệu và các nguyên tắc cơ bản của phân tích dữ liệu, chẳng hạn như thu thập dữ liệu hoặc khai thác dữ liệu. Sau đó, bạn sẽ học các kỹ năng mềm cần thiết để truyền đạt hiệu quả dữ liệu của bạn cho các bên liên quan và cách thành thạo các kỹ năng này có thể cung cấp cho bạn lựa chọn để trở thành người ra quyết định theo hướng dữ liệu.

Sau đó, học viên sẽ bắt đầu tìm hiểu nhẹ nhàng các quy trình về phân tích dữ liệu thông qua Excel - một trong những công cụ cơ bản và thông dụng nhất để làm việc với dữ liệu - cho dù là kinh doanh, tiếp thị, phân tích dữ liệu hay nghiên cứu. Bạn sẽ có được kinh nghiệm quý báu trong việc phân tích dữ liệu của mình bằng các kỹ thuật trong Excel như tạo bảng tổng hợp, trực quan hóa và mô hình hóa dữ liệu.

1. Nắm được các khái niệm cơ bản về công việc Phân tích dữ liệu và hệ sinh thái khoa học dữ liệu.

2. Hiểu rõ vai trò của Phân tích dữ liệu trong các bài toán kinh doanh.

3. Nắm được cách thức kết nối và giao tiếp với các bên liên quan trong một dự án liên quan đến Phân tích dữ liệu.

4. Sử dụng được excel để xử lý bài toán phân tích dữ liệu cơ bản từ đầu đến cuối.

Power BI đang nhanh chóng trở thành nền tảng BI (kinh doanh thông minh) mạnh mẽ nhất trên thế giới và là một trong những công cụ rất hữu ích cho cả các chuyên gia dữ liệu cũng như những người mới bắt đầu tìm hiểu về phân tích dữ liệu. Với Power BI, bạn có thể kết nối với hàng trăm nguồn dữ liệu, xây dựng các mô hình phức tạp bằng các công cụ đơn giản và trực quan, đồng thời thiết kế các bảng báo cáo và điều khiển tương tác tuyệt đẹp.

Trong khóa học này, bạn sẽ đóng vai trò là Nhà phân tích kinh doanh của Adventure Work Cycles, một công ty sản xuất toàn cầu. Nhiệm vụ của bạn sẽ là thiết kế và cung cấp một giải pháp kinh doanh thông minh đầu cuối, chất lượng và chuyên nghiệp thông qua Power BI với đầu vào là các tệp dữ liệu thô.

Chúng ta sẽ được hướng dẫn chi tiết cách sử dụng Power BI Desktop để thực thi nhiệm vụ trên. Bên cạnh đó, môn học sẽ cung cấp cho bạn các giải thích rõ ràng cũng như các kỹ thuật chuyên nghiệp hữu ích trong từng quá trình thực hiện. Chúng ta sẽ đi theo một tiến trình ổn định, có hệ thống để hoàn thành được một dự án hoàn chỉnh về Power BI.

1. Cài đặt và làm quen với giao diện của Power BI Desktop.

2. Xử lý, chuyển đổi và tích hợp được dữ liệu thô vào Power BI.

3. Xây dựng mô hình dữ liệu quan hệ với các bảng dữ liệu và quan hệ dữ liệu.

4. Sử dụng DAX để tính toán, trích xuất và phân tích dữ liệu.

5. Xây dựng được các báo cáo Power BI đẹp mắt, có thể tương tác với người dùng.

6. Thiết kế, xây dựng và triển khai được một quy trình BI hoàn chỉnh trên Power BI từ dữ liệu thô với các báo cáo và dashboard chất lượng.

Phần lớn dữ liệu của thế giới nằm trong cơ sở dữ liệu. SQL (hoặc Ngôn ngữ truy vấn có cấu trúc) là một ngôn ngữ mạnh mẽ được sử dụng để giao tiếp và trích xuất dữ liệu từ cơ sở dữ liệu. Cần phải có kiến thức về cơ sở dữ liệu và SQL nếu bạn muốn trở thành một nhà khoa học dữ liệu. Phần đầu tiên của khóa học giới thiệu các khái niệm cơ sở dữ liệu quan hệ và giúp bạn ôn lại các kiến thức từ cơ bản đến nâng cao của ngôn ngữ SQL. Nó cũng nhằm giúp bạn bắt đầu thực hiện và tối ưu các truy cập SQL trong môi trường khoa học dữ liệu.

Ở phần tiếp theo, chúng tôi sẽ đưa bạn đến với các nguyên tắc và khái niệm cơ bản về Kho dữ liệu - data warehouse thông qua các phương pháp thiết kế (kiến trúc và chiều dữ liệu) và trao đổi, phân tích và tải dữ liệu (ETL) mà bạn sẽ cần để triển khai data warehouse cho bất kỳ một doanh nghiệp nào. Bạn sẽ tìm thấy nhiều ví dụ minh họa rõ ràng các khái niệm và kỹ thuật chính về datawarehouse được đề cập trong suốt phần 2 của môn học. Bạn sẽ được thiết lập để không chỉ vận hành các nguyên tắc này mà còn đưa ra các quyết định về kiến trúc và thiết kế quan trọng theo các yêu cầu kinh doanh và kỹ thuật của data warehouse mà doanh nghiệp yêu cầu.

1. Nắm vững cách hoạt động của CSDL quan hệ.

2. Biết cách viết và tối ưu được các truy vấn từ đơn giản đến phức tạp trên SQL.

3. Thiết kế và xây dựng được 1 datawarehouse hoàn chỉnh.

4. Hiểu rõ về quy trình ETL trong cơ sở dữ liệu cũng như các thao tác chi tiết cho từng bước.

Môn học này sẽ đưa bạn đến với Python, từ những điều cơ bản về Python để khám phá nhiều loại dữ liệu khác nhau. Bạn sẽ học cách chuẩn bị dữ liệu để phân tích, thực hiện phân tích thống kê đơn giản, tạo hình ảnh trực quan dữ liệu có ý nghĩa, dự đoán xu hướng tương lai từ dữ liệu và hơn thế nữa với các thư viện xử lý dữ liệu mạnh mẽ nhất trên Python: Pandas, Matplotlib, numpy và scikit-learn.

1. Sử dụng Python để làm việc với nhiều dạng dữ liệu khác nhau như: image, audio, text file, dữ liệu web.

2. Biết viết regular expression để làm các querry từ đơn giản đến phức tạp với dữ liệu text.

3. Sử dụng thành thạo Pandas cho các tác vụ làm sạch, biến đổi, xử lý và phân tích dữ liệu.

4. Sử dụng được Python để trực quan hóa dữ liệu thông qua các thư viện từ cơ bản đến nâng cao.

5. Làm quen với một số bài toán mô hình hóa dữ liệu cơ bản như hồi quy tuyến tính và hồi quy logistic.

Hoàn thành môn học, học viên sẽ biết cách kết hợp các kiến thức về dữ liệu để tạo ra một sản phẩm/hệ thống về lưu trữ, xử lý và phân tích dữ liệu. Từ đó học viên sẽ tiếp tục hoàn thiện được các kỹ năng của mình liên quan đến phân tích dữ liệu.

Đối với các học viên theo học chương trình biên soạn, học viên sẽ được hướng dẫn chọn làm đề tài/khóa luận với các mentor hướng dẫn trực tiếp.

Đối với các bạn học viên thực tập tại các doanh nghiệp, có thể chủ động tìm hiểu và vận dụng các kiến thức đã học hoàn thành mục tiêu thực tập.

Trở thành lập trình viên chuyên nghiệp

Mục tiêu của môn học là giúp các bạn học viên lấp những lỗ hổng về kiến thức và kỹ năng mềm nhằm nâng cao tỉ lệ học viên pass phỏng vấn vào doanh nghiệp mà mình mong muốn.

Trong phần đầu tiên, chúng ta sẽ bắt đầu với cách cài đặt IDE và các tiện ích đi kèm, các kỹ năng cần thiết để phát triển khả năng viết code, tư duy giải quyết vấn đề, công cụ quản lý phiên bản Git và cách sử dụng phương pháp quản lý công việc Kanban với Trello.

Tiếp đó, trong phần thứ hai, chúng ta sẽ được học các kiến thức nền tảng về kỹ thuật phần mềm như quy trình xây dựng phần mềm, vẽ lưu đồ và quy trình, UML Diagram với draw.io.

Ở phần ba, bạn sẽ được tìm hiểu về các nền tảng Free Hosting mà bạn có thể sử dụng để triển khai dự án của mình, công cụ Shell và giao diện dòng lệnh, kiến thức cơ bản về mô hình Agile.

Mục tiêu môn học

Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:

Nắm được các kỹ năng để trở thành một lập trình viên hoàn thiện

Hiểu quy trình xây dựng phần mềm

Hiểu về phương thức phát triển phần mềm Agile

Biết cách viết CV và sẵn sàng cho phỏng vấn

Link nội dung: https://tlpd.vn/data-analysis-a37106.html