Khóa học

Lộ trình Học Trí tuệ Nhân tạo

Published

7 tháng ago

20 Tháng 9, 2024

Bạn có muốn học Trí tuệ Nhân tạo và đang tìm kiếm một Lộ trình Học Trí tuệ Nhân tạo [Lộ trình AI] không?… Nếu có, bài viết này dành cho bạn. Trong bài viết này, bạn sẽ tìm thấy một Lộ trình từng bước để học Trí tuệ Nhân tạo cho năm 2024.

Vậy, không cần chần chừ nữa, hãy bắt đầu Lộ trình Học Trí tuệ Nhân tạo [Lộ trình AI] ngay thôi.

Lộ trình học Trí tuệ Nhân tạo 2024/Lộ trình cho Kỹ sư AI Mới bắt đầu

Trí tuệ Nhân tạo đang ngày càng phổ biến trong thời gian gần đây. Chúng ta có thể thấy sự phát triển của AI trong mọi lĩnh vực như Xe tự lái, Robotics, Gợi ý sản phẩm, Google Assistant/Siri/Alexa, v.v. Để trở thành một Kỹ sư AI, bạn phải có các kỹ năng sau:

Toán học
Lập trình
Dữ liệu lớn (Big Data)
Khoa học Dữ liệu (Data Science)
Học Máy (Machine Learning)
Học Sâu (Deep Learning)
AI Tạo sinh/ Mô hình Ngôn ngữ Lớn (LLMs)
Xử lý Ngôn ngữ Tự nhiên (Natural Language Processing)
Trí tuệ Kinh doanh (Business Intelligence)

Bây giờ, hãy chuyển sang Lộ trình Học tập Trí tuệ Nhân tạo 2024.

Tôi đã cập nhật Lộ trình Học tập Trí tuệ Nhân tạo này vì có rất nhiều thuật ngữ mới xuất hiện trong lĩnh vực AI vào năm 2024. Đó là lý do tại sao bạn phải cập nhật với những thuật ngữ mới này như Large Language Models (Mô hình Ngôn ngữ Lớn), Generative AI (AI Tạo sinh), và Retrieval Augmented Generation (RAG) (Tạo sinh Tăng cường Truy xuất /RAG).

Bước 1. Hiểu về Cơ bản của Trí tuệ Nhân tạo (Artificial Intelligence)

Trước khi học các kỹ năng thiết yếu khác, trước tiên hãy học những kiến thức cơ bản về Trí tuệ Nhân tạo.

Ở bước này, bạn phải hiểu Trí tuệ Nhân tạo là gì, tác động của nó, xu hướng tương lai của Trí tuệ Nhân tạo, và ứng dụng của nó trong các lĩnh vực khác nhau.

Bạn có thể học những điều này từ bất kỳ hướng dẫn YouTube nào hoặc từ bất kỳ khóa học MIỄN PHÍ nào. Tôi cũng sẽ liệt kê một số nguồn tài liệu để học những kiến thức cơ bản về Trí tuệ Nhân tạo.

Tài nguyên để học AI

Intro to Artificial Intelligence– Udacity FREE Course
AI For Everyone– Coursera FREE to Audit Course
AI Foundations for Everyone Specialization– Coursera
AI Programming with Python– Udacity
AI Fundamentals– Udacity FREE Course
Introduction to Artificial Intelligence with Python-edX
Artificial Intelligence Full Course– YouTube
Artificial Intelligence For Beginners– YouTube

Bước 2. Học Toán

Bước tiếp theo của bạn nên là học Toán.

Trong các bước sắp tới, bạn sẽ phải học các thuật toán Máy học và Học sâu. Kiến thức toán học sẽ giúp bạn hiểu cách hoạt động của các thuật toán học sâu và máy học. Trong Toán học, bạn cần học:

Đại số tuyến tính (Linear Algebra): Cần thiết cho việc thao tác dữ liệu, liên quan đến vector và ma trận được sử dụng trong tiền xử lý dữ liệu và các thuật toán máy học.
Giải tích (Calculus): Giải tích vi phân rất quan trọng cho việc tối ưu hóa trong máy học, đặc biệt là các kỹ thuật dựa trên gradient.
Xác suất và Thống kê (Probability and Statistics): Quan trọng để hiểu phân phối dữ liệu (data distributions), kiểm định giả thuyết (hypothesis testing) và phân tích hồi quy (egression analysis) trong AI.
Giải tích đa biến (Multivariate Calculus): Cần thiết để tối ưu hóa các hàm có nhiều biến (multiple variables), phổ biến trong các mô hình AI.
Lý thuyết thông tin (Information Theory): Bao gồm các khái niệm như entropy, thông tin tương hỗ (mutual information) và độ phân kỳ Kullback-Leibler, liên quan đến phân tích dữ liệu và máy học.
Tối ưu hóa: Kiến thức về các thuật toán tối ưu hóa như gradient descent để huấn luyện mô hình.
Toán rời rạc (Discrete Mathematics): Cần thiết cho thuật toán và lý thuyết đồ thị, được sử dụng trong các thuật toán tìm kiếm và phân tích mạng.
Lý thuyết tập hợp (Set Theory): Nền tảng cho logic và biểu diễn kiến thức trong AI biểu tượng.
Quy hoạch tuyến tính (Linear Programming): Hữu ích trong các bài toán tối ưu hóa, như phân bổ tài nguyên.
Phân tích phức (Complex Analysis) (Không bắt buộc): Liên quan đến các ứng dụng cụ thể, như xử lý tín hiệu.

Có nhiều nguồn tài liệu khác nhau để học các khái niệm toán học. Tôi cũng sẽ liệt kê một số nguồn tài liệu.

Resources for Learning Math

Intro to Statistics– Udacity FREE Course
Linear Algebra Refresher Course– Udacity FREE Course
Basic Statistics (Online Course)
Statistics and probability (Khan Academy)
Practical Statistics for Data Scientists (TextBook)
Data Science: Statistics and Machine Learning Specialization (Online Course)
Statistics for Data Science (YouTube Video)
Mathematics for Data Science Specialization (Online Course)
Khan Academy
Data Science Math Skills (Online Course)

Bước 3. Học Ngôn ngữ Lập trình

Sau khi học toán, bước tiếp theo của bạn nên là học Ngôn ngữ Lập trình.

Trong Trí tuệ Nhân tạo, kiến thức về ngôn ngữ lập trình là thiết yếu.

Không có kiến thức về ngôn ngữ lập trình, bạn không thể triển khai bất cứ điều gì. Đối với Trí tuệ Nhân tạo, bạn có thể học ngôn ngữ lập trình Python, R hoặc Java. Nhưng nếu bạn hỏi tôi, tôi sẽ gợi ý ngôn ngữ lập trình Python. Bởi vì đây là ngôn ngữ thân thiện với người mới bắt đầu.

Nếu bạn là người mới, bạn có thể dễ dàng học Python. Python có nhiều thư viện và gói hỗ trợ khác nhau cho Học Máy và Học Sâu.

Resources for Learning Python Programming

Introduction to Python Programming(Udacity Free Course)
The Python Tutorial (PYTHON.ORG)
CS DOJO (YouTube)
Python 3 Tutorial (SOLOLEARN)
Python For Data Science(Udemy Free Course)
Programming with Mosh (YouTube)
Corey Schafer (YouTube)

Bước 4. Học Big Data

Tại sao là Big Data?

Bởi vì mô hình AI được đào tạo bằng cách sử dụng Dữ liệu.

Và nếu kích thước dữ liệu lớn, thì bạn nên biết các Công cụ Big Data để quản lý lượng Dữ liệu khổng lồ này.

Các công ty lớn như YouTube và Google đang sử dụng hệ thống đề xuất để đề xuất điều gì đó dựa trên lịch sử tìm kiếm trước đó, đây là sự kết hợp giữa AI và Big Data. Đó là lý do tại sao kiến thức về các công cụ Big Data là cần thiết. Hadoop, Spark, Cassandra và MongoDB là các công cụ Big Data. Bạn có thể học bất kỳ công cụ nào.

Tài nguyên để học Big Data

Intro to Hadoop and MapReduce(Udacity FREE Course)
Spark (Udacity FREE Course)
Hadoop Developer In Real World (Udemy)
Big Data Specialization (Coursera)

Bước 5. Học Khoa học Dữ liệu

Ở bước này, bạn cần học Thu thập dữ liệu, Chuẩn bị dữ liệu, Phân tích dữ liệu và Xử lý dữ liệu.

Bạn có thể học Khoa học Dữ liệu từ bất kỳ khóa học nào. Tôi sẽ liệt kê một số khóa học Khoa học Dữ liệu.

Tài liệu học Khoa học Dữ liệu

IBM Data Science Professional Certificate– Coursera
Programming for Data Science with Python– Udacity
Data Science for Everyone– Datacamp
The Data Science Course 2024: Complete Data Science Bootcamp– Udemy
Data Science Tutorial–w3schools
Career Path Data Science– CodecademyPython – Data Science Tutorial– TutorialsPoint

Bước 6. Học các thuật toán Học Máy

Kỹ năng thiết yếu tiếp theo là học các thuật toán học máy. Bạn có thể học Cơ bản về Học Máy với khóa học MIỄN PHÍ “Machine Learning by Andrew Ng”. Bạn cần học các Thuật toán Học Máy:

Supervised Learning (Học có giám sát)
Unsupervised Learning (Học không giám sát)
Reinforcement Learning (Học tăng cường)

Tài liệu để học Machine Learning

Machine Learning by Georgia Tech(Udacity Free Course)
Introduction to Machine Learning Course(Udacity Free Course)
Machine Learning: Unsupervised Learning (Udacity Free Course)
Machine Learning by Stanford University(Coursera Free to Audit Course)
Machine Learning for All by University of London(Coursera Free to Audit Course)
What is Machine Learning? (Udemy Free Course)
Machine Learning Fundamentals(edX Free to Audit Course)

Bước 7. Học các thuật toán Học Sâu

Sau khi bạn đã học các thuật toán Học Máy, tiếp theo hãy học các thuật toán Học Sâu. Cùng với các thuật toán Học Sâu, bạn cần học các Framework của nó như Tensorflow hoặc Keras. Trong các thuật toán Học Sâu, hãy học các chủ đề sau:

Mạng nơ-ron (Neural Network)
CNN (Mạng nơ-ron tích chập)
RNN (Mạng nơ-ron hồi quy)
GAN (Mạng đối kháng sinh thành)
LSTM (Bộ nhớ dài-ngắn hạn)

Tài liệu để học Deep Learning

Deep Learning Specialization (deeplearning.ai)
Deep Learning– Udacity
Intro to Deep Learning with PyTorch– Udacity FREE Course
Intro to TensorFlow for Deep Learning– Udacity FREE Course
Intro to Deep Learning– Kaggle
Generative Adversarial Networks (GANs) Specialization– Coursera
Become a Deep Reinforcement Learning Expert– Udacity
Deep Learning: Convolutional Neural Networks in Python– Udemy
Reinforcement Learning– Udacity
Neural Networks and Deep Learning– Coursera

Bước 8. Học về Mô hình Ngôn ngữ Lớn

Bạn đã từng nghe về Mô hình Ngôn ngữ Lớn.

LLM (Large Language Model) là một loại AI tạo sinh khác, tương tự như ChatGPT. Nó được huấn luyện trên một lượng lớn dữ liệu văn bản, vì vậy nó rất giỏi trong việc hiểu và tạo ra ngôn ngữ tự nhiên. Mô hình Ngôn ngữ Lớn là một thuật ngữ mới. Vì vậy, để tìm hiểu về Mô hình Ngôn ngữ Lớn, bạn có thể tham khảo các nguồn tài liệu sau-

Tài liệu để học Large Language Models

Introduction to Large Language Models– Coursera
Generative AI with Large Language Models– Coursera
Large Language Models (LLMs) Concepts– DataCamp
Prompt Engineering for ChatGPT– Vanderbilt University
Introduction to LLMs in Python– DataCamp
ChatGPT Teach-Out– University of Michigan
Large Language Models for Business– DataCamp
Introduction to Large Language Models with Google Cloud– Udacity FREE Course
Finetuning Large Language Models– Coursera
LangChain with Python Bootcamp– Udemy

Bước 9. Học Business Intelligence (Trí tuệ Kinh doanh)

Business Intelligence giúp các công ty đưa ra quyết định dựa trên dữ liệu nhiều hơn. Ở bước này, bạn cần học các công cụ Business Intelligence như Tableau, PowerBI hoặc Qlikview.

Những công cụ này giúp bạn tạo ra các biểu đồ hoặc đồ thị từ những phát hiện của mình để bạn có thể dễ dàng trình bày kết quả cho các bên liên quan.

Tài nguyên để Học các BI Tools

Data Visualization in Tableau– Udacity FREE Course
Fundamentals of Visualization with Tableau– Coursera FREE to Audit Course
Introduction to Power BI– DataCamp
Microsoft Power BI Desktop for Business Intelligence– Udemy
Data Visualization and Communication with Tableau– Coursera
Free Training Videos– Tableau
Creating Dashboards and Storytelling with Tableau– Coursera

Bước 10. Làm việc trên các Dự án

Trước hết, xin chúc mừng!

Bạn đã thông thạo các Kỹ năng Trí tuệ Nhân tạo.

Đã đến lúc bắt đầu làm việc trên một số dự án Thực tế.

Các dự án là điều quan trọng nhất để có được công việc như một Kỹ sư AI. Càng làm nhiều dự án, bạn sẽ càng hiểu sâu về AI. Các dự án cũng sẽ mang lại nhiều ưu điểm cho Hồ sơ của bạn. Bạn có thể nhờ sự giúp đỡ của Kaggle để tìm các dự án và cuộc thi về Trí tuệ Nhân tạo.

Đây là một số ý tưởng dự án AI đơn giản:

Phân loại Hình ảnh: Tạo một chương trình có thể nhận dạng và phân loại các loại hình ảnh khác nhau.
Kiểm tra Cảm xúc: Tạo một công cụ có thể xác định xem một tin nhắn hoặc đánh giá là tích cực hay tiêu cực.
Trợ lý Chat: Xây dựng một chatbot có thể trò chuyện với mọi người.
Gợi ý Xem gì (What to Watch): Tạo một hệ thống đề xuất phim hoặc chương trình dựa trên sở thích của người dùng.
Nhận diện Khuôn mặt (Face Finder): Tạo một chương trình có thể nhận diện khuôn mặt trong ảnh.
Xử lý Ngôn ngữ (Language Magic): Làm việc trên các dự án liên quan đến việc hiểu và xử lý ngôn ngữ.
Xe tự lái Mini (Mini Self-Driving Car): Thử tạo một chiếc xe hoặc robot nhỏ có thể tự di chuyển.
Phát hiện Bất thường (Odd Thing Detector): Tạo một hệ thống có thể tìm ra những điều bất thường trong dữ liệu, như phát hiện gian lận hoặc vấn đề.
Hỗ trợ Y tế: Tạo một ứng dụng hỗ trợ sức khỏe hoặc y tế, như kiểm tra triệu chứng hoặc khám phá thuốc.
AI trong Game: Xây dựng một đối thủ cho trò chơi hoặc một chương trình có thể tạo nội dung trò chơi mới.
Dự đoán Tương lai: Làm việc trên các dự án dự đoán những gì có thể xảy ra tiếp theo, như dự đoán giá cổ phiếu hoặc thời tiết.
Trợ lý Giọng nói: Tạo một trợ lý có thể nói chuyện và thực hiện các tác vụ khi bạn nói chuyện với nó.
Tạo Nghệ thuật: Sử dụng AI để tạo ra nghệ thuật, âm nhạc, hoặc thậm chí là câu chuyện.
AI trong Giáo dục: Phát triển một ứng dụng giúp mọi người học tốt hơn, như công cụ học tập thích ứng.
AI và Tài chính: Làm việc trên các dự án liên quan đến tài chính như giao dịch chứng khoán, quyết định cho vay, hoặc phát hiện gian lận tài chính.
Robot Bạn bè: Xây dựng một robot có thể làm những việc như dọn dẹp hoặc chơi trò chơi.

Hãy chọn một dự án mà bạn quan tâm và phù hợp với kỹ năng của bạn.

Bây giờ, tôi muốn đề cập đến một Dự án AI hoàn chỉnh từng bước một, để bạn có thể bắt đầu làm việc trên Dự án AI đầu tiên của mình-

Hãy đọc chi tiết về phần này tại đây:

Lộ trình Học tập Trí tuệ Nhân tạo Đơn giản hóa theo Khung thời gian/ Lộ trình Học tập Trí tuệ Nhân tạo 2024

Time Frame	Steps to Follow	What to Do	Resources
Months 1-2	Get the Basics of AI	– Learn what AI is and the main terms.	1. AI For Everyone– Coursera FREE to Audit Course 2. Intro to Artificial Intelligence– Udacity FREE Course
Months 2-4	Strengthen Your Math Skills	– Start with simple math and move to more complex topics.	1. Intro to Statistics– Udacity FREE Course 2. Linear Algebra Refresher Course– Udacity FREE Course
Months 4-5	Pick Up a Programming Language	– Learn a language like Python and practice basic coding.	1. Introduction to Python Programming(Udacity Free Course) 2. The Python Tutorial (PYTHON.ORG)
Month 6	Understand Big Data and Data Science	– Know about big data and the basics of data science.	1. Intro to Hadoop and MapReduce(Udacity FREE Course) 2. Spark (Udacity FREE Course) 3. IBM Data Science Professional Certificate– Coursera
Months 7-8	Explore Machine Learning	– Begin with easy ML concepts and advance to more complex ones.	1. Machine Learning by Georgia Tech(Udacity Free Course) 2. Machine Learning by Stanford University(Coursera Free to Audit Course)
Months 9-10	Learn Deep Learning	– Learn about deep learning and get hands-on with TensorFlow or PyTorch.	1. Deep Learning Specialization (deeplearning.ai) 2. Deep Learning– Udacity
Months 11-12	Learn Large Language Models	– Learn the basics of Large Language Models and how it works	1. Introduction to Large Language Models– Coursera 2. Generative AI with Large Language Models– Coursera
Months 12-13	Focus on Business Intelligence and Projects	– Learn AI in business and start working on your AI projects.	1. Data Visualization in Tableau– Udacity FREE Course 2. Fundamentals of Visualization with Tableau– Coursera FREE to Audit Course

Kỹ sư AI (AI Engineer) làm gì hàng ngày?

Understanding Problems (Hiểu vấn đề): Kỹ sư AI bắt đầu ngày làm việc bằng cách cố gắng hiểu những loại vấn đề mà AI có thể giúp giải quyết.
Data Collection and Cleanup (Thu thập và làm sạch dữ liệu): Họ thu thập dữ liệu từ nhiều nguồn khác nhau và đảm bảo dữ liệu sạch và sẵn sàng để sử dụng trong các mô hình AI của họ.
Creating AI Models (Tạo mô hình AI): Kỹ sư AI xây dựng các mô hình AI, giống như những công cụ đặc biệt có thể giúp giải quyết những vấn đề này.
Testing Models (Kiểm tra mô hình): Họ kiểm tra hiệu quả hoạt động của các công cụ AI này và cải tiến nếu cần.
Writing Instructions (Viết hướng dẫn): Họ viết hướng dẫn dưới dạng mã máy tính để đảm bảo các mô hình AI của họ hiểu những gì cần làm.
Staying Updated (Cập nhật kiến thức): Họ tiếp tục học hỏi về công nghệ và kỹ thuật AI mới nhất để luôn dẫn đầu trong lĩnh vực của mình.
Teamwork (Làm việc nhóm): Kỹ sư AI làm việc với những người khác trong các dự án AI và chia sẻ tiến độ cũng như ý tưởng của họ.
Fixing Issues (Khắc phục sự cố): Nếu có bất kỳ vấn đề gì xảy ra trong quá trình làm việc, như các vấn đề về máy tính, họ tìm cách khắc phục.
Keeping Records (Lưu giữ hồ sơ): Họ ghi chép lại mọi thứ họ làm và cách thức hoạt động để tham khảo trong tương lai.
Meetings and Communication (Họp và giao tiếp): Họ tham gia các cuộc họp để thảo luận về tiến độ dự án và kế hoạch cho tương lai.
Project Management (Quản lý dự án): Họ đảm bảo các dự án AI của họ đúng tiến độ, đáp ứng thời hạn và mục tiêu.
Thinking Ethically (Suy nghĩ về đạo đức): Kỹ sư AI xem xét điều gì đúng và sai trong việc sử dụng AI và đảm bảo công việc của họ tuân theo quy tắc và có đạo đức.
Continuous Learning (Học tập liên tục): Họ tiếp tục học hỏi kỹ năng mới và cập nhật những tiến bộ mới nhất trong lĩnh vực AI.
Putting AI to Use (Ứng dụng AI): Họ đảm bảo các mô hình AI họ đã tạo ra hoạt động chính xác trong các tình huống thực tế.
Quality Checks (Kiểm tra chất lượng): Họ đảm bảo kết quả do AI tạo ra là chính xác và đáng tin cậy thông qua kiểm tra cẩn thận.

Trở thành kỹ sư AI đòi hỏi sự linh hoạt, kỹ năng giải quyết vấn đề tốt và thành thạo trong lập trình máy tính để thành công trong lĩnh vực AI thú vị. Bây giờ, hãy tìm hiểu sự nhầm lẫn lớn nhất mà nhiều người đam mê AI gặp phải, đó là mối quan hệ giữa AI, ML, Deep Learning, Generative AI, LLMs và RAG như thế nào. Vì vậy, hãy tìm hiểu mối quan hệ giữa AI, ML, Deep Learning, Generative AI, LLMs và RAG.

AI, ML, Học Sâu, AI Tạo Sinh, LLM và RAG Kết Nối với Nhau Như Thế Nào?

Như tên gọi “Trí tuệ Nhân tạo” đã gợi ý, bạn hiểu gì? Nó có nghĩa là trí tuệ được tạo ra một cách nhân tạo. Đúng không?

Hãy phân tích chi tiết hơn.

Bạn hiểu “Nhân tạo Artificial” là gì? Theo tôi, Nhân tạo Artificial có nghĩa là thứ gì đó không thuộc về con người.

Và bạn hiểu “Trí tuệ Intelligence” là gì? Theo tôi, Trí tuệ Intelligence có nghĩa là khả năng suy nghĩ, học hỏi và hiểu biết.

Đúng vậy, Artificial Intelligence (Trí tuệ Nhân tạo) làm cho máy móc trở nên thông minh như con người. Mục tiêu chính của Artificial Intelligence là làm cho máy móc trở nên mạnh mẽ và có khả năng suy nghĩ như con người.

Artificial Intelligence là một lĩnh vực rộng lớn của Khoa học Máy tính. AI cho phép máy móc bắt chước con người. Artificial Intelligence làm cho máy móc trở nên mạnh mẽ đến mức chúng có thể tự đưa ra quyết định.

AI mang lại cho máy móc sức mạnh của lẽ thường, kỹ năng lập luận và kỹ năng ra quyết định.

Trong lĩnh vực này, Học Máy (Machine Learning – ML) là một kỹ thuật cho phép máy móc học hỏi và tự cải thiện hiệu suất của mình. Trong học máy, một số tập hợp hướng dẫn (set of instructions) được đưa ra dưới dạng huấn luyện mô hình. Dựa trên training data (dữ liệu huấn luyện), machine learning model học và dự đoán kết quả.

Deep learning (Học sâu) là một hình thức nâng cao của Machine Learning (Học Máy). Nếu bạn có một tập dữ liệu nhỏ và muốn tạo một mô hình, thì học máy hoạt động hoàn hảo. Nhưng nếu bạn có một tập dữ liệu lớn và nhiều đặc trưng trong tập dữ liệu của bạn, thì các thuật toán học máy sẽ không thể hoạt động tốt.

Ở đây, học sâu được sử dụng. Học sâu hoạt động hoàn hảo với các tập dữ liệu lớn và có nhiều đặc trưng. Học sâu hoạt động trên mạng nơ-ron nhân tạo, giống như não bộ con người, nơi các nơ-ron được kết nối. Có ba lớp: input layer (lớp đầu vào), hidden layer (lớp ẩn) và output layer (lớp đầu ra).

Generative AI (AI Tạo sinh) đề cập đến các hệ thống AI có khả năng tạo ra nội dung mới, như hình ảnh, âm nhạc hoặc văn bản, dựa trên các mẫu học được từ dữ liệu hiện có.

Large Language Models – LLMs (Mô hình Ngôn ngữ Lớn) là các mô hình AI tinh vi có khả năng hiểu và tạo ra ngôn ngữ con người, cho phép thực hiện các nhiệm vụ như dịch thuật, tóm tắt và trả lời câu hỏi.

Retrieval-augmented generation – RAG (Tạo sinh tăng cường bằng truy xuất) là một phương pháp kết hợp AI sinh sản với việc truy xuất thông tin liên quan từ một cơ sở dữ liệu lớn để nâng cao chất lượng và sự phù hợp của nội dung được tạo ra.

Về cơ bản, AI bao gồm nhiều kỹ thuật khác nhau như ML, deep learning, generative AI, LLMs và RAG, mỗi kỹ thuật đóng góp vào sự tiến bộ của các hệ thống thông minh (intelligent systems) theo những cách khác nhau.

Tôi hy vọng giờ đây sự “rối“ của bạn đã được làm rõ.

Bây giờ là lúc để kết thúc Lộ trình Học tập Trí tuệ Nhân tạo [Lộ trình AI] 2024 này!

Kết luận

Trong bài viết này, tôi đã thảo luận về Lộ trình Học tập Trí tuệ Nhân tạo [Lộ trình AI] 2024 theo từng bước. Nếu bạn có bất kỳ thắc mắc hoặc câu hỏi nào về Lộ trình Học tập Trí tuệ Nhân tạo, hãy tự nhiên hỏi tôi trong phần bình luận. Tôi ở đây để giúp đỡ bạn.

Chúc bạn thành công trong sự nghiệp!

Chúc học tập vui vẻ!

Tác giả: mltut.com

Link bài gốc: Artificial Intelligence Learning Roadmap [AI Roadmap] 2024- Step-by-Step Guide | Bài được đăng vào ngày 12/09/2024

Dịch giả: Hoàng Phan – KenkAI Nhiều thứ hay

(*) Bạn có thể sao chép và chia sẻ thoải mái.

(**) Follow KenkAI Nhiều thứ hay để đọc các bài dịch khác và cập nhật thông tin bổ ích hằng ngày.

Related Topics:Coursera Machine Learning ML

Up Next

Các Khóa học Học Máy tốt nhất cho Tài chính

Don't Miss

41 Tài Nguyên Về “Reinforcement Learning” (Học Tăng Cường) Tốt Nhất

Click to comment

Giáo dục

Khám phá Lộ trình Phát triển Backend 2025: Bí kíp trở thành “Phù thủy Code”

Published

3 tháng ago

23 Tháng 1, 2025

Dieter R.

Chào các bạn! Mình là một lập trình viên backend lâu năm, và hôm nay mình muốn chia sẻ với các bạn một lộ trình học backend chi tiết cho năm 2025.

Nếu bạn đang mơ ước trở thành một “phù thủy backend” đích thực, thì bạn đã đến đúng chỗ rồi đấy! Bài viết này sẽ cung cấp cho bạn một kế hoạch học tập cụ thể, giúp bạn đầu tư thời gian và công sức một cách hiệu quả nhất.

Qua nhiều năm kinh nghiệm trong ngành, mình nhận ra rằng để thành công trong lĩnh vực backend, không chỉ cần code giỏi mà còn phải biết tập trung vào những điểm mấu chốt. Trong bài viết này, mình sẽ phân tích chi tiết những kiến thức nền tảng cần phải nắm vững, cùng với thời gian đề xuất cho từng giai đoạn học tập.

Tin mình đi, với lộ trình này, bạn sẽ có một hướng đi rõ ràng để trở thành một lập trình viên backend xuất sắc, được săn đón trong giới công nghệ. Hãy cùng bắt đầu hành trình trở thành “phù thủy code” năm 2025 nào!

1. Kỹ năng Thiết yếu

Chúng ta hãy khởi đầu bằng việc tìm hiểu các công cụ và công nghệ cơ bản mà bạn cần nắm vững:

2. Cách Web Hoạt động

Học những kiến thức cơ bản về cách trình duyệt và máy chủ giao tiếp. Tập trung vào:

DNS: Hiểu cách tên miền được phân giải thành địa chỉ IP.
HTTP/HTTPS: Tìm hiểu cách dữ liệu di chuyển qua web, bao gồm cả kết nối bảo mật sử dụng TLS/SSL.
Mô hình Client-Server: Hiểu cách yêu cầu và phản hồi hoạt động giữa máy khách và máy chủ.
Máy chủ Web: Học cách máy chủ web xử lý và phản hồi các yêu cầu.

Dành khoảng 1 tuần để xây dựng hiểu biết vững chắc về những khái niệm này.

3. Học một Ngôn ngữ Lập trình

Việc chọn đúng ngôn ngữ lập trình là yếu tố quan trọng cho phát triển backend. Dưới đây là dữ liệu mới nhất từ Khảo sát Nhà phát triển Stack Overflow, nêu bật những lựa chọn phổ biến nhất:

Những lựa chọn phổ biến là:

Node.js (JavaScript): Tuyệt vời cho sự linh hoạt full-stack.
Python: Đa năng cho web, khoa học dữ liệu và tự động hóa.
Java hoặc C#: Tốt nhất cho hệ thống cấp doanh nghiệp và hiệu suất cao.

Tập trung vào việc thành thạo một ngôn ngữ thay vì phân tán nỗ lực của bạn cho nhiều ngôn ngữ.

Không có ngôn ngữ nào trong số này là “tốt nhất”. Mỗi ngôn ngữ đều có ưu và nhược điểm riêng. Theo quan điểm của tôi, Node.js là điểm khởi đầu tốt nhất cho phát triển backend. Đây là lý do:

Nhu cầu cao: Node.js luôn là một trong những lựa chọn hàng đầu trên thị trường việc làm.
Linh hoạt Full-Stack: Học Node.js giúp bạn dễ dàng chuyển sang phát triển full-stack hơn vì bạn đã biết JavaScript.

Lộ trình: Dành 4-6 tuần để thành thạo ngôn ngữ bạn đã chọn.

Nếu bạn chọn Node.js, hãy bắt đầu bằng việc tập trung vào những kiến thức cơ bản về JavaScript trước khi đi sâu vào các framework backend như Express.js.

4. Tìm hiểu Hệ sinh thái của Ngôn ngữ Bạn Chọn

Khi đã nắm vững kiến thức cơ bản, hãy đi sâu vào hệ sinh thái của ngôn ngữ bạn chọn. Đối với Node.js, các lĩnh vực trọng tâm cần tập trung là:

STT	Tiếng Việt	Tiếng Anh
1	Công cụ kiểm tra và định dạng mã — Prettier, ESLint	Linters & Formatters—Prettier, ESLint
2	Công cụ đóng gói module — Vite, Webpack	Module Bundlers—Vite, Webpack
3	Rò rỉ bộ nhớ	Memory Leaks
4	Chế độ gỡ lỗi trong trình soạn thảo mã của bạn	Debugger mode in your code editor
5	Quản lý cấu hình an toàn — dotenv, process.env	Secure config management—dotenv, process.env

Bên cạnh đó, việc nắm vững TypeScript sẽ giúp bạn tăng cường bảo mật về kiểu dữ liệu, hạn chế lỗi khi chạy chương trình, và mở rộng cơ hội việc làm, bởi nó là một kỹ năng thường được đòi hỏi trong các vị trí liên quan đến Node.js.

Lộ trình: Dành 2-4 tuần để thông thạo hệ sinh thái của ngôn ngữ lập trình của bạn.

5. Git và Hosting kho lưu trữ

Tìm hiểu cách quản lý và hợp tác hiệu quả trên mã nguồn bằng Git.

Lệnh cơ bản: Luyện tập các lệnh commit, push, pull, branch, và merge.
Xử lý xung đột khi merge: Học các phương pháp giải quyết xung đột.
Hosting kho lưu trữ: Sử dụng các nền tảng như GitHub, GitLab, hoặc Bitbucket để lưu trữ và chia sẻ mã nguồn của bạn.

Lộ trình: Dành 1-2 tuần để học các kiến thức cơ bản về git.

6. Cơ sở dữ liệu

Tìm hiểu cách lưu trữ và quản lý dữ liệu bằng các hệ quản trị cơ sở dữ liệu quan hệ và phi quan hệ.

Sau đây là những lựa chọn cơ sở dữ liệu được ưa chuộng nhất:

STT	Tiếng Việt	Tiếng Anh
1	Cơ sở dữ liệu quan hệ: Bắt đầu với PostgreSQL hoặc MySQL.	Relational Databases: Start with PostgreSQL or MySQL.
2	Cơ sở dữ liệu phi quan hệ: Học MongoDB, Redis, hoặc DynamoDB cho dữ liệu phi cấu trúc.	Non-Relational Databases: Learn MongoDB, Redis, or DynamoDB for unstructured data.
Những điểm cần tập trung / What to focus on:
3	Xây dựng các thao tác CRUD và thực hiện truy vấn.	Building CRUD operations and running queries.
4	Thiết kế lược đồ cơ sở dữ liệu, chuẩn hóa, và lập chỉ mục.	Database schema design, normalization, and indexing.
5	Di chuyển cơ sở dữ liệu và các kỹ thuật tối ưu hóa.	Database migrations and optimization techniques.

Khung thời gian: Đầu tư 4 tuần cho việc học tập và rèn luyện kỹ năng với từng loại cơ sở dữ liệu.

7. API

Học cách thiết kế, xây dựng và sử dụng API. Tập trung vào:

STT	Tiếng Việt	Tiếng Anh
1	API REST: Sử dụng hiệu quả các phương thức HTTP (GET, POST, PUT, DELETE) và mã trạng thái.	REST APIs: Use HTTP methods (GET, POST, PUT, DELETE) and status codes effectively.
2	GraphQL: Học cách truy xuất chỉ dữ liệu cần thiết bằng truy vấn và đột biến.	GraphQL: Learn to fetch only the required data using queries and mutations.
3	Tài liệu API: Tạo và kiểm thử API bằng các công cụ như Swagger hoặc Postman.	API documentation: Create and test APIs with tools like Swagger or Postman.

Lộ trình: Dành 3-4 tuần để thành thạo các khái niệm về API.

8. Giao thức API

STT	Tiếng Việt	Tiếng Anh
Tìm hiểu thêm về các giao thức ngoài HTTP như: / Go beyond HTTP with protocols like:
1	WebSockets: API thường yêu cầu các giao thức truyền thông chuyên biệt cho các kịch bản thời gian thực hoặc microservices (ví dụ: ứng dụng trò chuyện).	WebSockets: APIs often require specialized communication protocols for real-time or microservices scenarios (e.g., chat apps).
2	gRPC: Dùng cho giao tiếp giữa các microservices.	gRPC: For microservices communication.
3	SSE (Server-Sent Events): Dùng cho thông báo đẩy từ máy chủ.	SSE (Server-Sent Events): For server-push notifications.

Lộ trình: Dành khoảng một tuần để học các Giao thức này và triển khai một trong số chúng (như Websockets) vào một API hiện có.

9. Xác thực và Ủy quyền (Authentication and Authorization)

Triển khai truy cập an toàn cho ứng dụng của bạn. Học về:

STT	Tiếng Việt	Tiếng Anh
1	JWT (JSON Web Tokens) và OAuth cho xác thực an toàn.	JWT (JSON Web Tokens) and OAuth for secure authentication.
2	Xác thực dựa trên Cookie để duy trì phiên làm việc.	Cookie-based Auth for maintaining sessions.
3	Đăng nhập qua mạng xã hội: Tích hợp đăng nhập qua Google, Facebook, hoặc các tùy chọn đăng nhập tương tự.	Social Login: Integrate Google, Facebook, or similar login options.

Thực hành áp dụng các kỹ thuật này trong các dự án nhỏ. Dành 2-3 tuần cho chủ đề này.

Phần Bổ sung: Các Khái niệm Nâng cao để Nổi bật

10. Bảo mật API

Bảo vệ các ứng dụng backend của bạn bằng cách thành thạo những chủ đề sau:

STT	Tiếng Việt	Tiếng Anh
1	CORS: Cấu hình các chính sách Chia sẻ Tài nguyên Gốc Chéo.	CORS: Configure Cross-Origin Resource Sharing policies.
2	SSL/TLS: Sử dụng HTTPS để bảo mật dữ liệu trong quá trình truyền tải.	SSL/TLS: Use HTTPS to secure data in transit.
3	CSRF và XSS: Ngăn chặn các lỗ hổng bảo mật phổ biến.	CSRF and XSS: Prevent common vulnerabilities.
4	Giới hạn tốc độ: Bảo vệ chống lại các cuộc tấn công brute-force bằng cách sử dụng công cụ như Redis.	Rate Limiting: Protect against brute-force attacks using tools like Redis.
5	Tiêu đề Bảo mật: Thêm các tiêu đề như Content-Security-Policy và Strict-Transport-Security.	Secure Headers: Add headers like Content-Security-Policy and Strict-Transport-Security.
6	Tăng cường Bảo mật Máy chủ: Sử dụng các công cụ tập trung vào bảo mật như OWASP ZAP. Quét và giám sát các lỗ hổng trong mã của bạn bằng công cụ như Snyk.	Server Hardening: Use security-focused tools like OWASP ZAP. Scan and monitor vulnerabilities in your code with tools like Snyk.

Lộ trình: Dành 1-2 tuần cho các kiến thức cơ bản về bảo mật.

11. Triển khai và Tăng quy mô Ứng dụng

Tìm hiểu cách triển khai các ứng dụng phía máy chủ của bạn và chuẩn bị cho việc mở rộng quy mô trong môi trường thực tế.

STT	Tiếng Việt	Tiếng Anh
1	Docker: Sử dụng Dockerfiles và Docker Compose cho các ứng dụng được đóng gói trong container.	Docker: Use Dockerfiles and Docker Compose for containerized applications.
2	Máy chủ Web: Cấu hình NGINX hoặc Apache cho cân bằng tải và proxy ngược.	Web Servers: Configure NGINX or Apache for load balancing and reverse proxy.
3	Nền tảng Đám mây: Triển khai lên AWS, DigitalOcean, hoặc Heroku.	Cloud Platforms: Deploy to AWS, DigitalOcean, or Heroku.

Lộ trình: Dành 3-4 tuần cho bước này.

12. Tối ưu hóa Hiệu suất và Mở rộng

Học các chiến lược để cải thiện hiệu suất:

STT	Tiếng Việt	Tiếng Anh
1	Bộ nhớ đệm API với các công cụ như Redis.	API caching with tools like Redis.
2	Cân bằng tải cho phân phối lưu lượng truy cập.	Load balancing for traffic distribution.
3	Tối ưu hóa truy vấn cho cơ sở dữ liệu.	Query optimization for databases.

Khung thời gian: Dành 2-3 tuần để nắm vững những khái niệm này.

13. Suy nghĩ kết thúc

Vậy, mất bao lâu để trở thành một nhà phát triển backend?

Nếu bạn dành khoảng 20 giờ mỗi tuần, thông thường sẽ mất 8-12 tháng để có được các kỹ năng cần thiết để xây dựng và triển khai các hệ thống backend có khả năng mở rộng. Điều quan trọng không phải là bạn đi nhanh như thế nào – mà là duy trì tập trung và tuân theo một kế hoạch rõ ràng.

Cố lên nha! Một ngày nào đó trong tương lai, bạn sẽ gặp bạn của tương lai. Câu hỏi là bạn chuẩn bị cho cuộc gặp đó từ bây giờ như thế nào?

Dieter R.,

Khóa học

Học Máy có khó học không – Hành trình học tập của tôi 2025

Published

4 tháng ago

20 Tháng 12, 2024

Dieter R.

Gần đây, “Học Máy” đã không còn là từ xa lạ với mọi người nữa. Vậy nên mình sẽ “mạnh dạn” dùng luôn “Học Máy” thay cho “Machine Learning”.

Bạn có muốn học Học Máy nhưng còn nghi ngờ liệu Học Máy có khó học không? Nếu có, đừng lo lắng. Mình sẽ hướng dẫn bạn những bước mà mình đã trải qua trong hành trình học máy của mình. Mình cũng sẽ trả lời câu hỏi của bạn “Học Máy có khó học không” dựa trên kinh nghiệm của mình.

Và mình sẽ không chỉ cố gắng trả lời câu hỏi của bạn mà còn chia sẻ toàn bộ lộ trình mà mình đã trải qua cùng với các tài nguyên mình đã sử dụng trong quá trình học. Vì vậy, hãy dành vài phút cho bài viết này và hiểu rõ mọi thứ liên quan đến trải nghiệm học máy.

Bây giờ, không cần chần chừ thêm nữa, hãy bắt đầu thôi-

Học Máy có khó học không

Nền tảng của mình

Mình đã học Khoa học Máy tính, nhưng trong thời gian học cử nhân và thạc sĩ, học máy không thực sự là một lĩnh vực lớn trong khoảng 2012 đến 2016. Mình chỉ bắt đầu học về nó khi mình bắt đầu chương trình tiến sĩ của mình.

Hành trình học tập của mình

Trước khi chia sẻ hành trình học tập của mình, mình muốn đề cập đến những chủ đề bạn cần học để trở thành một bậc thầy trong Học Máy-

Chủ Đề	Thuật ngữ tiếng Anh
Toán học cơ bản (Đại số, Giải tích) 🧮📐	Algebra, Calculus
Xác suất (Cơ hội, Khả năng xảy ra) 🎲🔢	Chance, Likelihood
Kỹ năng lập trình (Python, R) 💻🐍	–
Xử lý dữ liệu (Làm sạch dữ liệu, Thao tác dữ liệu) 🧹🔧	Data Cleaning, Data Manipulation
Các loại học máy (Học có giám sát, Học không giám sát) 🧠🔍	Supervised Learning, Unsupervised Learning
Kiểm tra mô hình (Đánh giá mô hình, Xác thực) 🧪📊	Model Evaluation, Validation
Cải thiện mô hình (Điều chỉnh tham số, Tối ưu hóa) 🔧🚀	Parameter Tuning, Optimization
Phát hiện lỗi (Phân tích lỗi, Gỡ lỗi) 🔍🐛	Error Analysis, Debugging
Thực hiện dự án (Ứng dụng thực tế, Triển khai thực tiễn) 🏗️🌐	Real-world Applications, Practical Implementation

Mình đã học Khoa học Máy tính, và may mắn thay, mình đã biết cách lập trình bằng Python, điều này giúp phần lập trình trong học máy trở nên dễ dàng hơn với mình. Tuy nhiên, khi đến phần toán học, như đại số và giải tích, mình thấy hơi khó hiểu một chút.

Mình không quá lo lắng về thống kê và xác suất, vì mình thấy chúng dễ hiểu hơn. Để tìm hiểu thêm về học máy, mình quyết định tham gia một số khóa học trên Udemy và một khóa học cụ thể về thuật toán học máy. Ban đầu, mình đã bỏ qua phần toán học và nhảy ngay vào việc hiểu các thuật toán học máy với kỹ năng Python của mình. Nhưng không lâu sau, mình gặp phải một rào cản – một số thuật toán rất khó hiểu nếu không biết toán học đằng sau chúng.

Nhận ra sai lầm của mình, mình lùi lại một bước và tập trung vào việc học toán. Điều này mất một thời gian và rất nhiều nỗ lực, và có những lúc mình cảm thấy muốn từ bỏ. Nhưng mình đã tiếp tục, và cuối cùng, mình đã hiểu rõ hơn về đại số và giải tích.

Khi mình cảm thấy tự tin hơn về kỹ năng toán học của mình, mình đã quay lại học các thuật toán học máy. Mình quyết định làm một dự án phân tích cảm xúc, nghe có vẻ thú vị. Tuy nhiên, mình nhanh chóng nhận ra rằng thu thập và làm sạch dữ liệu là những thách thức lớn đối với mình. Làm việc với dữ liệu sạch thì có thể quản lý được, nhưng tự làm điều đó thì lại khó khăn.

Mặc dù gặp nhiều thách thức, mình thấy quá trình kiểm tra và cải thiện các mô hình thật thú vị. Nhìn chung, hành trình của mình vào học máy có những thăng trầm, với một số phần khó khăn hơn những phần khác. Nhưng với sự kiên trì và cống hiến, mình đã có thể vượt qua những trở ngại và tiếp tục học hỏi và phát triển trong lĩnh vực này.

Những sai lầm mà mình đã mắc phải và không khuyến nghị

Bỏ qua Toán học: Đây là một sai lầm khi lao vào học máy mà không hiểu toán học đằng sau nó. Điều này khiến việc nắm bắt các khái niệm nâng cao trở nên khó khăn hơn.
Đánh giá thấp việc chuẩn bị dữ liệu: Mình không nhận ra tầm quan trọng của việc thu thập và làm sạch dữ liệu. Dành đủ thời gian cho bước này là rất quan trọng để có được kết quả đáng tin cậy.
Bỏ qua những khó khăn: Khi cảm thấy quá tải, mình nên tìm kiếm sự giúp đỡ hoặc nghỉ ngơi thay vì cố gắng tiếp tục.
Vội vàng trong việc học: Cố gắng nhanh chóng vượt qua các khái niệm khó chỉ dẫn đến sự thất vọng. Dành thời gian để hiểu từng bước sẽ tốt hơn.

Những mẹo đơn giản để học Đại số và Giải tích trong Học Máy

Tập trung vào các khái niệm hữu ích: Bắt đầu bằng cách học các khái niệm đại số và giải tích thường được sử dụng trong học máy. Những điều như hiểu các mẫu trong dữ liệu và cách thao tác chúng.
Hãy thử nghiệm với Học Máy: Thay vì chỉ học đại số và giải tích một cách riêng lẻ, hãy áp dụng những khái niệm này vào các bài toán học máy. Xem cách bạn có thể sử dụng chúng để cải thiện các thuật toán học từ dữ liệu.
Thực hành với các khóa học trực tuyến: Tìm kiếm các lớp học trực tuyến dạy đại số và giải tích với các ví dụ về học máy. Các trang web như Coursera hoặc Khan Academy cung cấp các khóa học giải thích những ý tưởng này bằng những thuật ngữ đơn giản.
Sử dụng các công cụ Học Máy: Hãy trải nghiệm thực tế bằng cách sử dụng các công cụ như TensorFlow hoặc scikit-learn. Những công cụ này ẩn đi một số phần toán học phức tạp, nhưng việc hiểu đại số và giải tích sẽ giúp bạn sử dụng chúng hiệu quả hơn.
Làm việc với các dự án đơn giản: Bắt đầu với những dự án học máy nhỏ và dần dần tăng độ phức tạp của chúng. Bằng cách này, bạn có thể thấy cách đại số và giải tích áp dụng vào các vấn đề thực tế.
Đọc những cuốn sách dễ hiểu cho người mới bắt đầu: Tìm kiếm những cuốn sách giải thích đại số và giải tích theo cách dễ hiểu. Những cuốn sách như “Pattern Recognition and Machine Learning” (Nhận diện mẫu và Học máy) hoặc “Học sâu” là những lựa chọn tốt.

Bằng cách làm theo những gợi ý này, bạn có thể dần dần xây dựng hiểu biết của mình về đại số và giải tích cho học máy mà không cảm thấy quá tải. Hãy nhớ thực hiện từng bước một và thực hành thường xuyên để cải thiện kỹ năng của bạn.

Những mẹo thực tiễn để chuẩn bị dữ liệu dễ dàng hơn trong Học Máy

Hiểu rõ nguồn dữ liệu của bạn: Trước khi bạn bắt đầu làm sạch và gán nhãn cho dữ liệu của mình, điều quan trọng là phải biết dữ liệu của bạn đến từ đâu, cách nó được thu thập và liệu có bất kỳ sự thiên lệch hoặc không nhất quán nào không.
Xử lý các giá trị thiếu: Khi bạn phát hiện các giá trị thiếu trong tập dữ liệu của mình, đừng hoảng sợ! Hãy sử dụng các công cụ như pandas trong Python để tìm và xử lý chúng. Bạn có thể điền các giá trị thiếu bằng các ước lượng hoặc xóa các hàng hoặc cột có dữ liệu bị thiếu.
Giữ cho định dạng dữ liệu nhất quán: Đảm bảo rằng tất cả dữ liệu của bạn đều theo cùng một định dạng. Điều này có nghĩa là chuyển đổi ngày tháng về cùng một định dạng và chuẩn hóa các giá trị số để dễ dàng làm việc hơn.
Xóa các mục trùng lặp: Các mục trùng lặp có thể làm rối loạn phân tích của bạn, vì vậy việc phát hiện và xóa chúng là rất cần thiết. Các công cụ như pandas hoặc truy vấn SQL có thể giúp bạn tìm và xóa các mục trùng lặp dựa trên các tiêu chí cụ thể.
Xử lý dữ liệu phân loại: Nếu bạn có dữ liệu phân loại, như tên hoặc danh mục, bạn sẽ cần chuyển đổi chúng thành các biểu diễn số. Các kỹ thuật như mã hóa one-hot (one-hot encoding) hoặc mã hóa nhãn (label encoding) có thể giúp ích cho việc này.
Phát hiện các điểm ngoại lai: Các điểm ngoại lai là những dữ liệu có sự khác biệt đáng kể so với phần còn lại. Sử dụng các phương pháp thống kê hoặc hình ảnh hóa để xác định các điểm ngoại lai và quyết định xem có nên xóa chúng hoặc điều chỉnh chúng dựa trên nhu cầu phân tích của bạn hay không.
Kiểm tra chất lượng dữ liệu thường xuyên: Trong suốt quá trình làm sạch dữ liệu, hãy đảm bảo kiểm tra thường xuyên chất lượng dữ liệu của bạn. Sử dụng thống kê mô tả, hình ảnh hóa hoặc các kiểm tra theo lĩnh vực cụ thể để đảm bảo dữ liệu của bạn là đáng tin cậy.
Tự động hóa các nhiệm vụ làm sạch: Đừng lãng phí thời gian thực hiện các nhiệm vụ làm sạch lặp đi lặp lại một cách thủ công. Hãy tận dụng các công cụ và kịch bản tự động hóa, như những công cụ có trong các thư viện Python như pandas, scikit-learn và TensorFlow, để đơn giản hóa quy trình.

Tài Nguyên Học Tập	Chi Tiết
Ngôn ngữ lập trình (Python & R)	1. Introduction to Python Programming – Udacity 2. Python for Everybody – University of Michigan 3. Introduction To Python Programming – Udemy 4. Python Core and Advanced – Udemy 5. Crash Course on Python – Google 6. Python for Absolute Beginners! – Udemy 7. Python 3 Programming Specialization – University of Michigan 8. R Programming – Johns Hopkins University 9. Programming for Data Science with R – Udacity 10. R Programming A-Z™ – Udemy
Toán học	1. Mathematics for Machine Learning Specialization – Imperial College London 2. Mathematics for Data Science Specialization – Coursera 3. Data Science Math Skills – Duke University 4. Intro to Statistics – Udacity 5. Probability – The Science of Uncertainty and Data – MITx 6. Basic Statistics – University of Amsterdam 7. Probabilistic Graphical Models Specialization – Stanford University 8. Introduction to Calculus – The University of Sydney 9. Probability and Statistics – University of London
Thuật toán Học Máy	1. Become a Machine Learning Engineer (Udacity) 2. Machine Learning – Stanford University 3. Machine Learning with Python – IBM 4. Intro to Machine Learning with TensorFlow (Udacity) 5. Machine Learning A-Z™: Hands-On Python & R In Data Science – Udemy 6. Python for Data Science and Machine Learning Bootcamp – Udemy 7. Advanced Machine Learning Specialization – Coursera
TensorFlow	1. TensorFlow in Practice Specialization – deeplearning.ai 2. Intro to Machine Learning with TensorFlow – Udacity 3. Tensorflow 2.0: Deep Learning and Artificial Intelligence – Udemy 4. TensorFlow: Data and Deployment Specialization – deeplearning.ai 5. Machine Learning with TensorFlow on Google Cloud Platform Specialization – Google Cloud
Tiền xử lý Dữ liệu	1. Applied Data Science with Python Specialization at the University of Michigan 2. Exploratory Data Analysis With Python and Pandas (Guided Project) 3. NumPy Tutorial by freeCodeCamp
Học Sâu	1. Deep Learning (Udacity) 2. Deep Learning Specialization (deeplearning.ai) 3. Deep Learning A-Z™: Hands-On Artificial Neural Networks – Udemy

Học Máy có khó học không

Có, học máy là khó. Ngay cả khi có một chút nền tảng về Khoa học Máy tính và biết Python, việc hiểu toán học phức tạp như đại số và giải tích là rất khó khăn. Nhưng với nỗ lực, mình đã có thể nắm bắt các khái niệm và tiến bộ. Điều đó không dễ dàng, nhưng những phần thưởng từ việc có được kỹ năng mới khiến nó trở nên xứng đáng. Nhìn chung, mặc dù học máy có thể thách thức, nhưng với sự quyết tâm, bất kỳ ai cũng có thể học hỏi và thành công trong lĩnh vực này.

Lộ Trình Học Tập Được Đề Xuất

1. Bắt đầu với những điều cơ bản:

Chọn ngôn ngữ của bạn: Bắt đầu bằng cách học Python hoặc R, hai ngôn ngữ phổ biến trong khoa học dữ liệu và học máy. 🐍📊
- Tránh sai lầm: Đừng cố gắng học cả hai cùng một lúc. Hãy tập trung vào việc thành thạo một ngôn ngữ trước khi chuyển sang ngôn ngữ khác.

2. Hiểu các nguyên tắc cơ bản:

Toán học là quan trọng: Nắm vững các khái niệm toán học cơ bản như đại số, giải tích, thống kê và xác suất. 📐📈
- Tránh sai lầm: Đừng xem nhẹ tầm quan trọng của toán học. Nó rất quan trọng để hiểu khoa học dữ liệu và học máy.

3. Học về Học Máy:

Học các thuật toán: Khám phá các thuật toán học máy khác nhau và ứng dụng của chúng. 🤖📚
- Tránh sai lầm: Đừng vội vàng học các thuật toán mà không hiểu các khái niệm cơ bản.

4. Thành thạo TensorFlow và Học Sâu:

Khám phá TensorFlow: Nâng cao hiểu biết của bạn về các khung học sâu như TensorFlow. 🌊🧠
- Tránh sai lầm: Đừng nhảy vào học sâu mà không nắm vững các nguyên tắc cơ bản của học máy và TensorFlow.

5. Làm sạch và chuẩn bị dữ liệu:

Tiền xử lý dữ liệu: Học cách làm sạch và chuẩn bị dữ liệu thô cho các mô hình học máy. 🧹📊
- Tránh sai lầm: Đừng đánh giá thấp tầm quan trọng của việc tiền xử lý dữ liệu. Dữ liệu kém chất lượng dẫn đến các mô hình không chính xác.

6. Thực hiện các dự án:

Áp dụng kiến thức của bạn: Tích lũy kinh nghiệm thực tiễn bằng cách làm việc trên các dự án và thách thức thực tế. 💼🚀
- Tránh sai lầm: Đừng tránh né các dự án vì chúng có vẻ khó khăn. Các dự án sẽ củng cố hiểu biết của bạn và xây dựng hồ sơ năng lực của bạn.

Câu nói trong ngày…

‘ Ai ngừng học hỏi thì sẽ già, dù ở tuổi hai mươi hay tám mươi. Ai tiếp tục học hỏi sẽ luôn trẻ trung.

– Henry Ford’

Bạn có biết giáo sư Geoffrey E. Hinton là ai không? Bạn có biết giải thưởng Nobel và giải thưởng VinFuture không? Bạn có biết giáo sư Geoffrey E. Hinton là người nhận được cả giải thưởng giải Nobel Vật lý 2024 và VinFuture Grand Prize 2024 không? Bạn có biết tại sao giáo sư được trao giải không? Có thể bạn, giống như mình, được biết là giáo sư Geoffrey E. Hinton có đóng góp to lớn trong lĩnh vực AI và deep learning (học sâu), vậy nhưng bạn có biết AI là gì? học sâu là gì không? Theo bạn, bài viết bạn đọc này là do người viết, hay AI viết, hay cả hai?

Trong video này, giáo sư Geoffrey E. Hinton sẽ giải thích dễ hiểu về AI, mạng nơ ron nhân tạo? … Hãy khám phá qua video này nhé.

© Dịch bởi Dieter R., Nguồn: www.mltut.com, 05/11/2024 – Được viết bởi Aqsa Zafar – Machine Learning Ph.D. scholar at Dayananda Sagar University
Bài viết gốc: https://www.mltut.com/is-machine-learning-hard-to-learn/

Khóa học

Đây là 38 Khóa học Miễn phí về Khoa học Dữ liệu trên Coursera mà bạn nên biết vào năm 2024.

Published

5 tháng ago

13 Tháng mười một, 2024

Dieter R.

Coursera là một nền tảng E-Learning và có một loạt các Khóa học Khoa học Dữ liệu Miễn phí. Đó là lý do tại sao trong bài viết này, mình sẽ chia sẻ với bạn các Khóa học Miễn phí trên Coursera về Khoa học Dữ liệu.

Đối với những khóa học này, bạn không cần phải trả một xu nào. Vì vậy, hãy dành vài phút để đọc bài viết này và kiểm tra các Khóa học Miễn phí về Khoa học Dữ liệu trên Coursera.

Lưu ý – Mình đã chia các khóa học này dựa trên cấp độ kiến thức – Người mới bắt đầu, Trung cấp và Nâng cao. Bạn có thể tìm thấy khóa học phù hợp với trình độ của mình.

Để truy cập các khóa học được liệt kê này MIỄN PHÍ, hãy làm theo các bước sau:

Nhấp vào nút “Đăng ký MIỄN PHÍ” trên trang khóa học.
Cung cấp thông tin đăng nhập và sau đó bạn sẽ thấy tùy chọn “Tham gia khóa học”. Chỉ cần nhấp vào nó.
Bằng cách này, bạn có thể truy cập nội dung khóa học miễn phí. Tuy nhiên, bạn sẽ không nhận được chứng chỉ. Để nhận được chứng chỉ, bạn phải trả phí cho khóa học. Điều này không phải là điều kiện thiết yếu.

Hãy bắt đầu với các Khóa học Khoa học Dữ liệu Miễn phí cấp độ Người mới bắt đầu:

Beginner-Level

Cấp độ người mới bắt đầu

STT	Tên khóa học	Đánh giá	Thời gian hoàn thành	Nhà cung cấp
1	Giới thiệu về Thống kê	4.5/5	15 giờ	Đại học Stanford
2	Học máy	4.9/5	61 giờ	Đại học Stanford
3	Nền tảng Khoa học Dữ liệu: K-Means, Clustering in Python	4.6/5	29 giờ	Đại học London
4	Phân tích Dữ liệu cho Lean Six Sigma	4.8/5	11 giờ	Đại học Amsterdam
5	Khoa học Thần kinh Tính toán	4.6/5	26 giờ	Đại học Washington
6	Giới thiệu về Xác suất một cách trực quan	4.7/5	30 giờ	Đại học Zurich
7	Xác suất và Thống kê	4.6/5	16 giờ	Đại học London
8	Đạo đức Khoa học Dữ liệu	4.8/5	15 giờ	Đại học Michigan
9	Cơ bản về Excel cho Trực quan hóa Dữ liệu	4.1/5	1 giờ	Cộng đồng Coursera
10	Dự đoán bệnh tim bằng Học máy	4.1/5	50 phút	Cộng đồng Coursera
11	Phân tích Chuỗi Thời gian Khám phá	4.2/5	82 phút	Cộng đồng Coursera
12	Tập Hợp Quần Chúng hiệu quả cho Học máy	3.0/5	17 giờ	Yandex
13	Sức khỏe Dân số: Phân tích Dữ liệu có Trách nhiệm	4.6/5	21 giờ	Đại học Leiden

Intermediate-Level

Trung cấp

S/N	Course Name	Rating	Time to Complete	Provider
14.	Process Mining: Data science in Action	4.7/5	22 hours	Eindhoven University of Technology
15.	Bayesian Statistics: From Concept to Data Analysis	4.6/5	12 hours	UC Santa Cruz
16.	Practical Time Series Analysis	4.6/5	26 hours	The State University of New York
17.	Introduction to Embedded Machine Learning	4.8/5	17 hours	Edge Impulse
18.	Improving your statistical inferences	4.9/5	28 hours	Eindhoven University of Technology
19.	Data Science in Stratified Healthcare and Precision Medicine	4.6/5	17 hours	University of Edinburgh
20.	Machine Translation	4.5/5	27 hours	Karlsruhe Institute of Technology
21.	Computer Vision with Embedded Machine Learning	NA	31 hours	Edge Impulse
22.	Experimentation for Improvement	4.8/5	13 hours	McMaster University
23.	Power and Sample Size for Multilevel and Longitudinal Study Designs	4.4/5	24 hours	University of Florida
24.	Improving Your Statistical Questions	4.9/5	18 hours	Eindhoven University of Technology
25.	Population Health: Predictive Analytics	5.0/5	18 hours	Leiden University
26.	Global Statistics – Composite Indices for International Comparisons	4.6/5	16 hours	University of Geneva
27.	Brain Tumor Classification Using Keras	4.5/5	2 hours	Coursera community
28.	Basic Data Analysis and Model Building using Python	3.6/5	1.5 hours	Coursera community
29.	Forecasting Univariate Time Series with an LSTM	3.5/5	2 hours	Coursera community
30.	Predicting Wine Quality with Random Forest and Scikit-Learn	NA	2.5 hours	Coursera community
31.	Analyzing WhatsApp Chat Data	4.1/5	2 hours	Coursera community
32.	Developing Data Science Projects With Limited Computer Resources Using Google Colaboratory	4.4/5	2 hours	Coursera community
33.	Hands-on Text Mining and Analytics	3.9/5	13 hours	Yonsei University
34.	Regression using Scikit-Learn	3.4/5	1.5 hours	Coursera community

Advanced-Level

Cấp độ Nâng cao

S/N	Course Name	Rating	Time to Complete	Provider
35.	Causal Inference	3.3/5	12 hours	Columbia University
36.	Causal Inference 2	3.4/5	6 hours	Columbia University
37.	Data Science for Business with R Programming	4.9/5	2 hours	Coursera community
38.	Segment your market using factor analysis with R programming	NA	2 hours	Coursera community

Và đây là kết thúc danh sách. Vì vậy, đây là 38 Khóa học Miễn phí về Khoa học Dữ liệu trên Coursera. Mình sẽ tiếp tục bổ sung thêm các khóa học miễn phí vào danh sách này.

Kết luận

Mình hy vọng rằng những Khóa học Miễn phí về Khoa học Dữ liệu trên Coursera này sẽ giúp bạn nâng cao kỹ năng khoa học dữ liệu và học máy của mình. Nếu bạn có bất kỳ thắc mắc hay câu hỏi nào, hãy tự do đặt câu hỏi trong phần bình luận.

Chúc may mắn!

Chúc bạn học tập vui vẻ!