Cuốn sổ tay tham khảo này mang đến trải nghiệm thực tế về các thuật toán và kỹ thuật phổ biến được sử dụng trong khoa học dữ liệu thời gian thực cho tất cả các nhà nghiên cứu đang làm việc trong nhiều lĩnh vực khác nhau.
(This desk reference handbook gives a hands-on experience on various algorithms and popular techniques used in real-time in data science to all researchers working in various domains.)
Khoa học Dữ liệu là một trong những lĩnh vực nghiên cứu hàng đầu trong thời đại hiện đại. Nó đóng vai trò quan trọng trong chăm sóc sức khỏe, kỹ thuật, giáo dục, cơ điện tử và robot y tế.
Việc xây dựng mô hình và làm việc với dữ liệu không phải là trung lập về giá trị (Building models and working with data is not value-neutral.)
Chúng ta chọn các vấn đề để làm việc, đưa ra giả định trong các mô hình này, và quyết định về các chỉ số và thuật toán cho các vấn đề.
(We choose the problems with which we work, make assumptions in these models, and decide on metrics and algorithms for the problems.)
Nhà khoa học dữ liệu xác định vấn đề có thể được giải quyết bằng dữ liệu và các công cụ chuyên gia về mô hình hóa và lập trình.
(The data scientist identifies the problem which can be solved with data and expert tools of modeling and coding.)
Cuốn sách bắt đầu với các khái niệm giới thiệu trong khoa học dữ liệu như xử lý dữ liệu (data munging), chuẩn bị dữ liệu (data preparation), và chuyển đổi dữ liệu (transforming data).
Chương 2 thảo luận về trực quan hóa dữ liệu, vẽ các biểu đồ tần suất khác nhau.
Chương 3 bao gồm toán học và thống kê cho khoa học dữ liệu.
Chương 4 chủ yếu tập trung vào các thuật toán học máy (machine learning algorithms) trong khoa học dữ liệu.
Chương 5 bao gồm phân tích ngoại lai (outlier analysis) và thuật toán DBSCAN.
Chương 6 tập trung vào phân cụm (clustering).
Chương 7 thảo luận về phân tích mạng (network analysis).
Chương 8 chủ yếu tập trung vào hồi quy (regression) và phân loại naive-bayes.
Chương 9 bao gồm trực quan hóa dữ liệu trên web với Plotly.
Chương 10 thảo luận về thu thập dữ liệu từ web.
Cuốn sách kết thúc với một phần thảo luận về 19 dự án về các chủ đề khác nhau trong khoa học dữ liệu.
Link download free [pdf]: https://byteshare.kenkavn.com/download.php?id=48&token=Vhic4y7e3SJxFC2HBCUJAXLtjiNkI8Cs (Hết hạn vào ngày 31/12/2024)
Để lại một bình luận