Tránh rò rỉ dữ liệu (Data Leakage)
Trong bài hôm nay, chúng ta sẽ tìm hiểu về vấn đề rò rỉ dữ liệu và một số cách để tránh gặp phải vấn đề này trong thực tiễn. Nếu không biết cách xử lý, rò rỉ...
Chào mừng bạn đến với khóa học học máy trung cấp (Intermediate Machine Learning) từ Kaggle Learn!
Khoá học này dành cho các bạn đã có kiến thức cơ bản về học máy và đang tìm cách để cải thiện chất lượng mô hình của mình. Trong khóa học này, các bạn sẽ được làm quen với một số khái niệm và kỹ thuật mới trong quá trình xây dựng mô hình học máy.
Trong bài hôm nay, chúng ta sẽ tìm hiểu về vấn đề rò rỉ dữ liệu và một số cách để tránh gặp phải vấn đề này trong thực tiễn. Nếu không biết cách xử lý, rò rỉ...
Trong bài hôm nay, chúng ta sẽ học cách phát triển và tối ưu mô hình học máy với gradient boosting, phương pháp đã thống trị rất nhiều cuộc thi học máy trên ...
Trong bài hôm nay, chúng ta sẽ học cách sử dụng phương pháp kiểm định chéo để đánh giá chất lượng mô hình.
Trong bài hôm nay, chúng ta sẽ học cách xây dựng mô hình học máy thông qua pipelines (chuỗi quy trình?).
Trong bài hôm nay, chúng ta sẽ học một khái niệm mới về biến phân loại (categorical variables) cùng với cách xử lý loại dữ liệu này.
Trong bài hôm nay, chúng ta sẽ học 3 phương pháp để xử lý dữ liệu bị thiếu (missing values) và so sánh hiệu quả của các phương pháp này với nhau.
Chào mừng bạn đến với khóa học học máy trung cấp (Intermediate Machine Learning) từ Kaggle Learn!