Skip to content

Latest commit

 

History

History
6 lines (6 loc) · 796 Bytes

README.md

File metadata and controls

6 lines (6 loc) · 796 Bytes

BÀI TẬP

  1. Áp dụng lý thuyết CLT để tính giá trị trung bình của SalePrice (tập dữ liệu giá nhà) chỉ sử dụng 400 mẫu. Tính độ lệch chuẩn và vẽ biểu đồ histogram cho dữ liệu mean dựa và CLT.
  2. Phân tích mối quan hệ giữa SalePrice và các thuộc tính kiểu loại (categorical data) và rút ra nhận xét. Ít nhất 3 thuộc tính.
  3. Phân tích mối quan hệ giữa SalePrice và các thuộc tính kiểu số (numerical data) và rút ra nhận xét. Ít nhất 3 thuộc tính.
  4. Chọn kỹ thuật phù hợp (LabelEncoder và OnehotEncoding) để biến đổi các thuộc tính kiểu loại.
  5. Xử lý các dữ liệu nhiễu trong dữ liệu và tính lại hệ số tương quan so với SalePrice.