Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển

pdf
Số trang Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển 26 Cỡ tệp Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển 538 KB Lượt tải Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển 0 Lượt đọc Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển 35
Đánh giá Bài giảng Xây dựng hệ khai mỏ dữ liệu: Phân lớp dữ liệu (cây quyết định) - Phan Hiển
4.9 ( 11 lượt)
Nhấn vào bên dưới để tải tài liệu
Đang xem trước 10 trên tổng 26 trang, để tải xuống xem đầy đủ hãy nhấn vào bên trên
Chủ đề liên quan

Nội dung

XÂY DỰNG HỆ KHAI MỎ DỮ LIỆU PHÂN LỚP DỮ LIỆU (CÂY QUYẾT ĐỊNH) Phan Hiền KHÁI QUÁT  Cây quyết định là một phương pháp phân lớp dựa vào nguyên lý học có giám sát.  Yếu tố quan trọng ◦ Dữ liệu huấn luyện nên cây quyết định Dữ liệu phải là mẩu có độ chính xác cao. ◦ Thang đo trong việc phân lớp Thang đo phải phù hợp và thể hiện được tinh thần phân lớp dựa vào độ thường xuyên. XU HƯỚNG 1 Xét vấn đề sau: Một nhà đầu tư quyết định mua 3 dòng sản phẩm Xe, Vàng, Cổ phiếu. Nhà đầu tư nhận thấy (mọi chuyện tốt đẹp) nếu bỏ 100 mua Xe thì lời thu được là 40, nếu có lỗ thì thiệt hại là 15. Nếu bỏ 300 mua Vàng, nếu lời thu được là 200, nếu lỗ thì thiệt hại là 300. Nếu bỏ 1000 mua cổ phiếu, lời có thể là 100, nhưng thiệt hại có thể là 500. Ta có thể xác định một tổ chức các kế hoạch cho việc lựa chọn một quyết định đầu tư nào đó XU HƯỚNG 1 Lợi: 40 Đầu tư 100 Hại: 15 Lợi: 200 Đầu tư Mua vàng 300 Hại: 300 Lợi: 100 Đầu tư 1000 Hại: 500 XU HƯỚNG 1 Vấn đề được xét thêm yếu tố thường thấy Một nhà đầu tư quyết định mua 3 dòng sản phẩm Xe, Vàng, Cổ phiếu. Nhà đầu tư nhận thấy (mọi chuyện tốt đẹp) nếu bỏ 100 mua Xe thì lời thu được là 40, nếu có lỗ thì thiệt hại là 15. Nếu bỏ 300 mua Vàng, nếu lời thu được là 200, nếu lỗ thì thiệt hại là 300. Nếu bỏ 1000 mua cổ phiếu, lời có thể là 100, nhưng thiệt hại có thể là 500. Đối với mua xe, khả năng thành công là 0.7 Đối với mua vàng, khả năng thành công là 0.4 Đối với mua cổ phiếu, khả năng thành công là 0.8 Ta có thể xác định một tổ chức các kế hoạch cho việc lựa chọn một quyết định đầu tư nào đó XU HƯỚNG 1 Lợi: 40 Đầu tư 100 0.7 0.3 Hại: 15 Lợi: 200 Đầu tư Mua vàng 300 0.4 0.6 Hại: 300 Lợi: 100 Đầu tư 1000 0.8 0.2 Hại: 500 XU HƯỚNG 1 Vấn đề đặt ra là lựa chọn phương án nào. Có 2 giải pháp - Dùng hệ số kỳ vọng (Expected value) EV   Pi *Vi i Pi là khả năng của nhánh i, Vi là giá trị đạt của nhánh i. - Dùng hệ số hữu dụng (Utility) Dựa vào hàm mũ để xác định tính chất độ hữu dụng giảm dần khi được cung cấp quá nhiều. - Dùng hệ số liều lỉnh (Risk) XU HƯỚNG 1 Lợi: 40 Đầu tư 100 0.7 EV= 23.5 0.3 Hại: -15 Lợi: 200 EV= 23.5 Đầu tư Mua vàng 300 0.4 EV= -100 0.6 Hại: -300 Lợi: 100 Đầu tư 1000 0.8 EV= -20 0.2 Hại: -500 Chọn EV cao, EV chính là khoảng lời lỗ kỳ vọng bình quân XU HƯỚNG 1 Bài toán có thể được mở rộng cho nhiều phần hơn, cây quyết định có nhiều cấp độ hơn. XU HƯỚNG 2 Xây dựng cây quyết định là quá trình phân lớp.  Xây dựng cây quyết định dựa trên tập các giá trị huấn luyện.  Vấn đề quan tâm  ◦ Thang đo để quyết định tách lớp ◦ Tập dữ liệu
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.