TAILIEUCHUNG - Đồ án tốt nghiệp: Nghiên cứu Datamining microsoft server 2005 với thuật toán microsoft association rules và microsoft decision tree

Đồ án tốt nghiệp: Nghiên cứu Datamining microsoft server 2005 với thuật toán microsoft association rules và microsoft decision tree trình bày về khái niệm khai thác dữ liệu; các thuật toán khai thác dữ liệu; decision tree; định hướng phát triển. Mời các bạn tham khảo. | Đồ Án Tốt Nghiệp 1 GVHD Ths Võ Đình Bảy Chương 1 Khái niệm về khai thác dữ liệu 1. Giới thiệu Việc khai thác dữ liệu thường được mô tả như một quá trình lấy các thông tin có giá trị xác thực từ những cơ sở dữ liệu lớn. Nói cách khác việc khai thác dữ liệu bắt nguồn từ các dạng mẫu và khuynh hướng tồn tại trong dữ liệu. Các mẫu và khuynh hướng này có thể được gom lại với nhau và được định nghĩa như là một mô hình khai thác. Các mô hình này có thể được áp dụng cho các kịch bản nghiệp vụ riêng biệt như - Dự đoán việc bán hàng. - Chuyển thư đến các khách hàng được chỉ định. - Xác định các sản phẩm nào có khả năng được bán với nhau. - Tìm các trình tự mà khách hàng chọn các sản phẩm. Một khái niệm quan trọng là xây dựng mô hình khai thác là một phần của một tiến trình lớn hơn bao gồm từ việc xác định các vấn đề cơ bản mà mô hình sẽ giải thích đến việc triển khai mô hình này vào môi trường làm việc. Tiến trình này có thể được định nghĩa bằng việc triển khai 6 bước cơ bản sau Bước 1 Xác định vấn đề. Bước 2. Chỉnh sửa dữ liệu. Bước 3. Thăm dò dữ liệu. Bước 4. Xây dựng mô hình. Bước 5. Thăm dò và thông qua các mô hình. Bước 6. Triển khai và cập nhật các mô hình. Biểu đồ sau mô tả mối quan hệ giữa mỗi bước trong tiến trình và có thể sử dụng công nghệ trong Microsoft SQL Server 2005 để hoàn thành từng bước. SVTH Hoàng Thị Thu-104102128 Đồ Án Tốt Nghiệp 2 GVHD Ths Võ Đình Bảy Hình Mô tả mối quan hệ giữa các bước trong tiến trình Mặc dù tiến trình được minh họa trong biểu đồ là hình tròn nhưng mỗi bước không trực tiếp dẫn đến bước tiếp theo. Tạo ra một mô hình khai thác dữ liệu là một tiến trình động và lặp lại. Sau khi thăm dò dữ liệu có thể nhận ra rằng dữ liệu không đủ để tạo ra mô hình khai thác thích hợp do đó sẽ phải tìm thêm dữ liệu. Có thể xây dựng nhiều mô hình và nhận ra là chúng không giải quyết được các vấn đề đã đưa ra khi định nghĩa vấn đề và do đó phải xác định lại vấn đề đó. Có thể cập nhật các mô hình sau khi chúng được triển khai bởi vì nhiều dữ liệu hơn .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.