TAILIEUCHUNG - INTRODUCTION TO KNOWLEDGE DISCOVERY AND DATA MINING - CHAPTER 7

Evaluation of discovered knowledge - Mục tiêu của phân loại học tập từ dữ liệu mẫu để phân loại và dự đoán thành công trên các dữ liệu mới. Các biện pháp được sử dụng phổ biến nhất của sự thành công hay thất bại là tỷ lệ lỗi của một phân loại. Mỗi lần phân loại được trình bày với một trường hợp, nó làm cho một quyết định về các lớp học thích hợp đối với trường hợp một. Đôi khi nó là đúng, đôi khi nó là sai. Tỷ lệ lỗi thật sự là thống kê. | Chapter 7 Evaluation of discovered knowledge The objective of learning classifications from sample data is to classify and predict successfully on new data. The most commonly used measure of success or failure is a classifier s error rate. Each time a classifier is presented with a case it makes a decision about the appropriate class for a case. Sometimes it is right sometimes it is wrong. The true error rate is statistically defined as the error rate of the classifier on an asymptotically large number of new cases that converge in the limit to the actual population distribution. As noted in Equation an empirical error rate can be defined as the ratio of the number of errors to the number of cases examined. number of errors error rate - -------- number of cases If we were given an unlimited number of cases the true error rate would be readily computed as the number of samples approached infinity. In the real world the number of samples available is always finite and typically relatively small. The major question is then whether it is possible to extrapolate from empirical error rates calculated from small sample results to the true error rate. It turns out that there are a number of ways of presenting sample cases to the classifier to get better estimates of the true error rate. Some techniques are much better than others. In statistical terms some estimators of the true error rate are considered biased. They tend to estimate too low . on the optimistic side or too high . on the pessimistic side. In this chapter we will review the techniques that give the best estimates of the true error rate and consider some of the factors that can produce poor estimates of performance. 7. 1 What Is an Error An error is simply a misclassification the classifier is presented a case and it classifies the case incorrectly. If all errors are of equal importance a single-error rate calculated as in Equation summarizes the overall performance of a classifier. However

Duy Minh 52 19 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Tổng quan về quản trị dữ liệu, kiến thức dữ liệu và quản lý chất lượng dữ liệu

15 43 1

Bài giảng Hệ cơ sở dữ liệu: Chương 1 - ThS. Trịnh Thị Ngọc Linh

33 113 1

Cơ sở dữ liệu - TS. Phạm Thế Quế

223 237 13

Bài 1 Kiến thức nền tảng về Cơ sở dữ liệu

16 65 1

Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 1: Nhắc lại các kiến thức cơ bản

8 138 3

Bài giảng Cơ sở dữ liệu đất đai - Trường ĐH Tài nguyên và Môi trường TP.HCM

49 10 1

Concepts of RDBMS and SQL Server : Bài 1 Kiến thức nền tảng về Cơ sở dữ liệu

27 55 0

Bài giảng: Cấu trúc giữ liệu

151 74 0

Chương 9: Thiết kế cơ sở dữ liệu vật lý

5 76 1

INTRODUCTION TO KNOWLEDGE DISCOVERY AND DATA MINING - CHAPTER 1

20 45 0

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462341 61

Giới thiệu :Lập trình mã nguồn mở

14 26053 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11346 542

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10551 466

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9842 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8505 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7748 1790

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7264 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "

7 277 4 27-12-2024

Data Structures and Algorithms - Chapter 8: Heaps

41 188 5 27-12-2024

báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"

6 156 3 27-12-2024

Báo cáo " Bàn về hành vi pháp luật và hành vi đạo đức "

11 179 2 27-12-2024

ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards

7 147 1 27-12-2024

Báo cáo nghiên cứu khoa học " Đại hội XVI thông qua điều lệ Đảng cộng sản Trung Quốc những sửa đổi bổ sung mới "

4 163 1 27-12-2024

Chủ đề 3 : SỰ CÂN BẰNG CỦA VẬT RẮN (4 tiết)

9 207 1 27-12-2024

5 thói quen ăn uống hủy hoại hàm răng đẹp

5 168 1 27-12-2024

Lập trình Java cơ bản : Luồng và xử lý file part 8

5 141 1 27-12-2024

Lịch sử Trung Quốc 5000 năm tập 3 part 2

54 151 1 27-12-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7748 1790

Ebook Chào con ba mẹ đã sẵn sàng

112 4407 1371

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6284 1266

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3840 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3920 609

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4709 565

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11346 542

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4509 490