TAILIEUCHUNG - Data Mining Concepts and Techniques phần 6

Phân tích như vậy có thể giúp cung cấp cho chúng tôi với một sự hiểu biết tốt hơn của các dữ liệu ở lớn. Trong khi đó, phân loại dự đoán các nhãn phân loại (rời rạc, không có thứ tự), các mô hình dự báo continuousvalued chức năng. Ví dụ, chúng ta có thể xây dựng một mô hình phân loại để phân loại các ứng dụng vốn vay ngân hàng như là an toàn hoặc nguy hiểm, | 362 Chapter 6 Classification and Prediction cancerous patient is not cancerous is far greater than that of a false positive incorrectly yet conservatively labeling a noncancerous patient as cancerous . In such cases we can outweigh one type of error over another by assigning a different cost to each. These costs may consider the danger to the patient financial costs of resulting therapies and other hospital costs. Similarly the benefits associated with a true positive decision may be different than that of a true negative. Up to now to compute classifier accuracy we have assumed equal costs and essentially divided the sum of true positives and true negatives by the total number of test tuples. Alternatively we can incorporate costs and benefits by instead computing the average cost or benefit per decision. Other applications involving cost-benefit analysis include loan application decisions and target marketing mailouts. For example the cost of loaning to a defaulter greatly exceeds that of the lost business incurred by denying a loan to a nondefaulter. Similarly in an application that tries to identify households that are likely to respond to mailouts of certain promotional material the cost of mailouts to numerous households that do not respond may outweigh the cost of lost business from not mailing to households that would have responded. Other costs to consider in the overall analysis include the costs to collect the data and to develop the classification tool. Are there other cases where accuracy may not be appropriate In classification problems it is commonly assumed that all tuples are uniquely classifiable that is that each training tuple can belong to only one class. Yet owing to the wide diversity of data in large databases it is not always reasonable to assume that all tuples are uniquely classifiable. Rather it is more probable to assume that each tuple may belong to more than one class. How then can the accuracy of classifiers on large databases be .

Bá Thịnh 46 78 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Tự học nhanh và hiệu quả SQL Server 7.0 part 6

30 92 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 7

30 94 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 8

30 102 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 9

30 98 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 10

28 96 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 1

30 105 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 2

30 99 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 3

30 85 1

Tự học nhanh và hiệu quả SQL Server 7.0 part 4

30 86 1

Tự học nhanh và hiệu quả SQL Server 7.0 part 5

30 95 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462351 61

Giới thiệu :Lập trình mã nguồn mở

14 26588 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11375 543

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10565 468

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9854 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8906 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8518 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8109 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7875 1810

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7286 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Báo cáo nghiên cứu khoa học " HÃY LÀM CHO HUẾ XANH HƠN VÀ ĐẸP HƠN "

6 187 3 07-01-2025

CHƯƠNG 2: RỦI RO THÂM HỤT TÀI KHÓA

28 165 1 07-01-2025

Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán

24 1077 2 07-01-2025

Báo cáo " Thẩm quyền quản lí nhà nước đối với hoạt động quảng cáo thực trạng và hướng hoàn thiện "

7 216 7 07-01-2025

Báo cáo nghiên cứu khoa học " Vai trò chính quyền địa phương trong phát triển kinh tế : khu chuyên doanh gốm sứ ( Trung Quốc ) và Bát Tràng ( Việt Nam )("

11 217 1 07-01-2025

Báo cáo nghiên cứu khoa học " NÂNG QUAN HỆ KINH TẾ THƯƠNG MẠI VIỆT NAM - TRUNG QUỐC LÊN TẦM CAO THỜI ĐẠI "

8 178 1 07-01-2025

IT Audit: EMC’s Journey to the Private Cloud

13 163 1 07-01-2025

Báo cáo lâm nghiệp: "Assessment of the effects of below-zero temperatures on photosynthesis and chlorophyll a fluorescence in leaf discs of Eucalyptus globulu"

4 152 0 07-01-2025

TRẮC NGHIỆM - CÁC BỆNH THIẾU DINH DƯỠNG THƯỜNG GẶP

32 220 2 07-01-2025

Phạm trù Chủ nghĩa cá nhân của tư tưởng phương Tây trong sự lý giải của Phan Khôi _1

9 138 0 07-01-2025

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8109 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7875 1810

Ebook Chào con ba mẹ đã sẵn sàng

112 4432 1376

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6346 1276

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8906 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3858 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3930 610

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4768 567

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11375 543

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4533 490