TAILIEUCHUNG - Ứng dụng đại số gia tử trong tóm tắt dữ liệu bằng ngôn ngữ

Bài viết trình bày một phương pháp mới để sinh ra các tóm tắt bằng ngôn ngữ mà ngữ nghĩa dựa trên cấu trúc Đại số gia tử. So với cách tiếp cận dựa trên lí thuyết mờ, cách tiếp cận dựa trên Đại số gia tử hạn chế được sự mất thông tin và làm giảm độ sai lệch trong tóm tắt dữ liệu. | JOURNAL OF SCIENCE OF HNUE DOI Natural Sci. 2015 Vol. 60 No. 4 pp. 71-79 This paper is available online at http ỨNG DỤNG ĐẠI SỐ GIA TỬ TRONG TÓM TẮT DỮ LIỆU BẰNG NGÔN NGỮ Phạm Thị Lan và Hồ Cẩm Hà Khoa Công nghệ thông tin Trường Đại học Sư phạm Hà Nội Tóm tắt. Tóm tắt dữ liệu bằng ngôn ngữ linguistic database summarization là một trong những khả năng mà các hệ thống thông tin hướng đến. Kacprzyk và các cộng sự đã đạt được nhiều kết quả khi nghiên cứu bài toán tóm tắt dữ liệu do Yager đề ra 1982 dựa trên lí thuyết mờ của Zadeh. Trong bài báo này chúng tôi trình bày một phương pháp mới để sinh ra các tóm tắt bằng ngôn ngữ mà ngữ nghĩa dựa trên cấu trúc Đại số gia tử. So với cách tiếp cận dựa trên lí thuyết mờ cách tiếp cận dựa trên Đại số gia tử của chúng tôi hạn chế được sự mất thông tin và làm giảm độ sai lệch trong tóm tắt dữ liệu. Từ khóa Tóm tắt dữ liệu đại số gia tử định lượng ngôn ngữ. 1. Mở đầu Dữ liệu con người thu thập được ở nhiều dạng dạng số dạng phi số từ ngữ hình ảnh âm thanh. . Tuy nhiên trong hầu hết các tình huống chúng ta đưa ra quyết định dựa trên các thông tin diễn đạt bằng ngôn ngữ. Các câu tóm tắt dữ liệu bằng ngôn ngữ được rút ra từ những cơ sở dữ liệu là một dạng của tri thức. Do đó tóm tắt dữ liệu bằng ngôn ngữ là cơ sở quan trọng trong các hệ thống hỗ trợ ra quyết định điều khiển tự động. Một tóm tắt dữ liệu theo Yager 1982 định nghĩa trong 1 gồm có 3 thành phần tóm tắt S định lượng thỏa đáng Q độ tin cậy T. Dựa trên khái niệm protoform của Zadeh các tác giả Kacprzyk Zadrozny 2 đã đưa ra hai dạng tổng quát cho một tóm tắt như sau Dạng 1 Q y are S. Ví dụ Hầu hết Q công nhân y lương cao S . Dạng 2 Q B y are S. Ví dụ Hầu hết Q công nhân y trẻ B lương cao S . Với y có nghĩa là bản ghi B là điều kiện lọc. Các nghiên cứu về tóm tắt dữ liệu 1-4 đều dựa trên lí thuyết tập mờ. Khi đó ngữ nghĩa của các hạng từ trong S B Q được diễn đạt bằng các tập mờ độ tin cậy T được tính toán dựa trên giá trị của các

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.