TAILIEUCHUNG - Một phương pháp kết hợp các mô hình học sâu và kỹ thuật học tăng cường hiệu quả cho tóm tắt văn bản hướng trích rút

Tóm tắt văn bản tự động là bài toán quan trọng trong xử lý ngôn ngữ tự nhiên. Tóm tắt văn bản trích rút các thông tin quan trọng nhất từ một hoặc nhiều văn bản nguồn để tạo ra một văn bản tóm tắt ngắn gọn, súc tích nhưng vẫn giữ được các ý chính, đúng ngữ pháp và đảm bảo được tính mạch lạc của văn bản. Bài viết đề xuất một phương pháp tóm tắt văn bản hướng trích rút hiệu quả sử dụng kết hợp các mô hình học sâu, kỹ thuật học tăng cường và phương pháp MMR để sinh bản tóm tắt. | TNU Journal of Science and Technology 226 11 208 - 215 AN EFFECTIVE METHOD COMBINING DEEP LEARNING MODELS AND REINFORCEMENT LEARNING TECHNOLOGY FOR EXTRACTIVE TEXT SUMMARIZATION Luu Minh Tuan1 2 Le Thanh Huong1 Hoang Minh Tan1 1Hanoi University of Science and Technology 2National Economics University ARTICLE INFO ABSTRACT Received 13 7 2021 Automatic text summarization is an important problem in natural language processing. Text summarization extracts the most important Revised 12 8 2021 information from one or many source texts to generate a brief concise Published 12 8 2021 summary that still retains main ideas correct grammar and ensures the coherence of the text. With the application of machine learning KEYWORDS techniques as well as deep learning models in automatic text summarization models gave summaries that were closely resemble Text summarization human reference summaries. In this paper we propose an effective Reinforcement learning extractive text summarization method by combining the deep learning BERT model models the reinforcement learning technique and MMR method to generate the summary. Our proposed method is experimented on CNN CNN dataset English and Baomoi dataset Vietnamese giving F1- GRU score accuracy results with Rouge-1 Rouge-2 Rouge-L are and respectively. The experimental results show that our proposed summarization method has achieved good results for English and Vietnamese text summarization. MỘT PHƯƠNG PHÁP KẾT HỢP CÁC MÔ HÌNH HỌC SÂU VÀ KỸ THUẬT HỌC TĂNG CƯỜNG HIỆU QUẢ CHO TÓM TẮT VĂN BẢN HƯỚNG TRÍCH RÚT Lưu Minh Tuấn1 2 Lê Thanh Hương1 Hoàng Minh Tân1 1Trường Đại học Bách khoa Hà Nội 2Trường Đại học Kinh tế Quốc dân THÔNG TIN BÀI BÁO TÓM TẮT Ngày nhận bài 13 7 2021 Tóm tắt văn bản tự động là bài toán quan trọng trong xử lý ngôn ngữ tự nhiên. Tóm tắt văn bản trích rút các thông tin quan trọng nhất từ Ngày hoàn thiện 12 8 2021 một hoặc nhiều văn bản nguồn để tạo ra một văn bản tóm tắt ngắn Ngày đăng

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.