Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Kinh Tế - Quản Lý
Luật học
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
TAILIEUCHUNG - Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
Nghiên cứu này trình bày kết quả của việc rút trích từ khóa tự động từ văn bản pháp luật Tiếng Việt sử dụng thuật toán TextRank. TextRank là phương pháp rút trích từ khóa không giám sát từ văn bản dựa vào việc xếp hạng trên đồ thị. Văn bản sẽ được biểu diễn thành dạng đồ thị, với các từ là đỉnh và mối quan hệ lân cận giữa các từ là cạnh. Sau đó, các đỉnh trên đồ thị sẽ được xếp hạng dựa trên mối quan hệ với các đỉnh khác trong đồ thị. Mời các bạn cùng tham khảo! | RÚT TRÍCH TỪ KHÓA TỪ VĂN BẢN PHÁP LUẬT TIẾNG VIỆT BẰNG THUẬT TOÁN TEXTRANK Lê Thị Ngọc Thơ Khoa Công nghệ Thông tin trường Đại học Công nghệ TP. Hồ Chí Minh HUTECH TÓM TẮT Trong nghiên cứu này chúng tôi trình bày kết quả của việc rút trích từ khóa tự động từ văn bản pháp luật Tiếng Việt sử dụng thuật toán TextRank. TextRank là phương pháp rút trích từ khóa không giám sát từ văn bản dựa vào việc xếp hạng trên đồ thị. Văn bản sẽ được biểu diễn thành dạng đồ thị với các từ là đỉnh và mối quan hệ lân cận giữa các từ là cạnh. Sau đó các đỉnh trên đồ thị sẽ được xếp hạng dựa trên mối quan hệ với các đỉnh khác trong đồ thị. Các từ ở đỉnh tương ứng có trọng số cao sẽ được trích ra và kết hợp với nhau thành từ khóa. Chúng tôi thực nghiệm thuật toán TextRank trên một chương của Luật Bảo hiểm Xã hội Việt Nam. Kết quả cao nhất thu được là khi rút trích từ khóa tự động. Chúng tôi nhận thấy đặc điểm của từ khóa trong văn bản Tiếng Việt khá dài và chứa nhiều từ khác ngoài danh từ và tính từ. Do đó một phương pháp khác cần được đề xuất để cải tiến hiệu suất của việc rút trích cụm từ khóa từ văn bản pháp luật Tiếng Việt. Từ khóa Rút trích thông tin TextRank tiếng Việt từ khóa văn bản pháp luật. 1. GIỚI THIỆU Văn bản pháp luật thường được xem là dạng văn bản khó đọc vì đặc trưng vốn có nhiều thuật ngữ cụm từ và câu được viết rất chặt chẽ nhằm diễn đạt các quy định của pháp luật. Các thuật ngữ trong văn bản pháp luật thường dài và câu trong văn bản pháp luật thường tham chiếu đến nội dung ở câu khác trong cùng văn bản hoặc đến văn bản pháp luật khác. Trong nghiên cứu này chúng tôi áp dụng các phương pháp trong Xử lý Ngôn ngữ Tự nhiên XLNNTN vào văn bản pháp luật Tiếng Việt nhằm hướng tới việc hỗ trợ cho người đọc có thể nhanh chóng nắm bắt được thông tin trong văn bản pháp luật. Cụ thể là chúng tôi tiến hành rút trích từ khóa trong văn bản pháp luật tiếng Việt. Nói cách khác đề tài này nhằm mục đích tìm phương pháp trích lọc những nội dung khái quát trong một văn bản pháp luật
Thanh Hà
534
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt bằng thuật toán TextRank
5
64
3
Bài giảng Khai phá web - Bài 7: Trích rút thông tin
64
11
1
Phương pháp trích rút từ khóa tìm tập ứng cử trong bài toán phát hiện đạo văn
9
56
0
Tóm tắt luận văn Thạc sĩ: Nghiên cứu các phương pháp trích rút văn bản từ trang web và ứng dụng
26
105
0
Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng
49
87
1
Rút trích văn bản từ tập tin hình ảnh với Tesseract
7
78
1
Rút trích văn bản từ tập tin hình ảnh tesseract
7
118
3
Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút từ kho ngữ liệu
37
55
3
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu các phương pháp trích rút từ khoá từ trang web và ứng dụng
25
72
0
Tóm tắt Luận án Tiến sĩ Ngữ văn: Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng Việt
26
41
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461857
55
Giới thiệu :Lập trình mã nguồn mở
14
22603
58
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10049
445
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9513
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8268
1124
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8224
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6669
253
Vật lý hạt cơ bản (1)
29
5765
85
TỪ KHÓA LIÊN QUAN
Luật học
Rút trích từ khóa
Văn bản pháp luật tiếng Việt
Thuật toán TextRank
Phương pháp rút trích từ khóa
Rút trích từ khóa từ văn bản pháp luật Tiếng Việt
Trích rút từ khóa
Tập ứng cử
Phương pháp trích rút từ khóa
Bài toán phát hiện đạo văn
Độ đo tf
idf mức tài liệu
Tài liệu nghi ngờ bị sao chép
Bài giảng Xử lý ngôn ngữ tự nhiên
Xử lý ngôn ngữ tự nhiên
Natural language processing
Hệ hỏi đáp
Khai thác N Grams
Thuật toán lựa chọn từ khóa
Vòng lặp trích rút đoạn
TÀI LIỆU MỚI ĐĂNG
CẤU TẠO HẠT NHÂN NGUYÊN TỬ-ĐỘ HỤT KHỐI-NĂNG LƯỢNG LIÊN KẾT-LK RIÊNG
12
264
0
24-04-2024
Bibliography on Medieval Women, Gender, and Medicine 1980-2009
82
207
0
24-04-2024
BeginningMac OS X Tiger Dashboard Widget Development 2006 phần 2
34
208
0
24-04-2024
extremetech Hacking Firefox phần 7
46
187
0
24-04-2024
Management and Services Part 1
10
155
0
24-04-2024
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
138
0
24-04-2024
Hướng dẫn sử dụng Quickoffice cho Ipad và Iphone
13
150
0
24-04-2024
Đề tài: Tìm hiểu một số yêu cầu đặt ra với một phòng thu âm, để đảm bảo chất lượng âm thanh trong sản phẩm đa phương tiện
8
159
1
24-04-2024
Giáo trình CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT - Chương 1
5
124
0
24-04-2024
Khurana et al. Journal of Orthopaedic Surgery and Research 2010, 5:23
7
133
0
24-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5678
1349
Ebook Chào con ba mẹ đã sẵn sàng
112
3757
1230
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5309
1135
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8268
1124
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3489
642
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3678
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4040
514
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4120
480
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.