Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Trong bài báo này, tác giả phân loại thể loại ở Wikipedia Tiếng Việt, chi tiết hơn là cấu trúc và các quy ước đặt tên thể loại. Phương pháp chính là áp dụng các tiêu chuẩn và cấu trúc thể loại sẵn có ở tiếng Anh, một dự án Wikipedia lớn nhất về mặt thông tin đóng góp, từ đó áp dụng cho phiên bản tiếng Việt. | TẠP CHÍ KHOA HỌC ĐẠI HỌC ĐÀ LẠT Tập 7, Số 2, 2017 217–230 217 PHÂN LOẠI TÊN THỂ LOẠI Ở WIKIPEDIA TIẾNG VIỆT Tạ Hoàng Thắnga* a Khoa Công nghệ Thông tin, Trường Đại học Đà Lạt, Lâm Đồng, Việt Nam Lịch sử bài báo Nhận ngày 09 tháng 01 năm 2017 | Chỉnh sửa ngày 17 tháng 04 năm 2017 Chấp nhận đăng ngày 17 tháng 05 năm 2017 Tóm tắt Wikipedia nổi tiếng là một bách khoa toàn thư mở lớn nhất hiện nay với mục đích phổ cập kiến thức cho tất cả mọi người trên thế giới. Với việc áp dụng robot trong khâu tạo bài tự động, dự án tiếng Việt là một trong 13 dự án ngôn ngữ có hơn một triệu bài viết. Tuy nhiên, điều đó tạo cho Wikipedia tiếng Việt nhiều thách thức trong việc nâng cao chất lượng bài, sắp xếp thể loại, chống phá hoại nội dung và nhiều công tác khác. Trong bài báo này, chúng tôi phân loại thể loại ở Wikipedia tiếng Việt, chi tiết hơn là cấu trúc và các quy ước đặt tên thể loại. Phương pháp chính là áp dụng các tiêu chuẩn và cấu trúc thể loại sẵn có ở tiếng Anh, một dự án Wikipedia lớn nhất về mặt thông tin đóng góp, từ đó áp dụng cho phiên bản tiếng Việt. Tuy nhiên, điều đó không thực hiện dễ dàng, do đó chúng tôi phải kết hợp nhiều phương pháp xã hội cũng như chuyên môn để đạt được sự kỳ vọng. Việc phân tích tên thể loại và dữ liệu từ Wikidata được chúng tôi áp dụng là một tiền đề xây dựng một công cụ chuyển dịch tên thể loại từ tiếng Anh sang tiếng Việt. Từ khóa: Phân loại thể loại; Quy ước đặt tên; Thể loại Wikipedia. 1. GIỚI THIỆU Cây thể loại tại dự án Wikipedia tiếng Anh là đối tượng nghiên cứu của nhiều học giả trên thế giới với nhiều bài báo về tái cấu trúc thể loại, loại bỏ thể loại dư thừa và phân tích cấu trúc thể loại, rút trích các quan hệ ngữ nghĩa trên thể loại Việc quản lý cấu trúc thể loại khó thực hiện một cách hiệu quả ở các dự án ngôn ngữ Wikipedia nhỏ và trung bình vì vấn đề hạn chế về mặt nhân lực. Do đó, nhu cầu quản lý thể loại tại các dự án cũng hết sức cần thiết. Trước hết, chúng tôi phân tích tên thể loại tiếng Anh và tiếng Việt thành