Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Unsupervised Discovery of Persian Morphemes"
TAILIEUCHUNG - Báo cáo khoa học: "Unsupervised Discovery of Persian Morphemes"
On the other hand, the construction of a comprehensive morphological analyzer for a language based on linguistic theory requires a considerable amount of work by experts. This is both slow and expensive and therefore not applicable to all languages. Consequently, it is important to develop methods that are able to discover and induce morphology for a language based on unsupervised analysis of large amounts of data. | Unsupervised Discovery of Persian Morphemes Mohsen Arabsorkhi Computer Science and Engineering Dept. Shiraz University Shiraz Iran marabsorkhi@ Mehrnoush Shamsfard Electrical and Computer Engineering Dept. Shahid Beheshti University Tehran Iran m-shams@ Abstract This paper reports the present results of a research on unsupervised Persian morpheme discovery. In this paper we present a method for discovering the morphemes of Persian language through automatic analysis of corpora. We utilized a Minimum Description Length MDL based algorithm with some improvements and applied it to Persian corpus. Our improvements include enhancing the cost function using some heuristics preventing the split of high frequency chunks exploiting penalty for first and last letters and distinguishing pre-parts and post-parts. Our improved approach has raised the precision recall and f-measure of discovery by respectively 32 17 and 23. 1 Introduction According to linguistic theory morphemes are considered to be the smallest meaning-bearing elements of a language. However no adequate language-independent definition of the word as a unit has been agreed upon. If effective methods can be devised for the unsupervised discovery of morphemes they could aid the formulation of a linguistic theory of morphology for a new language. The utilization of morphemes as basic representational units in a statistical language model instead of words seems a promising course Creutz 2004 . Many natural language processing tasks including parsing semantic modeling information retrieval and machine translation frequently require a morphological analysis of the language at hand. The task of a morphological analyzer is to identify the lexeme citation form or inflection class of surface word forms in a language. It seems that even approximate automated morphological analysis would be beneficial for many NL applications dealing with large vocabularies . text retrieval applications . On the
Phương Triều
71
4
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Unsupervised Relation Discovery with Sense Disambiguation"
9
43
0
Báo cáo khoa học: "Improved Unsupervised POS Induction through Prototype Discovery"
10
58
0
Báo cáo khoa học: "Unsupervised Discovery of Domain-Specific Knowledge from Text"
10
56
0
Báo cáo khoa học: "Unsupervised Discovery of Rhyme Schemes"
6
65
0
Báo cáo khoa học: "Unsupervised Discovery of Generic Relationships Using Pattern Clusters and its Evaluation by Automatically Generated SAT Analogy Questions"
9
44
0
Báo cáo khoa học: "Efficient Unsupervised Discovery of Word Categories Using Symmetric Patterns and High Frequency Words"
8
45
0
Báo cáo khoa học: "Fully Unsupervised Discovery of Concept-Specific Relationships by Web Mining"
8
51
0
Báo cáo khoa học: "Unsupervised Discovery of Persian Morphemes"
4
54
0
Principal component analysis-based unsupervised feature extraction applied to in silico drug discovery for posttraumatic stress disorder-mediated heart disease
26
31
1
A scalable assembly-free variable selection algorithm for biomarker discovery from metagenomes
12
30
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462341
61
Giới thiệu :Lập trình mã nguồn mở
14
26053
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11346
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10551
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9842
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8891
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8505
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8101
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7748
1790
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7264
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Unsupervised Discovery
Persian Morphemes
Mohsen Arabsorkhi
scientific reports
model language
process natural language
Unsupervised Relation Discovery
Sense Disambiguation
Limin Yao
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Improved Unsupervised POS Induction
Prototype Discovery
Omri Abend
Domain Specific Knowledge from Text
Dirk Hovy
Chunliang Zhang
Rhyme Schemes
Sravana Reddy
Generic Relationships
Pattern Clusters and its Evaluation by Automatically Generated SAT Analogy Questions
xử lý ngôn ngữ tự nhiên
Efficient Unsupervised Discovery of Word Categories
Symmetric Patterns
High Frequency Words
mô hình ngôn ngữ
Fully Unsupervised Discovery
Concept Specific Relationships
Web Mining
BMC Bioinformatics
Unsupervised feature extraction
Principal component analysis
Variational Bayes
Posttraumatic stress disorder
Heart disease
In silico drug discovery
Unsupervised learning
Environmental genomics
Sequence clustering
Downstream analyses
Genome Biology
Single cell DNA sequencing
Single cell variant calling
Somatic variation
Accurate variant calling
TÀI LIỆU MỚI ĐĂNG
Data Structures and Algorithms - Chapter 8: Heaps
41
188
5
27-12-2024
Giáo trình phân tích phương trình vi phân viết dưới dạng thuật toán đặc tính của hệ thống p1
5
162
1
27-12-2024
Báo cáo nghiên cứu nông nghiệp " Biofertiliser inoculant technology for the growth of rice in Vietnam: Developing technical infrastructure for quality assurance and village production for farmers "
12
146
2
27-12-2024
Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp
5
168
2
27-12-2024
Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán
24
1073
2
27-12-2024
ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards
7
147
1
27-12-2024
Word Games with English 1
65
138
1
27-12-2024
Báo cáo lâm nghiệp: "Assessment of the effects of below-zero temperatures on photosynthesis and chlorophyll a fluorescence in leaf discs of Eucalyptus globulu"
4
140
0
27-12-2024
Determini prounoun 1
6
139
0
27-12-2024
Phạm trù Chủ nghĩa cá nhân của tư tưởng phương Tây trong sự lý giải của Phan Khôi _1
9
131
0
27-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8101
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7748
1790
Ebook Chào con ba mẹ đã sẵn sàng
112
4407
1371
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6284
1266
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8891
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3840
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3920
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4709
565
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11346
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4509
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.