TAILIEUCHUNG - Lược sử quá trình hình thành và phát triển của Ngôn ngữ học khối liệu

Xuất phát điểm của sự hình thành và ra đời Ngôn ngữ học khối liệu có thể tính vào thời điểm đầu những năm 60 thế kỉ XX, khi xuất hiện khối liệu văn bản ngôn ngữ đầu tiên tại Mĩ và bắt đầu phát triển trong vòng hai thập kỉ trở lại đây. Năm 1963, lần đầu tiên khối liệu văn bản điện tử - khối liệu Brown được xây dựng tại trường đại học Brown (Mĩ) do các tác giả là W. Francis và H. Kucera thiết kế và xây dựng bao gồm 1 triệu đơn vị từ. | Lược sử quá trình hình thành và phát triển của Ngôn ngữ học khối liệu Xuất phát điểm của sự hình thành và ra đời Ngôn ngữ học khối liệu có thể tính vào thời điểm đầu những năm 60 thế kỉ XX khi xuất hiện khối liệu văn bản ngôn ngữ đầu tiên tại Mĩ và bắt đầu phát triển trong vòng hai thập kỉ trở lại đây. Năm 1963 lần đầu tiên khối liệu văn bản điện tử - khối liệu Brown được xây dựng tại trường đại học Brown Mĩ do các tác giả là W. Francis và H. Kucera thiết kế và xây dựng bao gồm 1 triệu đơn vị từ và cụm từ Anh - Mĩ từ các văn bản in ấn được lựa chọn vào năm 1961. Sự xuất hiện của khối liệu Brown đã gây sự quan tâm lớn không những đối với các nhà ngôn ngữ học trước hết về các nguyên tắc lựa chọn văn bản và các nhiệm vụ được giải quyết trong khối liệu. Tiếp theo khối liệu Brown là sự ra đời của hàng loạt các khối liệu. Các nghiên cứu cho thấy rằng Ngôn ngữ học khối liệu được hình thành như một ngành khoa học độc lập về ngôn ngữ văn bản là vào những năm 90 thế kỉ XX. Ngôn ngữ học khối liệu vẫn có các mối quan hệ mật thiết với Ngôn ngữ học máy tính qua việc sử dụng các thành tựu của Ngôn ngữ học máy tính và ngược lại gây ảnh hưởng tích cực lên Ngôn ngữ học máy tính trong quá trình phát triển. Trong thập kỉ vừa qua tại nhiều quốc gia đã và đang tiến hành việc xây dựng các khối liệu trên cơ sở bản ngữ. Trong đó mạnh mẽ hơn cả là công trình xây dựng khối liệu tiếng Anh xuất hiện lần đầu tiên vào những năm 60 thế kỉ XX điển hình sau khối liệu Brown University là khối liệu Lancaster Oslo-Bergen LOB . Mỗi khối liệu chứa khoảng 1 triệu đơn vị từ và cụm từ sử dụng với sơ đồ hình thái học. Ngoài ra khối liệu Lancaster Oslo-Bergen còn chứa 2 khối liệu con là Leeds-Lancaster Treebank và Lancaster Parsed với sơ đồ cú pháp học. Khối liệu Anh Quốc BNC chứa đến 100 triệu đơn vị từ và cụm từ sử dụng cũng được coi là một trong số các khối liệu lớn nhất hiện nay. Khối liệu này được xây dựng vào những năm 90 thế kỉ XX trên cơ sở sơ đồ hình thái học bao gồm khoảng 90 đơn vị từ và cụm từ sử

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.