TAILIEUCHUNG - Cải tiến một số giải thuật phân tích cú pháp trong xử lý ngôn ngữ tự nhiên.

Cải tiến một số giải thuật phân tích cú pháp trong xử lý ngôn ngữ tự nhiên. Nó gần giống nhưng không đồng nhất với khái niệm entropi nhiệt động của một hệ vật lý để đo khoảng cách tới trạng thái cân bằng (equilibrium) Định luật 2 của nhiệt động học được Shanon phát biểu mở rộng thành định luật 10 của Shannon trong ngữ cảnh phi nhiệt động như sinh học, sinh thái học, kinh tế học, xã hội học và kinh tế học | Tạp chí Tin học và Đĩêu khiền học T. 18 s. 3 2002 279-284 CÁI TIẾN MỘT SỐ GIẢI THUẬT PHÂN TÍCH cú PHÁP TRONG XỬ LÝ NGÔN NGỮ Tự NHIÊN PHAN THỊ TƯƠI Abstract. Earley and Chart algorithms are often used to parse natural language. However these algorithms are limited when they are used to work with large grammar. This paper presents some improvements for Earley and top-down chart algorithms in natural language processing. Tóm tắt. Để phân tích cú pháp cho ngôn ngũ tự nhiên nguời ta thuờng dùng các giải thuật nhu Earley và biểu đồ. Tuy nhiên khi xủ lý các văn phạm lớn thì các giải thuật nêu trên đều bị hạn chế. Bài báo này sẽ trình bày một số cải thiện cho giải thuật Earley và biểu đồ từ trên xuống trong xủ lý ngôn ngũ tự nhiên. 1. MỞ ĐẦU Vai trò của phân tích cú pháp trong xử lý ngôn ngữ tự nhiên là vô cùng quan trọng. Tuy nhiên không phải tất cả các giải thuật phân tích cú pháp cho ngôn ngữ lập trình đều có thể áp dụng cho ngôn ngữ tự nhiên bởi vì văn phạm của ngôn ngữ tự nhiên là không tường minh. Ngay cả khi ta dùng các giải thuật như Tomita 10 Earley 1 và Chart 3 là những giải thuật phân tích cú pháp cho văn phạm không tường minh thì cũng gặp nhiều khó khăn khi áp dụng chúng cho xử lý ngôn ngữ tự nhiên bởi vì muốn phân tích một chuỗi nhập vào là câu hoặc đoạn câu của ngôn ngữ tự nhiên thì bộ phân tích buộc phải kiểm tra từ vài chuỗi đến hàng chục hàng trăm chuỗi từ loại khác nhau từ loại được hiểu như các token trong ngôn ngữ lập trình điều đó sẽ dẫn đến sự bùng nổ tổ hợp. Trong bài báo này chúnh tôi trình bày việc cải thiện giải thuật Earley và giải thuật biểu đồ từ trên xuống top down chart parsing cho phân tích cú pháp của ngôn ngữ tự nhiên. 2. MỘT SỐ GIẢI THUẬT EARLEY VÀ LR Jfe CẢl TIEN Giải thuật LR là giải thuật phân tích cú pháp từ dưới lên còn được gọi là giải thuật bảng. Giải thuật này chỉ dùng cho văn phạm phi ngữ cảnh tường minh Tomita đã cải tiến giải thuật này để giải quyết đụng độ bang việc mô phỏng việc thực thi song song của bộ phân tích LR dựa trên

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.