TAILIEUCHUNG - Báo cáo nghiên cứu khoa học " MỘT SỐ CẢI TIẾN GIẢI THUẬT EARLEY CHO VIỆC PHÂN TÍCH CÚ PHÁP TRONG XỬ LÝ NGÔN NGỮ TỰ NHIÊN "

Giải thuật Earley [1, 2] là một trong số những giải thuật được sử dụng để phân tích cú pháp trong xử lý ngôn ngữ tự nhiên. Nó là một giải thuật tổng quát, có thể phân tích bất kỳ văn phạm phi ngữ cảnh nào. Nhưng giải thuật này vẫn còn nhiều hạn chế cần khắc phục. Đầu tiên, Kilbury [3] đã nhận xét rằng giải thuật Earley là không hiệu quả trong xử lý ngôn ngữ tự nhiên. Vì nó phải duyệt qua quá nhiều luật sinh không cần thiết (trong bài này chúng tôi sẽ gọi. | MỘT SỐ CẢI TIẾN GIẢI THUẬT EARLEY CHO VIỆC PHÂN TÍCH CÚ PHÁP TRONG XỬ LÝ NGÔN NGỮ TỰ NHIÊN Nguyễn Gia Định Trần Thanh Lương Lê Viết Mần Trường Đại học Khoa học Đại học Huế 1. Mở đầu. Giải thuật Earley 1 2 là một trong số những giải thuật được sử dụng để phân tích cú pháp trong xử lý ngôn ngữ tự nhiên. Nó là một giải thuật tổng quát có thể phân tích bất kỳ văn phạm phi ngữ cảnh nào. Nhưng giải thuật này vẫn còn nhiều hạn chế cần khắc phục. Đầu tiên Kilbury 3 đã nhận xét rằng giải thuật Earley là không hiệu quả trong xử lý ngôn ngữ tự nhiên. Vì nó phải duyệt qua quá nhiều luật sinh không cần thiết trong bài này chúng tôi sẽ gọi là luật dư thừa trong giai đoạn đoán nhận predict . Đối với các văn phạm lớn điều này sẽ làm giảm đáng kể tiến độ xử lý. Mặt khác giải thuật Earley trong xử lý ngôn ngữ tự nhiên còn gặp phải hiện tượng bùng nổ tổ hợp bởi vì muốn phân tích một câu của ngôn ngữ tự nhiên thì bộ phân tích phải kiểm tra từ vài chuỗi đến hàng chục hàng trăm chuỗi từ loại khác nhau. Tác giả Phan Thị Tươi đã nêu lên vấn đề trên trong 6 và đồng thời cũng nêu lên hướng giải quyết cho các giải thuật Earley và Chart. Nhưng cải tiến 43 cho giải thuật Earley trong 6 chỉ hiệu quả trong trường hợp câu nhập vào là đúng. Còn nếu câu nhập vào là sai thì giải thuật không hiệu quả. Với những điều như trên trong bài này chúng tôi sẽ trình bày giải thuật Earley cải tiến nhằm loại bỏ hoàn toàn việc phải duyệt qua các luật sinh dư thừa. Đồng thời chúng tôi sẽ bàn tới hướng giải quyết hiện tượng bùng nổ tổ hợp dựa trên cải tiến trong 6 . Bài báo sẽ được tổ chức như sau Phần 2 - Chúng tôi sẽ trình bày giải thuật Earley. Phần này còn bao gồm những nhận xét và một ví dụ cho giải thuật Earley. Phần 3 - Chúng tôi sẽ nói đến những luật dư thừa mà giải thuật Earley phải duyệt qua và giải thuật Earley cải tiến. Đồng thời chúng tôi đưa ra một đề nghị về dạng luật sinh để hỗ trợ tăng tốc độ tiến trình xử lý. Phần 4 - Chúng tôi sẽ bàn về hiện tượng bùng nổ tổ hợp phương pháp giải quyết trong 6 và

TÀI LIỆU LIÊN QUAN
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.