TAILIEUCHUNG - Độ đo Google trong tích hợp dữ liệu
Bài viết Độ đo Google trong tích hợp dữ liệu giới thiệu về một trong các độ đo như vậy, độ đo google. Bài viết giới thiệu và bàn luận đầy đủ và chi tiết về cơ sở lý thuyết, các tính chất và một số ứng dụng của độ đo Google. | Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 ĐỘ ĐO GOOGLE TRONG TÍCH HỢP DỮ LIỆU Vũ Vũ Ngọc Trình1, Hà Quang Thụy2, Trần Trọng Hiếu2,3, 1 Viện Dầu khí Việt Nam 2 Trường Đại học Công nghệ, ĐHQG Hà Nội 3 Trường Đại học Khoa học Tự nhiên, ĐHQG Hà Nội trinhvn@, thuyhq@, hieutt@ TÓM TẮT - Lý thuyết về độ đo đang là một trong những vấn đề được bàn đến nhiều trong các công trình nghiên cứu trong lĩnh vực khoa học máy tính bởi tính ứng dụng sâu rộng của nó từ thu hồi dữ liệu, khai phá dữ liệu đến tích hợp tri thức, nhận dạng và học máy. Việc tìm kiếm các độ đo phản ánh được sự khác biệt một cách tinh tế của các khái niệm, thuật ngữ và thực thể trong một ngữ cảnh nào đó là hết sức cần thiết và có tính ứng dụng thực tiễn cao. Trong bài báo này chúng tôi giới thiệu về một trong các độ đo như vậy, độ đo Google. Bài báo giới thiệu và bàn luận đầy đủ và chi tiết về cơ sở lý thuyết, các tính chất và một số ứng dụng của độ đo Google. Từ khóa - Độ đo Google, tích hợp dữ liệu/tri thức. I. GIỚI THIỆU Khi chữ viết được phát minh, con người có một công cụ tốt để mô tả các đối tượng bằng cách biểu diễn các đối tượng bằng một chuỗi các ký tự. Tuy nhiên do sự linh hoạt của ngôn ngữ nên cùng một đối tượng có thể được biểu diễn bằng nhiều chuỗi ký tự khác nhau và ngược lại một chuỗi ký tự cũng có thể biểu diễn nhiều đối đượng khác nhau. Do đó việc xem xét các đối tượng từ các chuỗi ký tự cần được xem xét trong ngữ cảnh cụ thể. Một bài toán (ngược) được đặt ra là nếu chúng ta có hai chuỗi ký tự, tìm ngữ cảnh mà hai chuỗi ký tự này biểu diễn các đối tượng có quan hệ gần nhau nhất. Bài toán này có nhiều ứng dụng trong xử lý ngôn ngữ tự nhiên, phân cụm dữ liệu, học máy, Trong bài này chúng ta sẽ xem xét một trong các cách để trả lời cho câu hỏi này. Hằng ngày có hơn một tỷ lượt người dùng Internet với hàng tỷ comment trên các mạng xã hội, tweeter và hàng triệu các tài liệu được xuất .
đang nạp các trang xem trước