TAILIEUCHUNG - Tìm kiếm âm nhạc theo nội dung sử dụng đặc trưng đường bao phổ và phương pháp phân cụm K-MEANS
Trong các cơ sở dữ liệu đa phương tiện lớn vấn đề tìm kiếm âm nhạc theo nội dung rất quan trọng. Tìm kiếm âm nhạc trong các cơ sở dữ liệu hiện tại thường dựa trên cơ sở tìm kiếm chỉ mục. Tuy nhiên, việc tìm kiếm âm nhạc theo chỉ mục có nhiều nhược điểm. Nhiều khi người dùng có thể không nhớ được các từ khóa text của bài hát như tên bài hát, tác giả, ca sĩ hoặc lời bài hát. Tìm kiếm âm nhạc theo nội dung khắc phục được những nhược điểm này. | TÌM KIẾM ÂM NHẠC THEO NỘI DUNG SỬ DỤNG ĐẶC TRƢNG ĐƢỜNG BAO PHỔ VÀ PHƢƠNG PHÁP PHÂN CỤM K-MEANS Phùng Thị Thu Hiền1, Vũ Tất Thắng2, Thái Quang Vinh2, Nguyễn Văn Huy1 1 Trường Đại học Kỹ thuật Công nghiệp – ĐH Thái Nguyên, 2 Viện Công nghệ thông tin - Viện KHCN Việt nam TÓM TẮT Trong các cơ sở dữ liệu đa phương tiện lớn vấn đề tìm kiếm âm nhạc theo nội dung rất quan trọng. Tìm kiếm âm nhạc trong các cơ sở dữ liệu hiện tại thường dựa trên cơ sở tìm kiếm chỉ mục. Tuy nhiên, việc tìm kiếm âm nhạc theo chỉ mục có nhiều nhược điểm. Nhiều khi người dùng có thể không nhớ được các từ khóa text của bài hát như tên bài hát, tác giả, ca sĩ hoặc lời bài hát. Tìm kiếm âm nhạc theo nội dung khắc phục được những nhược điểm này. Trong cách tiếp cận truyền thống, các vector đặc trưng của tín hiệu âm thanh được xây dựng từ các đặc trưng vật lý của âm thanh như độ to, độ cao, năng lượng, phổ tần số, Gần đây, một số nghiên cứu trên thế giới tập trung vào một cách tiếp cận khác, trong đó áp dụng các kiến thức về xử lý tín hiệu âm thanh, về phân tích mô hình tạo âm thanh, mô hình cảm thụ âm thanh của con người có thể giúp việc tính toán vector đặc trưng âm thanh được chính xác và hạn chế tối đa thông tin dư thừa. Bài báo này trình bày phương pháp tìm kiếm âm nhạc theo nội dung dùng đặc trưng đường bao phổ Mel Cepstral, được xây dựng dựa trên mô hình cảm thụ âm thanh của con ngườ, và thuật toán phân cụm K-means. Từ khóa: Vector đặc trưng, Mel Cepstral, K-mean, MFCC. ĐẶT VẤN ĐỀ Tìm kiếm âm nhạc theo nội dung là một lĩnh vực nghiên cứu mới và được nhiều nhà nghiên cứu quan tâm. Hiện có một số phương thức đã được áp dụng tìm kiếm âm nhạc theo nội dung. Theo Bel Logan [3] cấu trúc âm thanh của âm nhạc là quan trọng. Vì vậy cần phải có một hệ thống nhận biết độ tương tự âm thanh theo cách gần giống như hệ thống nghe của con người, và hệ thống thính giác của con người dễ dàng thu và nhận dạng các nhóm âm thanh hơn là từng nốt nhạc hay âm riêng lẻ. David Pye [7] áp dụng phương pháp nhận .
đang nạp các trang xem trước