TAILIEUCHUNG - So sánh hai phương pháp trích chọn đặc trưng âm thanh: đường bao phổ (MFCC) và cao độ Pitch trong việc tìm kiếm âm nhạc theo nội dung

Trong cách tiếp cận truyền thống, các vector đặc trưng của tín hiệu âm thanh được xây dựng từ các đặc trưng vật lý của âm thanh như độ to, độ cao, năng lượng, phổ tần số, Có rất nhiều phương pháp trích chọn đặc trưng âm thanh đã và đang được nghiên cứu để áp dụng vào bài toán tìm kiếm âm nhạc theo nội dung. Tuy nhiên hai phương pháp phổ biến nhất và được đánh giá cao là phương pháp sử dụng đường bao phổ (MFCC) và phương pháp sử dụng cao độ (F0). Bài báo này nghiên cứu về hai phương pháp này đồng thời so sánh đánh giá hiệu quả của từng phương pháp. | Phùng Thị Thu Hiền và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 112(12)/2: 33 - 38 SO SÁNH HAI PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG ÂM THANH: ĐƯỜNG BAO PHỔ (MFCC) VÀ CAO ĐỘ PITCH TRONG VIỆC TÌM KIẾM ÂM NHẠC THEO NỘI DUNG Phùng Thị Thu Hiền1*, Đoàn Xuân Ngọc2, Phùng Trung Nghĩa3 1 Trường Đại học Kỹ thuật Công nghiệp - ĐH Thái Nguyên 2 Cục thuế tỉnh Thái Nguyên 3 Trường Đại học CNTT&TT - ĐH Thái Nguyên TÓM TẮT Trong cách tiếp cận truyền thống, các vector đặc trưng của tín hiệu âm thanh được xây dựng từ các đặc trưng vật lý của âm thanh như độ to, độ cao, năng lượng, phổ tần số, Có rất nhiều phương pháp trích chọn đặc trưng âm thanh đã và đang được nghiên cứu để áp dụng vào bài toán tìm kiếm âm nhạc theo nội dung. Tuy nhiên hai phương pháp phổ biến nhất và được đánh giá cao là phương pháp sử dụng đường bao phổ (MFCC) và phương pháp sử dụng cao độ (F0). Bài báo này nghiên cứu về hai phương pháp này đồng thời so sánh đánh giá hiệu quả của từng phương pháp. Từ khóa: Vector đặc trưng, Mel Cepstral, K-means, F0, pitch, DTW. ĐẶT VẤN ĐỀ* Hiện nay, có rất nhiều nghiên cứu về vấn đề trích chọn đặc trưng âm thanh trong bài toán tìm kiếm âm nhạc theo nội dung. và [4] đã sử dụng kỹ thuật hiệu chỉnh cao độ (F0) để xác định giai điệu chính của đoạn nhạc. Trong nghiên cứu của mình, và đã so sánh tính toán độ tương tự của bài hát bằng kỹ thuật so khớp xâu. Trong khi đó, Mc Nab, Smith, Witten, Henderson và Cunningham [5] đã sử dụng phương thức tính toán giai điệu bằng cách ước lượng cao độ Pitch để so sánh giữa các bản phiên âm của mỗi bài hát. Tuy nhiên, theo một nghiên cứu của Beth Logan [3] thì cấu trúc âm thanh của âm nhạc là quan trọng. Vì vậy cần phải có một hệ thống nhận biết độ tương tự âm thanh theo cách gần giống như hệ thống nghe của con người, và hệ thống thính giác của con người dễ dàng thu và nhận dạng các nhóm âm thanh hơn là từng nốt nhạc hay âm riêng lẻ. Bài báo này trình bày phương pháp tìm kiếm âm nhạc theo nội dung sử dụng theo

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.