TAILIEUCHUNG - Báo cáo hóa học: " Research Article Acoustic Event Detection Based on Feature-Level Fusion of Audio and Video Modalities"

Tuyển tập báo cáo các nghiên cứu khoa học quốc tế ngành hóa học dành cho các bạn yêu hóa học tham khảo đề tài: Research Article Acoustic Event Detection Based on Feature-Level Fusion of Audio and Video Modalities | Hindawi Publishing Corporation EURASIP Journal on Advances in Signal Processing Volume 2011 Article ID 485738 11 pages doi 2011 485738 Research Article Acoustic Event Detection Based on Feature-Level Fusion of Audio and Video Modalities Taras Butko Cristian Canton-Ferrer Carlos Segura Xavier Giro Climent Nadeu Javier Hernando and Josep R. Casas Department of Signal Theory and Communications TALP Research Center Technical University of Catalonia Campus Nord Ed. D5 Jordi Girona 1-3 08034 Barcelona Spain Correspondence should be addressed to Taras Butko Received 20 May 2010 Revised 30 November 2010 Accepted 14 January 2011 Academic Editor Sangjin Hong Copyright 2011 Taras Butko et al. This is an open access article distributed under the Creative Commons Attribution License which permits unrestricted use distribution and reproduction in any medium provided the original work is properly cited. Acoustic event detection AED aims at determining the identity of sounds and their temporal position in audio signals. When applied to spontaneously generated acoustic events AED based only on audio information shows a large amount of errors which are mostly due to temporal overlaps. Actually temporal overlaps accounted for more than 70 of errors in the real-world interactive seminar recordings used in CLEAR 2007 evaluations. In this paper we improve the recognition rate of acoustic events using information from both audio and video modalities. First the acoustic data are processed to obtain both a set of spectrotemporal features and the 3D localization coordinates of the sound source. Second a number of features are extracted from video recordings by means of object detection motion analysis and multicamera person tracking to represent the visual counterpart of several acoustic events. A feature-level fusion strategy is used and a parallel structure of binary HMM-based detectors is employed in our work. The experimental results show that information .

TÀI LIỆU LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.