TAILIEUCHUNG - Xử lý dữ liệu không cân bằng trong bài toán dự đoán lỗi phần mềm

Bài viết nghiên cứu về mất cân bằng dữ liệu và sự cần thiết của việc lấy mẫu dữ liệu để xử lý dữ liệu không cân bằng. Nghiên cứu tiến hành thử nghiệm với ba kỹ thuật lấy mẫu dữ liệu để xử lý dữ liệu không cần bằng, gồm: Random Undersampling, Random Oversampling và SMOTE. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Nha Trang ngày 8-9 10 2020 DOI XỬ LÝ DỮ LIỆU KHÔNG CÂN BẰNG TRONG BÀI TOÁN DỰ ĐOÁN LỖI PHẦN MỀM Lê Song Toàn1 Nguyễn Thanh Bình2 Lê Thị Mỹ Hạnh3 Nguyễn Thanh Bình1 1 Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn Đại học Đà Nẵng 2 Trường Cao đẳng Cơ điện - Xây dựng và Nông Lâm Trung Bộ 3 Khoa Công nghệ thông tin Trường Đại học Bách khoa Đại học Đà Nẵng lstoan@ thanhbinh@ ltmhanh@ ntbinh@ TÓM TẮT Dự đoán lỗi phần mềm giúp dự đoán trước khả năng có lỗi của mã nguồn làm giảm thời gian kiểm thử tăng chất lượng của sản phẩm. Các đặc trưng mã nguồn là những thông tin quan trọng giúp việc dự đoán lỗi phần mềm chính xác. Tuy nhiên nhiều bộ dữ liệu về dự báo lỗi bị mất cân bằng tức là số lượng dữ liệu giữa các lớp có sự chênh lệch lớn. Trong bài báo này chúng tôi nghiên cứu về mất cân bằng dữ liệu và sự cần thiết của việc lấy mẫu dữ liệu để xử lý dữ liệu không cân bằng. Chúng tôi tiến hành thử nghiệm với ba kỹ thuật lấy mẫu dữ liệu để xử lý dữ liệu không cần bằng gồm Random Undersampling Random Oversampling và SMOTE. Các kỹ thuật được áp dụng vào ba tập dữ liệu về dự báo lỗi của NASA trong kho lưu trữ của Promise. Các kết quả thu được cho thấy tính hiệu quả của việc áp dụng các mô hình học máy kết hợp với các kỹ thuật lấy mẫu để nâng cao tính chính xác của mô hình dự đoán lỗi phần mềm. Từ khóa Fault prediction Undersampling Oversampling SMOTE. I. ĐẶT VẤN ĐỀ Lĩnh vực phần mềm hiện đang được áp dụng ngày càng rộng rãi và phổ biến trong hầu như tất cả các lĩnh vực của cuộc sống chúng được sử dụng để tự động hóa và vận hành hầu hết các quy trình nghiệp vụ mà chúng ta có hiện nay. Thách thức với công nghệ phần mềm hiện đại là các hệ thống phần mềm ngày càng trở nên phức tạp và tinh vi hơn. Vì vậy việc đảm bảo chất lượng phần mềm càng khó khăn hơn. Trong đó xác định lỗi cũng như dự báo lỗi phần

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.