Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Tối ưu hóa Join đệ quy trên tập dữ liệu lớn trong môi trường Spark
TAILIEUCHUNG - Tối ưu hóa Join đệ quy trên tập dữ liệu lớn trong môi trường Spark
Bài viết nghiên cứu nhằm đề xuất một số giải pháp hiệu quả cho xử lý Join đệ quy trên nền tảng xử lý dữ liệu lớn thế hệ mới Spark. Đề xuất của chúng tôi đã loại bỏ một lượng lớn dữ liệu dư thừa được tạo ra trong các xử lý lặp của Join đệ quy, tận dụng những lợi thế của việc xử lý trong bộ nhớ và cơ chế bộ nhớ đệm để giảm thiểu các chi phí có liên quan. Thông qua mô hình chi phí và các thực nghiệm, nghiên cứu này chỉ ra rằng các giải pháp của chúng tôi đã cải tiến đáng kể hiệu suất thực thi của Join đệ quy trong môi trường MapReduce. | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI TỐI ƯU HÓA JOIN ĐỆ QUY TRÊN TẬP DỮ LIỆU LỚN TRONG MÔI TRƯỜNG SPARK Phan Thượng Cang1 Trần Thị Tố Quyên1 Phan Anh Cang2 1 Khoa Công nghệ thông tin và Truyền thông Đại học Cần Thơ 2 Khoa Công nghệ thông tin Trường Đại học Sư phạm Kỹ thuật Vĩnh Long ptcang@ tranthitoquyen@ cangpa@ TÓM TẮT MapReduce đã trở thành một mô hình lập trình chính cho phân tích và xử lý dữ liệu lớn trong những năm gần đây. Tuy nhiên mô hình này vẫn còn tồn tại một số mặt hạn chế như chưa hỗ trợ đầy đủ cho các tính toán lặp cơ chế bộ nhớ đệm cache và các hoạt động với đa đầu vào multiple inputs . Ngoài ra các chi phí cho việc đọc viết và truyền thông dữ liệu của mô hình còn quá tốn kém. Một trong những hoạt động phức tạp đáng chú ý và thường được sử dụng trong MapReduce đó là Join đệ quy. Nó đòi hỏi những đặc trưng xử lý mà cũng chính là những hạn chế của MapReduce. Vì vậy trong nghiên cứu này chúng tôi đề xuất một số giải pháp hiệu quả cho xử lý Join đệ quy trên nền tảng xử lý dữ liệu lớn thế hệ mới Spark. Đề xuất của chúng tôi đã loại bỏ một lượng lớn dữ liệu dư thừa được tạo ra trong các xử lý lặp của Join đệ quy tận dụng những lợi thế của việc xử lý trong bộ nhớ và cơ chế bộ nhớ đệm để giảm thiểu các chi phí có liên quan. Thông qua mô hình chi phí và các thực nghiệm nghiên cứu này chỉ ra rằng các giải pháp của chúng tôi đã cải tiến đáng kể hiệu suất thực thi của Join đệ quy trong môi trường MapReduce. Từ khóa Big data analytics recusrsive join map reduce spark. I. GIỚI THIỆU Trong thời đại bùng nổ thông tin như hiện nay thuật ngữ Big Data dần trở nên quen thuộc và đặt ra nhiều thách thức trong các nghiên cứu như công nghệ tìm kiếm search-engines phân tích mạng xã hội social network analysis phân tích dữ liệu Web Web-data analysis phân tích giám sát mạng network-monitoring analysis các mô phỏng lớn .
Hoàng Khải
114
14
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Tối ưu hóa câu hỏi - Vũ Tuyết Trinh
11
116
2
Tối ưu hóa phần 1
19
112
4
Tối ưu hóa phần 2
19
117
3
Tối ưu hóa phần 3
19
98
2
Tối ưu hóa phần 4
19
93
2
Tối ưu hóa phần 5
19
92
3
Tối ưu hóa phần 6
19
94
2
Tối ưu hóa phần 7
19
94
2
Tối ưu hóa phần 8
19
91
3
Tối ưu hóa phần 9
19
114
2
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462352
61
Giới thiệu :Lập trình mã nguồn mở
14
26787
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11377
543
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10572
468
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9856
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8910
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8523
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8109
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7976
1825
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7297
268
TỪ KHÓA LIÊN QUAN
Cơ sở dữ liệu
Tối ưu hóa Join đệ quy
Tập dữ liệu lớn
Môi trường Spark
Xử lý trong bộ nhớ trong
Xử lý dữ liệu lớn thế hệ mới Spark
TÀI LIỆU MỚI ĐĂNG
Giáo án mầm non chương trình đổi mới: Gia đình vui nhộn
4
396
3
11-01-2025
Đóng mới oto 8 chỗ ngồi part 9
10
187
3
11-01-2025
Báo cáo nghiên cứu khoa học " HÃY LÀM CHO HUẾ XANH HƠN VÀ ĐẸP HƠN "
6
188
3
11-01-2025
Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính
57
246
8
11-01-2025
báo cáo hóa học:" Perceptions of rewards among volunteer caregivers of people living with AIDS working in faith-based organizations in South Africa: a qualitative study"
10
165
1
11-01-2025
Chủ đề 3 : SỰ CÂN BẰNG CỦA VẬT RẮN (4 tiết)
9
218
1
11-01-2025
CUỘC KHÁNG CHIẾN CHỐNG THỰC DÂN PHÁP KẾT THÚC (1953 - 1954)_5
11
154
1
11-01-2025
The Ombudsman Enterprise and Administrative Justice
309
152
0
11-01-2025
OPEN SOURCE ERP REASONABLE TOOLS FOR MANUFACTURING SMEs?
1
156
1
11-01-2025
Lập trình Java cơ bản : Luồng và xử lý file part 8
5
143
1
11-01-2025
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8109
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7976
1825
Ebook Chào con ba mẹ đã sẵn sàng
112
4440
1376
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6379
1279
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8910
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3861
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3930
610
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4783
567
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11377
543
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4537
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.