TAILIEUCHUNG - Phát triển Java 2.0: Phân tích dữ liệu lớn bằng MapReduce của Hadoop

Khi Google tung ra tính năng tìm kiếm hình ảnh vào năm 2001, Google đã có 250 triệu hình ảnh được lập chỉ mục. Gần một thập kỷ sau đó, gã khổng lồ tìm kiếm này đã lập chỉ mục hơn 10 tỷ hình ảnh. Ba mươi lăm giờ nội dung được tải lên YouTube mỗi phút. Tính trung bình, Twitter được cho là xử lý 55 triệu mẫu tin ngắn mỗi ngày. Đầu năm nay, 600 triệu truy cập hàng ngày đã đăng nhập vào tính năng tìm kiếm của Twitter. Đó là những gì chúng tôi muốn đưa. | Phát triển Java Phân tích dữ liệu lớn bằng MapReduce của Hadoop Khi Google tung ra tính năng t ìm kiếm hình ảnh vào năm 2001 Google đã có 250 triệu hình ảnh được lập chỉ mục. Gần một thập kỷ sau đó gã khổng lồ tìm kiếm này đã lập chỉ mục hơn 10 tỷ hình ảnh. Ba mươi lăm giờ nội dung được tải lên YouTube mỗi phút. Tính trung bình Twitter được cho là xử lý 55 triệu mẫu tin ngắn mỗi ngày. Đầu năm nay 600 triệu truy cập hàng ngày đã đăng nhập vào tính năng tìm kiếm của Twitter. Đó là những gì chúng tôi muốn đưa ra khi nói về dữ liệu lớn. về loạt bài này Viễn cảnh phát triển Java đã thay đổi hoàn toàn kể từ khi công nghệ Java xuất hiện lần đầu tiên. Nhờ hoàn thiện các framework mở và các cơ sở hạ tầng triển khai cho thuê đáng tin cậy bây giờ chúng ta có thể tích hợp thử nghiệm chạy và bảo trì các ứng dụng Java một cách nhanh chóng và không tốn kém. Trong loạt bài này Andrew Glover khám phá một loạt các công nghệ và các công cụ làm cơ sở phát triển Java kiểu mới này thành hiện thực. Đã có lúc dữ liệu trên một quy mô lớn như vậy chỉ được sử dụng trong các tập đoàn lớn các trường đại học và chính phủ những nơi có khả năng mua siêu máy tính đắt tiền và thuê nhân viên để duy trì. Ngày nay với việc hạ thấp chi phí lưu trữ và sức mạnh xử lý trở nên thông dụng các công ty nhỏ hơn và một số cá nhân đã bắt đầu lưu trữ và khai phá dữ liệu tương tự như vậy thúc đẩy một làn sóng về đổi mới ứng dụng. Một trong những công nghệ tạo khả năng của cuộc cách mạng dữ liệu lớn là MapReduce một mô hình lập trình và công cụ được Google phát triển để xử lý các tập hợp dữ liệu phân tán quy mô lớn. Trong bài này tôi giới thiệu công cụ MapReduce nguồn mở của Apache đó là Hadoop mà một số người đã gọi là ứng dụng sát thủ của điện toán đám mây. Giới thiệu Hadoop Về cơ bản Hadoop framework khung công tác Hadoop của Apache là một cơ chế dùng để phân tích các tập dữ liệu rất lớn mà không cần đặt trong một kho dữ liệu. Hadoop trừu tượng hóa công cụ phân tích dữ liệu to lớn của MapReduce làm nó trở .

Ðăng Minh 74 12 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Phát triển với Java thời gian thực, Phần 2: Cải thiện chất lượng dịch vụ Sử dụng Java thời gian thực để giảm bớt độ đa dạng trong các ứng dụng Java

29 71 0

JiBX 1.2, Phần 2: Từ lược đồ XML thành mã Java Tạo mã Java tùy chỉnh, sạch hơn từ lược đồ XML

67 52 0

Sức mạnh của JSF 2, Phần 1: Hợp lý hóa việc phát triển ứng dụng Web

25 67 0

Máy ứng dụng của Google cho Java: Phần 2: Xây dựng ứng dụng sát thủ

40 70 0

Lập mô hình với Java: Một cuốn sách bài tập về UML, Phần 2 Logic điều kiện trong các sơ đồ tuần tự

9 56 0

Động lực học lập trình Java, Phần 2: Giới thiệu sự phản chiếu Sử dụng thông tin lớp trong thời gian chạy để khởi động việc lập trình của bạn

20 56 0

Sức mạnh của JSF 2, Phần 2: Tạo khuôn mẫu và các thành phần phức hợp

41 51 0

Phát triển Javascript - part 2

10 67 0

Kiến trúc tiến hóa và thiết kế nổi dần: Thiết kế hướng theo kiểm thử, phần 2 Bàn luận thêm về việc cho phép dùng kiểm thử để định hướng và cải thiện thiết kế của bạn

18 74 0

Sức mạnh của JSF 2, Phần 3: Xử lý sự kiện, JavaScript và Ajax

31 47 0

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461890 55

Giới thiệu :Lập trình mã nguồn mở

14 22748 61

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10915 531

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10094 447

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9543 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8310 1127

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8252 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7869 2221

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6716 253

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5833 1413

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Mass Transfer in Multiphase Systems and its Applications Part 19

40 258 1 03-05-2024

Trading Strategies Profit Making Techniques For Stock_8

23 177 1 03-05-2024

Bơm máy nén quạt trong công nghiệp part 8

20 199 2 03-05-2024

Posted prices versus bargaining in markets_7

23 158 0 03-05-2024

B2B Content Marketing: 2012 Benchmarks, Budgets & Trends

17 140 0 03-05-2024

Hướng dẫn sử dụng Quickoffice cho Ipad và Iphone

13 154 0 03-05-2024

Đóng mới oto 8 chỗ ngồi part 9

10 119 0 03-05-2024

Đề tài: Tìm hiểu một số yêu cầu đặt ra với một phòng thu âm, để đảm bảo chất lượng âm thanh trong sản phẩm đa phương tiện

8 162 1 03-05-2024

Diseases of the Liver and Biliary System - part 1

33 125 0 03-05-2024

Data Structures and Algorithms - Chapter 9: Hashing

54 116 0 03-05-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7869 2221

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5833 1413

Ebook Chào con ba mẹ đã sẵn sàng

112 3773 1234

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5339 1136

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8310 1127

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3522 645

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10915 531

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3698 525

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4080 517

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4140 480