Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Học máy thân thiện với thương mại, có khả năng mở rộng để xây dựng các ứng dụng thông minh Grant Ingersoll, Kỹ sư phần mềm cao cấp, Center for Natural Language Processing at Syracuse University Tóm tắt: Một khi lĩnh vực độc quyền của các viện nghiên cứu và các tổng công ty có ngân sách nghiên cứu lớn là các ứng dụng thông minh học được từ các dữ liệu và đầu vào của người dùng đang trở nên phổ biến hơn. Nhu cầu về các kỹ thuật học máy như phân cụm, lọc cộng tác và phân. | Giới thiệu về Apache Mahout Học máy thân thiện với thương mại có khả năng mở rộng để xây dựng các ứng dụng thông minh Grant Ingersoll Kỹ sư phần mềm cao cấp Center for Natural Language Processing at Syracuse University Tóm tắt Một khi lĩnh vực độc quyền của các viện nghiên cứu và các tổng công ty có ngân sách nghiên cứu lớn là các ứng dụng thông minh học được từ các dữ liệu và đầu vào của người dùng đang trở nên phổ biến hơn. Nhu cầu về các kỹ thuật học máy như phân cụm lọc cộng tác và phân loại chưa bao giờ lớn hơn bây giờ do nó cho phép thấy được sự tương đồng giữa các nhóm đông người hoặc tự động thêm vào khối lượng lớn nội dung Web. Dự án Apache Mahout làm cho việc xây dựng các ứng dụng thông minh dễ dàng hơn và nhanh hơn. Người đồng sáng lập Mahout Grant Ingersoll giới thiệu các khái niệm cơ bản về học máy rồi trình diễn cách sử dụng Mahout để phân cụm các tài liệu bình luận và tổ chức nội dung. Dần dần sự thành công của các công ty và những cá nhân trong thời đại thông tin phụ thuộc vào cách họ chuyển số lượng lớn dữ liệu sang thông tin hành động một cách nhanh và hiệu quả như thế nào. Cho dù đó là để xử lý hàng trăm hoặc hàng ngàn thư điện tử e-mail cá nhân một ngày hoặc đoán biết ý định của người dùng từ hàng triệu tỷ byte petabyte của các weblog sự cần thiết có các công cụ có thể tổ chức và tăng cường dữ liệu chưa bao giờ lại lớn đến như vậy. Điểm then chốt của giả thuyết và triển vọng của lĩnh vực học máy và dự án mà bài viết này giới thiệu là Apache Mahout xem Tài nguyên . Học máy là một lĩnh vực của trí tuệ nhân tạo đề cập các kỹ thuật cho phép các máy tính cải thiện kết quả đầu ra của chúng dựa trên kinh nghiệm có trước. Lĩnh vực này liên quan chặt chẽ đến việc khai thác dữ liệu và thường sử dụng các kỹ thuật từ thống kê lý thuyết xác suất nhận dạng và một loạt các lĩnh vực khác. Mặc dù học máy không phải là một lĩnh vực mới nó phát triển chắc chắn. Nhiều công ty lớn gồm cả IBM Google Amazon Yahoo và Facebook đã triển khai thực hiện các thuật toán học