TAILIEUCHUNG - Thuật toán học phân tán cho hệ đa tác tử

Báo cáo trình bày một thuật toán học tăng cường cho hệ thống bao gồm nhiều tác tử cộng tác với nhau trong đó quá trình học được tiến hành song song và phân tán trên tất cả tác tử. Thuật toán học được xây dựng trên cơ sở cải tiến thuật học Q (Q-learning) với bảng Q được phân tán và cập nhật độc lập trên các tác tử. | THUẬT TOÁN HỌC PHÂN TÁN CHO HỆ ĐA TÁC TỬ Từ Minh Phuong Học viện Công nghệ Bưu chỉnh Viện thông Một ưong những vẩn đề đặt ra đổi với hệ thong bao gồm nhiều tác tử ỉà tác từ phải có khá năng phổi hợp hành động với nhau sao cho hành động chung dẫn tới kết quả mong muốn vẩn đê này cỏ thê giãi quyết bằng cách cho tác tử tự học cảch phổi hợp với tác từ khác nhờ các kỹ thuật học tự động. Học tăng cường reinforcement learning ỉà kỹ thuật học tự động được sừ dụng rộng rãi nhất cho tảc lừ độc lập và gần đây được nghiên cứu mở rộng cho hệ đa tác từ. Bảo cảo trình bầy một thuật toán học lãng cường cho hệ thống bao gồm nhiều tác từ cộng tảc với nhau trong đỏ quá trình học được tiến hành song song và phân tản trên ĩẩl cả tác từ. Thuật toán học được xây dựng trên cơ sở cài tiến thuật học Q Q-ỉearning với bảng Q được phân tản và cập nhật độc lộp trên các tác từ. Thuật toán được cài đặt và thừ nghiệm cho bài toán dì chuyên vật nặng với hai tác tử. Kẻt quả thừ nghiệm cho thầy tỉnh hiệu quả và khả năng ứng dụng cùa thuật toán. 1. ĐẶT VÁN ĐÈ Hệ đa tảc từ muỉtiagení system là hệ thống trong đó nhiều tác tử tự chủ tương tác với nhau để thực hiện một số nhiệm vụ nào đó. Yêu cầu quan trọng đối với hệ đa tác từ là tác tử phải có khả năng phối hợp hành động với nhau sao cho toàn hệ thống hoạt động hiệu quả. Cơ chế phối hợp có thể cài đặt sẵn khi xây dựng tác tử dưới dạng các quy ước các kế hoạch lập sẵn các kỹ thuật đồng . 14 . Một phương pháp đảm bảo phối hợp khác là không cài đặt sẵn cơ chế đồng bộ mà để tác từ tự học cách phối hợp hành động thông qua kinh nghiệm thu được trong quá ưình tương tác với nhau. Phương pháp này có một sổ ưu điểm như trực quan cho kết quả ồn định vấn đề đặt ra là cần xây dựng các thuật toán học tự động phù hợp với tính chất phân tán và không đồng bộ vốn có của hệ đa tác từ. Học tăng cường reinforcement learning truyền thống là kỹ thuật học tự động dùng cho một tác tử riêng lẻ. Tác tử phải học cách ra quyết định hành động thông qua chuỗi các tương tác với

Ngọc Hoan 106 10 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Tổng quan về ứng dụng công nghệ thông tin - truyền thông trong giáo dục

3 401 8

Mô tả công việc Giám đốc công nghệ thông tin

2 390 0

Luận văn: Tính toán hiệu quả chuyển giao công nghệ thông tin thông qua thị trường tin học

76 278 3

Công nghệ thông tin và ứng dụng công nghệ thông tin trong dạy học

8 386 15

Chương trình giáo dục Đại học theo học chế tín chỉ ngành: Công nghệ thông tin

28 289 0

Quyết định 995/QĐ-BTC năm 2013

5 277 0

Bài giảng Chương 2 - Thiết kế và quản lý dự án Công nghệ thông tin - PGS.TS Nguyễn Văn Định

26 310 1

Bài giảng Đại cương Công nghệ thông tin và truyền thông - ThS. GV. Phạm Quang Quyền

118 287 3

Giáo trình Tiếng Anh chuyên ngành Công nghệ thông tin

47 1247 85

Ebook Tìm hiểu Luật Công nghệ thông tin và các Nghị định hướng dẫn thi hành - NXB Bưu điện

74 359 6

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461836 55

Giới thiệu :Lập trình mã nguồn mở

14 22499 57

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10846 529

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10023 445

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9477 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8240 1124

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8198 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7859 2219

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6636 253

Vật lý hạt cơ bản (1)

29 5751 85

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4

47 245 1 18-04-2024

extremetech Hacking BlackBerry phần 9

31 236 0 18-04-2024

Bibliography on Medieval Women, Gender, and Medicine 1980-2009

82 204 0 18-04-2024

Trading Strategies Profit Making Techniques For Stock_8

23 170 0 18-04-2024

Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "

7 172 0 18-04-2024

Bơm máy nén quạt trong công nghiệp part 8

20 195 2 18-04-2024

Posted prices versus bargaining in markets_7

23 153 0 18-04-2024

B2B Content Marketing: 2012 Benchmarks, Budgets & Trends

17 137 0 18-04-2024

Lịch sử Đội TNTP Hồ Chí Minh - CHƯƠNG III VÂNG LỜI BÁC DẠY, LÀM NGHÌN VIỆC TỐT, CHỐNG MỸ, CỨU NƯỚC, THIẾU NIÊN SĂN SÀNG

45 136 0 18-04-2024

Đóng mới oto 8 chỗ ngồi part 9

10 115 0 18-04-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7859 2219

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5572 1319

Ebook Chào con ba mẹ đã sẵn sàng

112 3740 1228

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8240 1124

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5234 1124

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3470 641

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10846 529

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3667 524

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4014 513

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4092 478