TAILIEUCHUNG - THEORETICAL NEUROSCIENCE - PART 9

Học để dự đoán một phần thưởng. A) Cốt truyện bề mặt cho thấy các dự đoán lỗi δ (t) như một hàm của thời gian trong một thử nghiệm, qua thử nghiệm. Trong các thử nghiệm đầu tiên, các lỗi cao điểm xảy ra tại thời điểm khen thưởng (t = 200), trong khi trong các thử nghiệm sau đó | 8 Classical Conditioning and Reinforcement Learning A B 2 Ỏ 1- Q 1 0 100 200 before after 0 100 200 t Figure Learning to predict a reward. A The surface plot shows the prediction error 8 t as a function of time within a trial across trials. In the early trials the peak error occurs at the time of the reward t 200 while in later trials it occurs at the time of the stimulus t 100 . B The rows show the stimulus u t the reward r t the prediction v t the temporal difference between predictions Av t 1 v t v t 1 and the full temporal difference error 8 t 1 r t 1 Av t 1 . The reward is presented over a short interval and the prediction v sums the total reward. The left column shows the behavior before training and the right column after training. Av t 1 and 8 t 1 are plotted instead of Av t and 8 t because the latter quantities cannot be computed until time t 1 when v t 1 is available. and a reward is given for a short interval around t 200. Initially w t 0 for all T. Figure shows that the temporal difference error starts off being non-zero only at the time of the reward t 200 and then over trials moves backward in time eventually stabilizing around the time of the stimulus where it takes the value 2. This is equal to the integrated total reward provided over the course of each trial. Figure shows the behavior during a trial of a number of variables before and after learning. After learning the prediction v t is 2 from the time the stimulus is first presented t 100 until the time the reward starts to be delivered. Thus the temporal difference prediction error has a spike at t 99. This spike persists because u t 0 for t 100. The temporal difference term Av t is negative around t 200 exactly compensating for the delivery of reward and so making 8 0. As the peak in 8 moves backwards from the time of the reward to the time of the stimulus weights w t for T 100 99 . successively grow. This gradually extends the prediction of future reward v t from an initial .

Hồng Thủy 42 1 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Giáo trình Kinh tế y tế (Tài liệu giảng cho sinh viên Y tế công cộng và Y học dự phòng) - Trường ĐH Y dược Cần Thơ

173 171 10

NGHIÊN CỨU KHOA HỌC NGÀNH Y - Bài 6

39 373 6

QUÁ TRÌNH CẦM MÁU

49 241 1

Giáo trình dịch tễ học y học part 1

17 214 5

Giáo trình dịch tễ học y học part 2

17 213 3

Giáo trình dịch tễ học y học part 3

17 227 3

Giáo trình dịch tễ học y học part 4

17 212 2

Giáo trình dịch tễ học y học part 5

17 207 2

Giáo trình dịch tễ học y học part 6

17 239 0

Giáo trình dịch tễ học y học part 7

17 220 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462342 61

Giới thiệu :Lập trình mã nguồn mở

14 26083 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11348 542

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10552 466

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9843 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8506 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7756 1792

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7271 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Giáo trình phân tích phương trình vi phân viết dưới dạng thuật toán đặc tính của hệ thống p1

5 164 1 28-12-2024

Báo cáo nghiên cứu nông nghiệp " Biofertiliser inoculant technology for the growth of rice in Vietnam: Developing technical infrastructure for quality assurance and village production for farmers "

12 146 2 28-12-2024

Báo cáo nghiên cứu nông nghiệp " Field control of pest fruit flies in Vietnam "

14 191 4 28-12-2024

Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "

72 187 2 28-12-2024

Báo cáo nghiên cứu khoa học " NÂNG QUAN HỆ KINH TẾ THƯƠNG MẠI VIỆT NAM - TRUNG QUỐC LÊN TẦM CAO THỜI ĐẠI "

8 174 1 28-12-2024

CUỘC KHÁNG CHIẾN CHỐNG THỰC DÂN PHÁP KẾT THÚC (1953 - 1954)_5

11 148 1 28-12-2024

5 thói quen ăn uống hủy hoại hàm răng đẹp

5 170 1 28-12-2024

Data Mining Classification: Basic Concepts, Decision Trees, and Model Evaluation Lecture Notes for Chapter 4 Introduction to Data Mining

101 140 1 28-12-2024

Determini prounoun 1

6 141 0 28-12-2024

Phạm trù Chủ nghĩa cá nhân của tư tưởng phương Tây trong sự lý giải của Phan Khôi _1

9 131 0 28-12-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7756 1792

Ebook Chào con ba mẹ đã sẵn sàng

112 4409 1371

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6292 1266

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3842 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3920 609

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4712 565

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11348 542

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4510 490