Skip to content

Latest commit

 

History

History
9 lines (7 loc) · 478 Bytes

q-function.md

File metadata and controls

9 lines (7 loc) · 478 Bytes
layout word translation
word
Q-function
تابع Q

در یادگیری تقویتی، تابعی‌ست که بازده مورد نظر را به ازای رخ دادن یک عمل در یک حالت پیش‌بینی می‌کند و سپس سیاست مشخص‌شده را دنبال می‌کند.

تابع Q هم‌چنین به نام تابع ارزش حالت-عمل نیز شناخته می‌شود.