Pekiştirmeli Öğrenme Nedir?
Bir ajanın ödül-ceza sinyallerine göre adım adım en iyi stratejiyi öğrenmesini sağlayan öğrenme yöntemidir.
Zincirleme Akıl Yürütme (Chain-of-Thought) Nedir?
Modelin ara adımları da yazarak daha tutarlı ve açıklanabilir bir mantık yürütmesi tekniğidir.
Duyarlılık (Recall) Nedir?
Gerçek pozitif örneklerin ne kadarını modelin yakalayabildiğini ölçen performans ölçüsüdür.