چرا هنگامی که از تابع log استفاده می کنیم وزن ها کمتر به سمت overfitting پیش می روند
یا می تونم به اینصورت بیان کنم که : چرا در خطای log مینیمم محلی های کمتری رخ می دهد