ضریب تعیین

رگرسیون کمترین مربعات معمولی از قانون اوکان. از آنجا که خط رگرسیون، انحراف زیادی از نقاط ندارد، $R^{2}$ مربوط به رگرسیون نسبتاً بالا است.

مقایسه برآوردگر تیل-سن (سیاه) و رگرسیون خطی ساده (آبی) برای مجموعه‌ای از نقاط به همراه نقاط پرت. به دلیل داده‌های پرت زیاد، هیچ‌کدام از خطوط رگرسیون با داده‌ها به خوبی برازش ندارد، چرا که هیچ‌کدام از این برازش‌ها، $R^{2}$ ‌های خیلی بالایی را ارائه نمی‌کنند.

در آمار، ضریب تعیین (به انگلیسی: Coefficient of Determination) که آن را با $R^{2}$ یا $r^{2}$ نمایش داده و به صورت «مربع آر» یا «آر دو» خوانده می‌شود، نسبتی از واریانس برحسب متغیر وابسته است که از متغیر (های) مستقل قابل پیش‌بینی باشد.

این ضریب، آماره‌ای است که از آن در بحث مدل‌های آماری استفاده گشته، به گونه‌ای که هدف آن یا پیش‌بینی خروجی‌های آینده است یا آزمودن فرضیه براساس سایر اطلاعات مرتبط. این ضریب میزان تکرار خروجی‌های مشاهده شده توسط مدل را برحسب نسبتی از واریانس کل خروجی‌ها که توسط مدل توضیح داده شده، می‌سنجد.^[۱]^[۲]^[۳]

تعاریف متعددی از $R^{2}$ وجود دارد که تنها برخی مواقع با هم معادل اند. یک دسته از چنین مواردی شامل رگرسیون خطی ساده است که در آن به جای $R^{2}$ از $r^{2}$ استفاده شده‌است. هنگامی که عرض از مبدأ (اینترسپت) لحاظ شود، $r^{2}$ صرفاً مربع ضریب همبستگی (یعنی $r$ ) بین خروجی‌های مشاهده شده و مقادیر پیش‌بینی کننده مشاهده شدهٔ نمونه خواهد بود.^[۴] اگر رگرسورهای اضافه لحاظ شوند، $R^{2}$ مربع ضریب همبستگی چندگانه خواهد بود. در هر دو مورد مذکور، ضریب تعیین معمولاً بین ۰ تا ۱ قرار خواهد گرفت.

مواردی وجود دارند که تعریف محاسباتی $R^{2}$ ، بسته به تعریف استفاده شده قادر به تولید مقادیر منفی است. چنین مواردی هنگامی پدیدار می‌گردند که پیش‌بینی‌های مورد مقایسه با خروجی‌های متناظر، از فرایند برازش مدل حاصل از آن داده‌ها مشتق نشده باشند. حتی اگر فرایند برازش مدلی به کار رفته باشد، باز هم $R^{2}$ ممکن است منفی شود، به عنوان مثال، هنگامی که رگرسیون خطی بدون درنظر گرفتن عرض از مبدأ (اینترسپت) بدست آمده باشد،^[۵] یا هنگامی که جهت برازش با داده‌ها، از یک تابع غیر خطی استفاده شده باشد.^[۶] براساس این محک خاص، در مواردی که مقادیر منفی بدست می‌آیند، میانگین داده‌ها در مقایسه با مقادیر برازش یافته تابع، برازش بهتری را برای خروجی‌ها ارائه می‌نمایند.

هنگام ارزیابی نیکویی برازش مقادیر شبیه‌سازی شده ( $Y_{pred}$ ) در مقابل مقادیر اندازه‌گیری شده ( $Y_{obs}$ )، مناسب نیست که چنین ارزیابی بر روی $R^{2}$ از رگرسیون خطی بنا نهاده شود (یعنی $Y_{obs}=m.Y_{pred}+b$ ). ضریب $R^{2}$ ، درجه هرگونه همبستگی خطی بین $Y_{pred}$ و $Y_{obs}$ را می‌سنجد، درحالی که برای نیکویی برازش تنها یک همبستگی خطی در نظر گرفته می‌شود: $Y_{obs}=1.Y_{pred}+0$ (یعنی خط 1:1).^[۷]^[۸]

منابع

↑ Steel, R. G. D.; Torrie, J. H. (1960). Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill.
↑ Glantz, Stanton A.; Slinker, B. K. (1990). Primer of Applied Regression and Analysis of Variance. McGraw-Hill. ISBN 978-0-07-023407-9.
↑ Draper, N. R.; Smith, H. (1998). Applied Regression Analysis. Wiley-Interscience. ISBN 978-0-471-17082-2.
↑ Devore, Jay L. (2011). Probability and Statistics for Engineering and the Sciences (8th ed.). Boston, MA: Cengage Learning. pp. 508–510. ISBN 978-0-538-73352-6.
↑ Barten, Anton P. (1987). "The Coeffecient of Determination for Regression without a Constant Term". In Heijmans, Risto; Neudecker, Heinz (eds.). The Practice of Econometrics. Dordrecht: Kluwer. pp. 181–189. ISBN 90-247-3502-5.
↑ Colin Cameron, A.; Windmeijer, Frank A.G. (1997). "An R-squared measure of goodness of fit for some common nonlinear regression models". Journal of Econometrics. 77 (2): 1790–2. doi:10.1016/S0304-4076(96)01818-0.
↑ Legates, D.R.; McCabe, G.J. (1999). "Evaluating the use of "goodness-of-fit" measures in hydrologic and hydroclimatic model validation". Water Resour. Res. 35 (1): 233–241. Bibcode:1999WRR....35..233L. doi:10.1029/1998WR900018.
↑ Ritter, A.; Muñoz-Carpena, R. (2013). "Performance evaluation of hydrological models: statistical significance for reducing subjectivity in goodness-of-fit assessments". Journal of Hydrology. 480 (1): 33–45. Bibcode:2013JHyd..480...33R. doi:10.1016/j.jhydrol.2012.12.004.

مشارکت‌کنندگان ویکی‌پدیا. «Coefficient of Determination». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۱۲ مهٔ ۲۰۲۱.

برای مطالعه بیشتر

Gujarati, Damodar N.; Porter, Dawn C. (2009). Basic Econometrics (Fifth ed.). New York: McGraw-Hill/Irwin. pp. 73–78. ISBN 978-0-07-337577-9.
Hughes, Ann; Grawoig, Dennis (1971). Statistics: A Foundation for Analysis. Reading: Addison-Wesley. pp. 344–348. ISBN 0-201-03021-7.
Kmenta, Jan (1986). Elements of Econometrics (Second ed.). New York: Macmillan. pp. 240–243. ISBN 978-0-02-365070-3.
Lewis-Beck, Michael S.; Skalaban, Andrew (1990). "The R-Squared: Some Straight Talk". Political Analysis. 2: 153–171. doi:10.1093/pan/2.1.153. JSTOR 23317769.

[1] Steel, R. G. D.; Torrie, J. H. (1960). Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill.

[2] Glantz, Stanton A.; Slinker, B. K. (1990). Primer of Applied Regression and Analysis of Variance. McGraw-Hill. ISBN 978-0-07-023407-9.

[3] Draper, N. R.; Smith, H. (1998). Applied Regression Analysis. Wiley-Interscience. ISBN 978-0-471-17082-2.

[Devore-4] Devore, Jay L. (2011). Probability and Statistics for Engineering and the Sciences (8th ed.). Boston, MA: Cengage Learning. pp. 508–510. ISBN 978-0-538-73352-6.

[5] Barten, Anton P. (1987). "The Coeffecient of Determination for Regression without a Constant Term". In Heijmans, Risto; Neudecker, Heinz (eds.). The Practice of Econometrics. Dordrecht: Kluwer. pp. 181–189. ISBN 90-247-3502-5.

[6] Colin Cameron, A.; Windmeijer, Frank A.G. (1997). "An R-squared measure of goodness of fit for some common nonlinear regression models". Journal of Econometrics. 77 (2): 1790–2. doi:10.1016/S0304-4076(96)01818-0.

[7] Legates, D.R.; McCabe, G.J. (1999). "Evaluating the use of "goodness-of-fit" measures in hydrologic and hydroclimatic model validation". Water Resour. Res. 35 (1): 233–241. Bibcode:1999WRR....35..233L. doi:10.1029/1998WR900018.

[8] Ritter, A.; Muñoz-Carpena, R. (2013). "Performance evaluation of hydrological models: statistical significance for reducing subjectivity in goodness-of-fit assessments". Journal of Hydrology. 480 (1): 33–45. Bibcode:2013JHyd..480...33R. doi:10.1016/j.jhydrol.2012.12.004.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]

[۸]

ن ب و شاخص‌های ارزشیابی یادگیری ماشینی
رگرسیون	MSE · MAE · sMAPE · MAPE · MASE · MSPE · RMS · RMSE/RMSD · R2 · MDA · MAD
طبقه‌بندی	امتیاز اف ۱ · Accuracy · Precision · Recall · Kappa · MCC · AUC · ROC · حساسیت و ویژگی · Logarithmic Loss
خوشه‌بندی	Silhouette · Calinski-Harabasz · Davies-Bouldin · Dunn index · Hopkins statistic · اندیس ژاکار · Rand index · Similarity measure · SMC · SimHash
رتبه‌بندی	MRR · DCG · NDCG · AP
بینایی رایانه‌ای	PSNR · SSIM · IoU
NLP	سرگشتگی · جایگزین ارزشیابی دوزبانه
شاخص‌های مرتبط با یادگیری عمیق	Inception score · FID
سامانه توصیه‌گر	Coverage · Personalization · Intra-list Similarity
تشابه	Cosine similarity · فاصله اقلیدسی · ضریب همبستگی پیرسون
ماتریس درهم‌ریختگی