ضریب تعیین
در آمار، ضریب تعیین (به انگلیسی: Coefficient of Determination) که آن را با یا نمایش داده و به صورت «مربع آر» یا «آر دو» خوانده میشود، نسبتی از واریانس برحسب متغیر وابسته است که از متغیر (های) مستقل قابل پیشبینی باشد.
این ضریب، آمارهای است که از آن در بحث مدلهای آماری استفاده گشته، به گونهای که هدف آن یا پیشبینی خروجیهای آینده است یا آزمودن فرضیه براساس سایر اطلاعات مرتبط. این ضریب میزان تکرار خروجیهای مشاهده شده توسط مدل را برحسب نسبتی از واریانس کل خروجیها که توسط مدل توضیح داده شده، میسنجد.[۱][۲][۳]
تعاریف متعددی از وجود دارد که تنها برخی مواقع با هم معادل اند. یک دسته از چنین مواردی شامل رگرسیون خطی ساده است که در آن به جای از استفاده شدهاست. هنگامی که عرض از مبدأ (اینترسپت) لحاظ شود، صرفاً مربع ضریب همبستگی (یعنی ) بین خروجیهای مشاهده شده و مقادیر پیشبینی کننده مشاهده شدهٔ نمونه خواهد بود.[۴] اگر رگرسورهای اضافه لحاظ شوند، مربع ضریب همبستگی چندگانه خواهد بود. در هر دو مورد مذکور، ضریب تعیین معمولاً بین ۰ تا ۱ قرار خواهد گرفت.
مواردی وجود دارند که تعریف محاسباتی ، بسته به تعریف استفاده شده قادر به تولید مقادیر منفی است. چنین مواردی هنگامی پدیدار میگردند که پیشبینیهای مورد مقایسه با خروجیهای متناظر، از فرایند برازش مدل حاصل از آن دادهها مشتق نشده باشند. حتی اگر فرایند برازش مدلی به کار رفته باشد، باز هم ممکن است منفی شود، به عنوان مثال، هنگامی که رگرسیون خطی بدون درنظر گرفتن عرض از مبدأ (اینترسپت) بدست آمده باشد،[۵] یا هنگامی که جهت برازش با دادهها، از یک تابع غیر خطی استفاده شده باشد.[۶] براساس این محک خاص، در مواردی که مقادیر منفی بدست میآیند، میانگین دادهها در مقایسه با مقادیر برازش یافته تابع، برازش بهتری را برای خروجیها ارائه مینمایند.
هنگام ارزیابی نیکویی برازش مقادیر شبیهسازی شده () در مقابل مقادیر اندازهگیری شده ()، مناسب نیست که چنین ارزیابی بر روی از رگرسیون خطی بنا نهاده شود (یعنی ). ضریب ، درجه هرگونه همبستگی خطی بین و را میسنجد، درحالی که برای نیکویی برازش تنها یک همبستگی خطی در نظر گرفته میشود: (یعنی خط 1:1).[۷][۸]
منابع
[ویرایش]- ↑ Steel, R. G. D.; Torrie, J. H. (1960). Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill.
- ↑ Glantz, Stanton A.; Slinker, B. K. (1990). Primer of Applied Regression and Analysis of Variance. McGraw-Hill. ISBN 978-0-07-023407-9.
- ↑ Draper, N. R.; Smith, H. (1998). Applied Regression Analysis. Wiley-Interscience. ISBN 978-0-471-17082-2.
- ↑ Devore, Jay L. (2011). Probability and Statistics for Engineering and the Sciences (8th ed.). Boston, MA: Cengage Learning. pp. 508–510. ISBN 978-0-538-73352-6.
- ↑ Barten, Anton P. (1987). "The Coeffecient of Determination for Regression without a Constant Term". In Heijmans, Risto; Neudecker, Heinz (eds.). The Practice of Econometrics. Dordrecht: Kluwer. pp. 181–189. ISBN 90-247-3502-5.
- ↑ Colin Cameron, A.; Windmeijer, Frank A.G. (1997). "An R-squared measure of goodness of fit for some common nonlinear regression models". Journal of Econometrics. 77 (2): 1790–2. doi:10.1016/S0304-4076(96)01818-0.
- ↑ Legates, D.R.; McCabe, G.J. (1999). "Evaluating the use of "goodness-of-fit" measures in hydrologic and hydroclimatic model validation". Water Resour. Res. 35 (1): 233–241. Bibcode:1999WRR....35..233L. doi:10.1029/1998WR900018.
- ↑ Ritter, A.; Muñoz-Carpena, R. (2013). "Performance evaluation of hydrological models: statistical significance for reducing subjectivity in goodness-of-fit assessments". Journal of Hydrology. 480 (1): 33–45. Bibcode:2013JHyd..480...33R. doi:10.1016/j.jhydrol.2012.12.004.
- مشارکتکنندگان ویکیپدیا. «Coefficient of Determination». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۲ مهٔ ۲۰۲۱.
برای مطالعه بیشتر
[ویرایش]- Gujarati, Damodar N.; Porter, Dawn C. (2009). Basic Econometrics (Fifth ed.). New York: McGraw-Hill/Irwin. pp. 73–78. ISBN 978-0-07-337577-9.
- Hughes, Ann; Grawoig, Dennis (1971). Statistics: A Foundation for Analysis. Reading: Addison-Wesley. pp. 344–348. ISBN 0-201-03021-7.
- Kmenta, Jan (1986). Elements of Econometrics (Second ed.). New York: Macmillan. pp. 240–243. ISBN 978-0-02-365070-3.
- Lewis-Beck, Michael S.; Skalaban, Andrew (1990). "The R-Squared: Some Straight Talk". Political Analysis. 2: 153–171. doi:10.1093/pan/2.1.153. JSTOR 23317769.