第13章 多元統計(1 / 2)

加入書籤

一、多元線性回歸分析

1多元回歸概念

在簡單回歸分析中,討論了兩個變量的回歸問題,其中因變量隻與一個自變量有關。在現實中,大多數影響因變量的因素不是一個而是多個。在回歸分析中,如果對兩個或兩個以上的自變量對因變量影響現象進行分析,這就叫做多重回歸。由於一種現象常常與多種其他現象相聯係,用多個自變量的最優組合共同來預測(估計)因變量,比隻用一個自變量進行預測(估計)更有效,更符合實際,多重回歸可增強對因變量的分析估計的準確性。

2自變量的診斷及選擇

(1) 在進行回歸分析之前,需要確定自變量是否符合基本假設,這就是診斷過程,一般需要經過異常點診斷(檢測是否有個別觀測點與多數觀測點偏離很遠或出現過失誤差)和共線性診斷(若自變量之間有較強相關關係,將很難求得理想回歸方程,共線性診斷便是先對自變量間的相關性作出判斷與剔除)。

(2)自變量的選擇方法有許多種,基本上都是基於決定係數R2最大原則:最優方程選擇法、同時多重回歸法、逐步多重回歸法、層次多重分析法等。

二、主成分分析

(一)基本原理

先對n個觀測點(xi1, xi2) 求出第一條最佳擬合直線,使得這n個觀測點到該直線的垂直距離的平方和最小,這時稱此直線為第一主成分,然後再求與第一主成分相互 獨立(在此表現為相互垂直)的且與n個觀測點(xi1, xi2)的垂直距離平方和最小的第二主成分。

利用降維的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標。通常把轉化生成的綜合指標稱為主成分,這樣在研究復雜問題時,就可以隻考慮幾個少數的主成分又不至於損失太多信息,從而更容易抓任主要矛盾,揭示事物內部變量之間的規律性,提高分析效率。

一般地說,利用主成分分析得到的主成分與變量之間有如下關係:

(1) 每一個主成分都是各原始變量的線性組合;

(2)主成分的數目大大少於原始變量的數目;

(3)主成分保留了原始變量的絕大多數信息;

(4)各主成分之間互不相關(無多重共線性)。

(二)主成分分析的步驟

1對各變量數據進行標準化(消除單位等的影響);

↑返回頂部↑

書頁/目錄

本章報錯

科幻相关阅读: 林言啊! 在看一次白山茶 重生後,粘人嬌妻挺孕肚要抱抱 末日黃金槍手 凡事發生必有利於我 穿書為炮灰逆轉人生 假麵騎士chara 愛情玄幻 神奇寶貝之降臨 謎題的背後