복도

Biplot
피셔의 홍채 데이터 집합의 점도입니다.산란된 점은 관측치의 입력 점수이며 화살표는 입력 로드 벡터에 대한 각 피쳐의 기여도를 나타냅니다.
Anderson의 홍채 데이터 집합의 스펙트럼 맵 점도
피셔 홍채 데이터의 판별 분석 바이플롯(Greenacre, 2010)

이중도는 단순 2-변수 산점도의 일반화인 통계량에 사용되는 탐색 그래프의 한 유형입니다.점도표는 점수 그림적재 그림과 겹칩니다.점도표를 사용하면 데이터 행렬의 표본과 변수에 대한 정보를 그래픽으로 표시할 수 있습니다.샘플은 점으로 표시되고 변수는 벡터, 선형 축 또는 비선형 궤적으로 표시됩니다.범주형 변수의 경우 범주 수준 점을 사용하여 범주 변수의 수준을 나타낼 수 있습니다.일반화 비점도에는 연속형 및 범주형 변수에 대한 정보가 표시됩니다.

개요 및 이력

이 쌍 그림은 K에 의해 소개되었습니다. 루벤 가브리엘(1971년).[1]고어와 핸드(1996)는 바이플롯에 관한 논문을 썼다.Yan과 Kang(2003)은 바이플롯을 시각화하고 해석하는 데 사용할 수 있는 다양한 방법을 설명했습니다.biplots에 오픈 소스 R프로그래밍 언어에서 스크립트와 함께 Greenacre(2010년)[2]에 의해 그 책은 실용적인 사용자 지향의 가이드, biplots 주성분 분석(PCA), 다차원 척도(MDS),log-ratio 분석(LaboratoriumfürReaktoregelungundAnlagesicherung)—also 스펙트럼 mapping[3][4]—discriminant 분석(DA)과 다양한 형태로 알려진과 관련된으로 생성됩니다.cor의 s대응분석 : 단순대응분석(CA), 다중대응분석(MCA), 표준대응분석(CCA) (Greenacre 2016[5])Gower, Lubbe 및 Le Roux(2011)의 책은 예를 들어 주성분 분석(PCA), 표준변수 분석(CVA) 또는 다양한 유형의 대응 분석을 고려할 때 다변량 데이터의 시각화를 위한 유용하고 신뢰할 수 있는 방법으로 바이플롯을 대중화하는 것을 목표로 한다.

건설

biplot은 특이치 분해(SVD)를 사용하여 n개의 이 샘플(케이스 또는 객체라고도 함)이고 p열이 변수인 데이터 행렬 X의 변환 버전에 대한 낮은 순위 근사치를 구함으로써 구성된다.변환된 데이터 행렬 Y는 열(변수)을 중심화하고 선택적으로 표준화하여 원래 행렬 X에서 얻습니다.SVD를 사용하여 Y = δduvk=1,...pkkkT;로 수 있습니다. 여기서 uk n차원 열 벡터, vk p차원 열 벡터, dk 음이 아닌 스칼라의 비증가 시퀀스입니다.점도표는 공통 축 집합을 공유하고 집합 간 스칼라 곱 해석 기능이 있는 두 개의 산점도로 구성됩니다.첫 번째 산점도(du, du)는1α1i i = 1,....,n경우 점(dv, dv)에서 형성되고, 두 번째 그림은 j = 1,....,p경우 점(dv2α2i21−α2j, dv)에서11−α1j 형성됩니다. 이것은 SVD의 지배적인 두 항에 의해 형성되는 점도이며, 2차원 표시로 나타낼 수 있습니다.α의 일반적인 선택지는 1(행 표시에 거리 해석을 부여함)과 0(열 표시에 거리 해석을 부여함)이며, 드물게 대칭 축척 표(행 또는 열에 거리 해석을 부여하지 않고 스칼라 곱 해석만 제공함)를 얻기 위해 α=1/2이다.변수를 나타내는 점 세트는 원점에서 화살표로 그려서 표본이 원래 데이터에 근사하게 투영될 수 있는 비구축의 개념을 강화할 수 있습니다.

레퍼런스

  1. ^ 가브리엘, K. R. (1971년)주성분 분석에 적용된 행렬의 이표 그래픽 표시입니다.바이오메트리카, 58(3), 453-467.
  2. ^ Greenacre, M. (2010년)실제의 바이플롯.BBVA 재단, 스페인 빌바오http://www.multivariatestatistics.org에서 무료로 이용하실 수 있습니다.
  3. ^ Lewi, Paul J. (2005). "Spectral mapping, a personal and historical account of an adventure in multivariate data analysis". Chemometrics and Intelligent Laboratory Systems. 77 (1–2): 215–223. doi:10.1016/j.chemolab.2004.07.010.
  4. ^ David Livingstone (2009).과학 데이터 분석 실무 가이드Chichester, John Wiley & Sons Ltd, 233–238.ISBN 978-0-470-85153-1
  5. ^ Greenacre, M. (2016) 대응 분석 실무. 제3판채프먼과 홀 / CRC 프레스ISBN 978-84-923846-8-6

원천

  • Gabriel, K.R. (1971). "The biplot graphic display of matrices with application to principal component analysis". Biometrika. 58 (3): 453–467. doi:10.1093/biomet/58.3.453.
  • Gower, J.C., Lubbe, S. 및 Le Roux, N. (2010)쌍그림의 이해Wiley. ISBN 978-0-470-01255-0
  • J.C. 가워와 D. 핸드J(1996년).바이플롯.채프먼 & 홀, 런던, 영국ISBN 0-412-71630-5
  • W. Yan과 Kang, M.S. (2003)GGE 점도 분석.CRC 프레스, 보카 라튼, 플로리다ISBN 0-8493-1338-4
  • 데미, J.R., 비센테-빌라돈, 갈린도-빌라돈, M.P. 및 잠브라노, A.Y. (2008)외부 로지스틱 바이플롯에 의한 유전자형 분류와 관련된 분자 마커 식별.생물정보학. 24(24) : 2832 ~ 2838