Interpretation of Universities Using Multidimensional Scaling and Principal Component Analysis

Uploaded by

This document discusses using multidimensional scaling (MDS) and principal component analysis (PCA) to analyze similarity data from universities. It first loads university data and calculates Euclidean distances between them. MDS is performed using classical and non-metric approaches. Classical MDS plots certain universities with strong correlations closer together. Non-metric MDS yields a high stress value, indicating dissimilarity. PCA is also applied, showing the first principal component explains most variance and separates some universities. Key differences between MDS and PCA are discussed.

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Interpretation of Universities Using Multidimensional Scaling and Principal Component Analysis

Uploaded by

Joshua chirchir

0% found this document useful (0 votes)

39 views4 pages

Original Description:

Business analytics

Original Title

4_5886332904862124665

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Download as docx, pdf, or txt

0% found this document useful (0 votes)

39 views4 pages

Interpretation of Universities Using Multidimensional Scaling and Principal Component Analysis

Uploaded by

Joshua chirchir

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 4

Search inside document

Interpretation of Universities Using Multidimensional

Scaling and Principal Component Analysis

Multidimensional scaling is a type of multivariate analysis that involves visualization of similarity
or dissimilarity of data points by displaying the points in two-dimensional plots. There are two
types of multidimensional scaling i.e. Classical multidimensional scaling and Non-metric
multidimensional scaling. The data provided is first loaded and the first six columns are viewed
using the head() method. The data contains seven columns where the six of the columns are
numerical while the column university contains character names. The data has no missing
values or any duplicated rows. Using the summary() to get a brief statistical summary of the
data.

In order to perform multidimensional scaling in R, the data has to be converted into an array or
matrix. This involves first removing the first column from the data set and assigning the same to
as the row values. The Euclidean distance is then calculated between the various universities.
Euclidean distance is used to measure the similarity between the variables. Displaying the
Euclidean distances in a heat map to explain the similarity. Basing on the heatmap, the
universities Havard, Yale, Stanford and MIT are seen to have a strong correlation hence more
similarities in term of variables provide while there is huge dissimilarity in universities such as
Havard and TexaxA&m while a less dissimilarity between Georgetown and yale.
For Classical multidimensional scaling, the compute classical (metric) multidimensional scaling
(cmdscale()) stats package is used. This works by preserving the original distance metric
between points. The output contains the preserved distances, the eigenvalues returned, the
doubly centred distance matrix, the additive constant and the numeric vectors. From the plot,
the distance between the universities Havard, Standford, Yale, MIT, Duke, Columbia is less
hence shows the similarities. The distance to from the same university to Pennstate, Umchigan
and TexasA&M is largely showing the dissimilarities between these universities. CalTech and
JohnsHopkins have high negative points showing their dissimilarities to the other universities.

The Kruskal’s Non-metric multidimensional scaling provides a stress value of 4.48976. This
represents the goodness of fit of the regression based on the sum of squared differences. This
is a high value the dissimilarities in the universities.

Finally, deploying the principal component analysis to the data using the prcomp() function of
the numerical column and factoextra package for visualisation. Screeplot displays a graph of
inertia against principal components. Principal components are created in order of the amount
of variation they cover. PC1 covers the most variation, PC2 the second-most while PC6 covers
the least variation. Fviz_eig() displays an elbow-shaped which is the ideal cutting off point after
which it flattens out.

PC1 explains 76.8% of the total variance, which means that nearly two-thirds (four variables)
can be encapsulated by just that once principal component. Grad, Top10, SAT, and Expense all
contribute to pca1. From the biplot of individuals and variables, CalTech and JohnsHopkins
universities are observed at a distance in pca1 compared to Havard, MIT, Duke, Yale which
shows the dissimilarities.
Some of the advantages of multidimensional scaling over principal component analysis include;
● MDS is more focused on relations among the scaled objects while PCA is focused on
the dimension seeking to maximize explained variance.
● MDS projects data point in 2-dimensional space such that similar objects are closer
together while PCA projects a multidimensional space to the direction of maximum
variability using correlation matrix for analyzing the correlation between data points.

Market Basket Paper
Document94 pages
Market Basket Paper
Bisera Krstevska
No ratings yet
Multi Variate Analysis
Document4 pages
Multi Variate Analysis
gaurav_thakur
No ratings yet
Interval or Ratio Level of Measurement: Principal Component Analysis (PCA)
Document2 pages
Interval or Ratio Level of Measurement: Principal Component Analysis (PCA)
Muhammad Saifur Rahman
No ratings yet
Multi Dimensional Scaling
Document18 pages
Multi Dimensional Scaling
anuragshuklaibshyd
No ratings yet
Edab Module - 1
Document20 pages
Edab Module - 1
Chirag 17
No ratings yet
Branches of Statistics, Data Types, and Graphs
Document6 pages
Branches of Statistics, Data Types, and Graphs
musicoustic1
No ratings yet
The Others in The Cluster But With Differences Between Clusters
Document5 pages
The Others in The Cluster But With Differences Between Clusters
Parth Hemant Purandare
No ratings yet
Topics Feb21
Document52 pages
Topics Feb21
vivek thorat
No ratings yet
HCPC Husson Josse
Document17 pages
HCPC Husson Josse
Zain Aamir
No ratings yet
Distance Metric Learning Based On The Class Center and Nearest Neighbor
Document35 pages
Distance Metric Learning Based On The Class Center and Nearest Neighbor
sohel rana
No ratings yet
Correspondence Analysis: Ata Cience and Nalytics
Document6 pages
Correspondence Analysis: Ata Cience and Nalytics
SWAPNIL MISHRA
No ratings yet
A Flexible Bayesian Variable Selection Approach For Modeling Interval Data
Document20 pages
A Flexible Bayesian Variable Selection Approach For Modeling Interval Data
Swapnaneel Bhattacharyya
No ratings yet
Think Globally, Fit Locally
Document33 pages
Think Globally, Fit Locally
Ali Umair Khan
No ratings yet
CHEMOMETRICS and STATISTICS Multivariate Classification Techniques-21-27
Document7 pages
CHEMOMETRICS and STATISTICS Multivariate Classification Techniques-21-27
Jose Garcia
No ratings yet
Test Wenia Abraao Entropy
Document28 pages
Test Wenia Abraao Entropy
Paula Tárcimam
No ratings yet
Linear Discriminant Analysis How To Have A Practical Approach To An LDA Model?
Document6 pages
Linear Discriminant Analysis How To Have A Practical Approach To An LDA Model?
Dharaneesh .R.P
No ratings yet
Simple Linear Regression
Document25 pages
Simple Linear Regression
helderfox
No ratings yet
Geometric Diffusions As A Tool For Harmonic Analysis and Structure Definition of Data: Diffusion Maps
Document6 pages
Geometric Diffusions As A Tool For Harmonic Analysis and Structure Definition of Data: Diffusion Maps
dr_s_m_afzali8662
No ratings yet
MIDAS Stata Module For Meta-Analytical Integration
Document25 pages
MIDAS Stata Module For Meta-Analytical Integration
Rabbiya Aslam
No ratings yet
Thesis Multiple Linear Regression
Document5 pages
Thesis Multiple Linear Regression
lesliesanchezanchorage
100% (1)
Applied Harmonic Analysis Poster
Document1 page
Applied Harmonic Analysis Poster
Alborz Zibaii
No ratings yet
Edab Module - 5
Document19 pages
Edab Module - 5
Chirag 17
No ratings yet
Inference As A Dynamic Concept Map: Sytse Knypstra
Document10 pages
Inference As A Dynamic Concept Map: Sytse Knypstra
Adina Elena
No ratings yet
Quantifying The Theory vs. Programming Disparity Using Spectral Bipartivity Analysis and Principal Component Analysis
Document15 pages
Quantifying The Theory vs. Programming Disparity Using Spectral Bipartivity Analysis and Principal Component Analysis
Anonymous Gl4IRRjzN
No ratings yet
Quantifying The Theory vs. Programming Disparity Using Spectral Bipartivity Analysis and Principal Component Analysis
Document15 pages
Quantifying The Theory vs. Programming Disparity Using Spectral Bipartivity Analysis and Principal Component Analysis
Anonymous Gl4IRRjzN
No ratings yet
Advanced Statistics
Document259 pages
Advanced Statistics
Velmar Alcano Lumantao
No ratings yet
Ijcai07 113 PDF
Document6 pages
Ijcai07 113 PDF
MJA
No ratings yet
Applications of Diffusion Maps in Gene Expression Data-Based Cancer Diagnosis Analysis
Document4 pages
Applications of Diffusion Maps in Gene Expression Data-Based Cancer Diagnosis Analysis
Dyah Septi Andryani
No ratings yet
Edu 533 Outline
Document10 pages
Edu 533 Outline
Teresa B. Timon
No ratings yet
MDS, PCoA
Document5 pages
MDS, PCoA
Raj Narayanan
No ratings yet
Use of CCA and CA
Document24 pages
Use of CCA and CA
Sanet Janse van Vuuren
No ratings yet
Statistical Estimation Methods in Hydrological Engineering
Document41 pages
Statistical Estimation Methods in Hydrological Engineering
shambel
No ratings yet
Variability
Document8 pages
Variability
Jelica Vasquez
No ratings yet
BAStutorial Linear Regression
Document30 pages
BAStutorial Linear Regression
Luis Luengo
No ratings yet
Multidimensional Scaling: Learning Objectives
Document10 pages
Multidimensional Scaling: Learning Objectives
he-man99
No ratings yet
An Elementary Introduction To Information Geometry
Document61 pages
An Elementary Introduction To Information Geometry
Miguel Orrillo
No ratings yet
Estimation Strategies For The Regression Coefficient Parameter Matrix in Multivariate Multiple Regression
Document20 pages
Estimation Strategies For The Regression Coefficient Parameter Matrix in Multivariate Multiple Regression
Ronaldo Santos
No ratings yet
Chapter Summary - SRM - Triad 2
Document17 pages
Chapter Summary - SRM - Triad 2
Vivek Rana
No ratings yet
Cluster Cat Vars
Document17 pages
Cluster Cat Vars
fab101
No ratings yet
PC A Tutorial
Document12 pages
PC A Tutorial
Atul Agnihotri
No ratings yet
UT Dallas Syllabus For Stat6337.501.10f Taught by Michael Baron (Mbaron)
Document5 pages
UT Dallas Syllabus For Stat6337.501.10f Taught by Michael Baron (Mbaron)
UT Dallas Provost's Technology Group
No ratings yet
4823 Dsejournal
Document129 pages
4823 Dsejournal
Hey Buddy
No ratings yet
Clustering: Georg Gerber Lecture #6, 2/6/02
Document50 pages
Clustering: Georg Gerber Lecture #6, 2/6/02
maruthiy
No ratings yet
Statistics Notes
Document46 pages
Statistics Notes
hsrinivas_7
No ratings yet
DSE 3 Unit 4
Document8 pages
DSE 3 Unit 4
Priyaranjan Soren
No ratings yet
Lowrank Relerr SIMAX
Document38 pages
Lowrank Relerr SIMAX
juan perez arrikitaun
No ratings yet
Clustering and Applications and Trends in Data Mining
Document42 pages
Clustering and Applications and Trends in Data Mining
PhamThi Thiet
No ratings yet
Tree of Latent Mixtures For Bayesian Modelling and Classification of High Dimensional Data
Document8 pages
Tree of Latent Mixtures For Bayesian Modelling and Classification of High Dimensional Data
Abbé Busoni
No ratings yet
Statistical Foundations for Psychology
From Everand
Statistical Foundations for Psychology
James C. Ware
No ratings yet
Colpitts-Statistics Essay-Least Squares
Document8 pages
Colpitts-Statistics Essay-Least Squares
Andrew Colpitts
No ratings yet
School of Computer Engineering: Kalinga Institute of Industrial Technology Deemed To Be University Bhubaneswar-751024
Document70 pages
School of Computer Engineering: Kalinga Institute of Industrial Technology Deemed To Be University Bhubaneswar-751024
Ruchira Saha
No ratings yet
Cox Regression Thesis
Document6 pages
Cox Regression Thesis
HowToFindSomeoneToWriteMyPaperSalem
100% (2)
2001, Pena, Prieto
Document25 pages
2001, Pena, Prieto
matchman6
No ratings yet
Unit-03 (Part 2)
Document20 pages
Unit-03 (Part 2)
Gaurav Jaiswal
No ratings yet
Business Statstics Complete
Document13 pages
Business Statstics Complete
college1908
No ratings yet
Unit 4
Document15 pages
Unit 4
abernakumari87
No ratings yet
Unit 3 DS
Document16 pages
Unit 3 DS
romeesh jain
No ratings yet
Median Absolute Deviation
Document4 pages
Median Absolute Deviation
Simone Weill
No ratings yet
Biplot and Singular Value Decomposition Macros For Excel
Document15 pages
Biplot and Singular Value Decomposition Macros For Excel
shantanuril
No ratings yet
K Nearest Neighbor Algorithm: Fundamentals and Applications
From Everand
K Nearest Neighbor Algorithm: Fundamentals and Applications
Fouad Sabry
No ratings yet
CE 341 Exam #2 Fall 2020
Document1 page
CE 341 Exam #2 Fall 2020
Joshua chirchir
No ratings yet
3-Stats Uni
Document15 pages
3-Stats Uni
Joshua chirchir
No ratings yet
MISY262: Fundamentals of Business Analytics: Data and Variables
Document9 pages
MISY262: Fundamentals of Business Analytics: Data and Variables
Joshua chirchir
No ratings yet
Multimedia Systems: Chapter 7: Data Compression
Document41 pages
Multimedia Systems: Chapter 7: Data Compression
Joshua chirchir
No ratings yet
Misy262: Fundamentals of Business Analytics: Ali Tosyali, PHD Assistant Professor of Mis
Document14 pages
Misy262: Fundamentals of Business Analytics: Ali Tosyali, PHD Assistant Professor of Mis
Joshua chirchir
No ratings yet
1-1-Scientific Method (Online) #3
Document5 pages
1-1-Scientific Method (Online) #3
Joshua chirchir
No ratings yet
Anh Viet Doan BDS Sep 21 S4 SYD Machine Learning ETE
Document18 pages
Anh Viet Doan BDS Sep 21 S4 SYD Machine Learning ETE
Việt Anh Đoàn
No ratings yet
Katatasan Sa Pagsasalita NG Mga Mag-Aaral NG Wikang Filipino
Document21 pages
Katatasan Sa Pagsasalita NG Mga Mag-Aaral NG Wikang Filipino
Dacer Domingo
No ratings yet
(6-12) A Novel Approach For EEG
Document7 pages
(6-12) A Novel Approach For EEG
Hema Kumbhar
No ratings yet
(1991) Kresta, MacGregor and Marlin, Multivariate Statistical Monitoring of Process Operating Performance, Can J CH
Document13 pages
(1991) Kresta, MacGregor and Marlin, Multivariate Statistical Monitoring of Process Operating Performance, Can J CH
Sanem Hazal Türkay
No ratings yet
Principal Component Analysis Pca As An Ideal Tool For Analysing On-Farm Research Data
Document30 pages
Principal Component Analysis Pca As An Ideal Tool For Analysing On-Farm Research Data
jin0935
No ratings yet
Mathematical Algorithms For Artificial Intelligence and Big Data
Document34 pages
Mathematical Algorithms For Artificial Intelligence and Big Data
Jose Ramon Villatuya
No ratings yet
Biosystems Engineering Research Review 15 PDF
Document207 pages
Biosystems Engineering Research Review 15 PDF
Anamaria Goloman
No ratings yet
Some Studies On Normal and Non-Normal Process Capability Indices
Document10 pages
Some Studies On Normal and Non-Normal Process Capability Indices
inventionjournals
No ratings yet
Applied Data Science Questions
Document15 pages
Applied Data Science Questions
gnanajothi k
No ratings yet
Determination of The Key Anthropometric and Range of Motion
Document18 pages
Determination of The Key Anthropometric and Range of Motion
Jonathan Cecil Fernando
No ratings yet
Case Studies in Big Data: Joshua Cook
Document12 pages
Case Studies in Big Data: Joshua Cook
Joshua Cook
No ratings yet
Facial Expression Classification Based On SVM, KNN and MLP Classifiers
Document7 pages
Facial Expression Classification Based On SVM, KNN and MLP Classifiers
IntanSetiawatiAbdullah
No ratings yet
2022 SCHEME PG MST - Compressed - 0
Document84 pages
2022 SCHEME PG MST - Compressed - 0
CIVIL ENGINEERING
No ratings yet
Spatiotemporal Characterization of VIIRS Night Light
Document18 pages
Spatiotemporal Characterization of VIIRS Night Light
pecinta dakwah Islam
No ratings yet
Impact of Brand Image On Customer Loyalty in India
Document17 pages
Impact of Brand Image On Customer Loyalty in India
preetambele
100% (1)
A Virtual Sensor For Predicting Diesel Engine Emissions From Cylinder Pressure Data
Document9 pages
A Virtual Sensor For Predicting Diesel Engine Emissions From Cylinder Pressure Data
Khac-Hoang Nguyen
No ratings yet
Computational Intelligence and Data Sciences: Paradigms in Biomedical Engineering 1st Edition Taylor & Francis Group
Document54 pages
Computational Intelligence and Data Sciences: Paradigms in Biomedical Engineering 1st Edition Taylor & Francis Group
piviplly27
100% (9)
Multi Spat
Document25 pages
Multi Spat
Edison Morera Estevez
No ratings yet
Using Topic Modeling Methods For Short-Text Data: A Comparative Analysis
Document14 pages
Using Topic Modeling Methods For Short-Text Data: A Comparative Analysis
eliasKK
No ratings yet
A Comparative Study of Optical Character Recognition For Tamil Script
Document13 pages
A Comparative Study of Optical Character Recognition For Tamil Script
kapilkumargupta
No ratings yet
Factors Influencing Teachers' Laptop Purchases PDF
Document6 pages
Factors Influencing Teachers' Laptop Purchases PDF
Sadia Sultana
No ratings yet
Advance Business Reprot
Document24 pages
Advance Business Reprot
tanaya lokhande
No ratings yet
Online Word of Mouth and Consumer Purchase Intentions
Document16 pages
Online Word of Mouth and Consumer Purchase Intentions
Timothy John Tucker Noetzel
No ratings yet
Factors Influencing Consumer Buying Behavior On Bikes
Document18 pages
Factors Influencing Consumer Buying Behavior On Bikes
chinu489
No ratings yet
Metabolites 03 00259
Document18 pages
Metabolites 03 00259
hazelius
No ratings yet
Medical Engineering & Physics: Jie Liu
Document5 pages
Medical Engineering & Physics: Jie Liu
D4wFl1N
No ratings yet
Sankhya Data Science Course
Document22 pages
Sankhya Data Science Course
S
No ratings yet
Applications of Linear Algebra in Facial Recognition
Document3 pages
Applications of Linear Algebra in Facial Recognition
RAJ JAISWAL
No ratings yet
Face Recognition From Video A Review
Document56 pages
Face Recognition From Video A Review
CNS CNS
No ratings yet