일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- docker
- ifkakao2020
- 언어모델
- 빅쿼리 튜닝
- 태블로
- pyspark오류
- 도커
- spark #스파크
- DataFrame Spark
- tableau
- spark df
- 도커exec
- airflow
- 시각화
- 데이터엔지니어링
- sparkdf
- 데이터 시각화
- 로컬 pyspark
- LLM
- PySpark
- SparkSQL
- spark explode
- 프로그래머스 파이썬
- Big Query
- 코테
- Docker error
- dataframe
- 도커오류
- BigQuery
- 빅쿼리
Archives
- Today
- Total
목록About Data/Linear Algebra (1)
SOGM'S Data

이해하면 까먹고 , 손에 잡힐 것 같으면서 안잡히는 PCA를 이해해봅시다.직관적인 이해를 위해 수학적인 요소는 빼보았습니다! 일단 거두절미하고 PCA의 가장 큰 목적은 차원을 축소하고 차원을 추출하는데 필요합니다. 우선 PCA(Principal component analysis)는 주성분 분석을 뜻하는데, 위와 같은 그림은 우리가 흔히 PCA를 볼때 가장 잘 아는 그림입니다. PCA는 어떠한 데이터 분포를 분산이 가장 큰 방향으로 정사영하며 이뤄진다.즉, 어떠한 데이터의 분포를 설명할 때 2가지 벡터로만 간단하게 설명하고 싶다면? 위에 있는 두 화살표들(벡터들) 이 데이터의 분포를 가장 잘 설명할 수 있는데 해당 벡터들은 분산이 가장 큰 방향으로 생성된다는 뜻입니다. 아래 쉬운단어로 표현했습니다. ..
About Data/Linear Algebra
2020. 10. 28. 16:42