일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- SparkSQL
- BigQuery
- 시각화
- airflow
- 프로그래머스 파이썬
- 데이터엔지니어링
- spark explode
- 도커
- DataFrame Spark
- dataframe
- 데이터 시각화
- ifkakao2020
- tableau
- 언어모델
- pyspark오류
- LLM
- Big Query
- docker
- PySpark
- Docker error
- 도커오류
- 태블로
- 빅쿼리 튜닝
- 코테
- spark #스파크
- 빅쿼리
- spark df
- 도커exec
- sparkdf
- 로컬 pyspark
Archives
- Today
- Total
목록About Data/Linear Algebra (1)
SOGM'S Data
PCA를 직관적으로 이해해보자
이해하면 까먹고 , 손에 잡힐 것 같으면서 안잡히는 PCA를 이해해봅시다.직관적인 이해를 위해 수학적인 요소는 빼보았습니다! 일단 거두절미하고 PCA의 가장 큰 목적은 차원을 축소하고 차원을 추출하는데 필요합니다. 우선 PCA(Principal component analysis)는 주성분 분석을 뜻하는데, 위와 같은 그림은 우리가 흔히 PCA를 볼때 가장 잘 아는 그림입니다. PCA는 어떠한 데이터 분포를 분산이 가장 큰 방향으로 정사영하며 이뤄진다.즉, 어떠한 데이터의 분포를 설명할 때 2가지 벡터로만 간단하게 설명하고 싶다면? 위에 있는 두 화살표들(벡터들) 이 데이터의 분포를 가장 잘 설명할 수 있는데 해당 벡터들은 분산이 가장 큰 방향으로 생성된다는 뜻입니다. 아래 쉬운단어로 표현했습니다. ..
About Data/Linear Algebra
2020. 10. 28. 16:42