일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Tags
- 파이썬
- sparkml
- text mining
- postgresql
- mysql
- 통계분석
- 시계열분석
- pyspark
- 회귀분석
- 딥러닝
- spark
- sql
- nlp
- 튀르키예 여행
- 스택/큐
- ADP실기
- SparkSQL
- 기초통계학
- 카파도키아
- 프로그래머스
- hackerrank
- Machine Learning
- python
- 텍스트마이닝
- Deep Learning
- 인과추론
- 튀르키예
- 터키 여행
- 데이터분석
- 머신러닝
Archives
- Today
- Total
YSY의 데이터분석 블로그
반응형
Tags
- sql
- python
- 프로그래머스
- 파이썬
- mysql
- hackerrank
- 시계열분석
- 머신러닝
- spark
- 기초통계학
- postgresql
- Machine Learning
- 회귀분석
- 터키 여행
- 데이터분석
- 튀르키예 여행
- 튀르키예
- ADP실기
- pyspark
- 딥러닝
- Deep Learning
- 통계분석
- 텍스트마이닝
- SparkSQL
- 인과추론
- sparkml
- 스택/큐
- text mining
- nlp
- 카파도키아
- 욜루데니즈
- 지도학습
- 페티예
- tensorflow
- 정상성
- 다중공선성
- ADP
- 괴레메
- 스파크
- Google spreadsheet api
- 깊이/너비 우선 탐색(DFS/BFS)
- vif
- 안탈리아
- ensemble
- 동적계획법
- 부스팅
- 이즈미르
- 앙상블
- 회귀
- cnn
- 터키
- 통계
- 이중차분법
- SARIMA
- 잔차진단
- Feature Vectorize
- 단순선형회귀분석
- 공간데이터
- 완전탐색
- mnist
- DNN
- 손실함수
- Linear Regression
- postgis
- nltk
- 분산분석
- 비정상성
- 잔차
- 인과관계
- 정규화
- yarn
- boosting
- ANOVA
- 비용함수
- MAPREDUCE
- Hadoop
- join
- 이스탄불
- KNN
- St.Petersburg Paradox
- Feature Transformer
- broadcast join
- shuffle join
- 환경변수 세팅
- data skew
- google spreadsheet
- 카파도키아 전망대
- 올림포스 산
- 선택편향
- 관계형데이터모델링
- 포아송분포
- 지연값
- 시계열분해
- logit
- Two-way ANOVA
- F-value
- 더미변수
- 잔차도
- 정착률
- 지속률
- 로그데이터분석
- 로그데이터
- ADP실기 준비
- Statsmodel
- 이원배치분산분석
- 모델저장
- 최소제곱추정량
- ARIMA
- 카카오블라인드
- 대출위험도 예측모델링
- StandardScaler
- Imputer
- parquet
- 자기상관
- SQL튜닝
- 등분산성
- 사이킷런
- MinMaxScaler
- OLS
- 카이막
- XGBoost
- RMSE
- scikit-learn
- 데이터전처리
- dataframe
- TF-IDF
- voting
- 다중회귀분석
- COALESCE
- cross join
- 정규분포
- 이동평균
- ubunto
- BFS
- Regression
- 상관분석
- 가설검정
- 기초통계
- 조건부확률
- 산포도
- DTM
- LEFT JOIN
- Crawling
- 그래비티
- TDM
- var
- 페러글라이딩
- 백색잡음
- 일반화
- 선셋
- shp
- 최소제곱법
- callback
- 코딩테스트
- wordcloud
- Prophet
- 벌룬투어
- dfs
- IMDB
- 상관계수
- White Noise
- PCA
- 매칭
- t-test
- 상관관계
- 크롤링
- irp
- 명제
- 로지스틱 회귀분석
- logistic regression
- 옵티마이저
- AWS
- AR
- 맵리듀스
- select
- 빅데이터
- 확률
- 공분산
- 분산
- 표준화
- Gravity
- 전망대
- 자유도
- 터키여행
- 파이프라인
- ma
- 실기
- CASE
- 스케일링
- 최적화
- 독립
- 후기
- HEART Framework
- PIRATE Framework(AARRR)
- 종합 평가 기준
- 가드레일지표
- 동인지표
- 목표지표
- A/B Test 지표
- 드모르간법칙
- 추정오차
- 회귀직선의 오차
- 회귀오류
- 회귀효과
- 상관계수의 해석
- 상관계수의 특징
- 상관계수 계산
- 68-95-99.7% Rule
- 68-95법칙
- 이탈값
- 제곱근-평균-제곱
- 평균과 중앙값의 관계
- 이중 눈가림
- confounder
- 혼동요인
- 경험적연구
- selection bias
- 종적자료
- 패널자료
- 횡단면 자료
- 지수분포의 무기억성
- 지수분포의 기댓값과 평균
- 확률변수의 독립
- 표준정규분포의 특성
- 정규분포의 특성
- 정규분포의 분산
- 정규분포의 평균
- 정규분포와 이항분포
- 기초통계량
- 균등분포의 기대값과 분산
- 연속확률분포의 기대값과 분산
- 표준균등분포
- 연속확률분포와 이산확률분포 비교
- 포아송분포와 테일러급수
- poisson paradigm
- 포아송근사
- 포아송분포의 활용
- 포아송분포의 평균
- p-value의 정의
- 음이항분포의 기대값
- 기하분포의 기대값
- 성공분포
- 성공전까지의 실패횟수의 분포
- 성공 확률이 p인 베르누이 시행에서 r번째 성공까지의 시행 횟수
- 성공 확률이 p인 베르누이 시행에서 처음으로 성공할 때까지의 시행 횟수
- 음이항분포
- 이항확률변수의 기대값
- 베르누이 확률변수의 기댓값
- 베르누이 확률변수
- 기대값의 선형성
- 이산확률변수의 기댓값
- 이항확률변수
- 계차방정식
- 도박꾼의 파산
- 무작위 배정
- 심슨의역설
- 조건부 독립
- 조건부 독립과 독립의 관계
- 조건부 확률 수형도
- 드 몽모르트의 문제
- Birthday problem
- 확률의 특성
- 확률의 non-naïve한 정의의 공리
- 표본 추출 정리
- Learning Model
- Spark ML PipeLine
- StringIndexer
- Spark Regression
- Spark Classification
- StringIndexor
- File System Partitioning
- bucketby
- bucketing
- Spark Execution Plan
- 이스탄불 공항버스
- 터키식 목욕
- Schema Evolution
- repartition
- spark file format
- Managed Table
- hive 테이블 생성
- hive metastore
- spark 설치
- pyspark windows10 설치
- countDistinct
- withColumn
- 컬럼 필터링
- createOrReplaceTempView
- pyspark.sql.types
- StructField
- inferschema
- getNumPartitions
- Local Standalone Spark
- spark.read.option.csv
- spark.read.csv
- Sparksession 환경변수
- 스파크세션
- Spark 데이터 구조
- Range partition
- Hashing partition
- clearBasicFilter
- setBasicFilter
- 필터 생성
- 필터 삭제
- googlespreadsheet API
- MajorDimemsion
- ValueInputOption
- values().clear()
- values().update()
- 데이터 제거
- 시트이름변경
- 시트탭 색상 변경
- updateSheetProperties
- sheet tab
- sheet metadata
- Sheetid
- 구글스프레드시트 API
- spreadsheet api 연동
- 조건명제
- 곱집합
- 집합연산식
- 논리연산식
- Spark Program
- SparkAPI
- Spark vs MapReduce
- Spark 소개
- Ubunto Error
- 우분투 설치시 에러 해결
- ubunto 설치
- 대용량 분산 시스템
- 셔플링
- Survivorship bias
- 삼각형의 성질
- 함수의 평행이동
- regexp_extract
- 다항식의 곱셈정리
- 드모르간의법칙
- 관찰연구
- 측정오차
- 베야지드 광장
- 쉴레이마니예 모스크
- 술탄 아흐메트 광장
- 누스렛 스테이크 하우스
- 시트탭
- 이스탄불 카르트
- 네브셰히르
- 괴리메
- 으흘라라 계곡 트래킹
- 셀리메동굴수도원
- 데린쿠유 지하도시
- 선라이즈 전망대
- 벌룬 전망대
- Wood Fire Barbeque
- 승마투어
- 벌룬투어 날씨
- shmkapadokya.kapadokya
- 벌룬투어 예약
- 다중공선성을 해결해야 하는 경우
- 다중선형회귀분석의 활용
- 카파도키아 야경
- 안탈리아 공항
- 그래비티 페러글라이딩
- 안탈리아 올림포스 케이블카
- 올림포스 케이블카
- olympos mountain
- olympos
- 올림포스 산 예약
- 터키 스쿠버다이빙
- 욜루데니즈 스쿠버다이빙
- 터키 보트투어
- 페티예 보트투어
- 카쉬 버스
- 카쉬 당일치기
- propensity logit
- propensity score
- psmpy
- effect size
- 욀뤼데니즈
- 돌무쉬
- 페러글라이딩 예약방법
- 파묵칼레 당일치기
- bilet
- obliet
- 셀축 당일치기
- 이즈미르 일몰
- 이즈미르 교통
- 이즈미르 카르트
- 이즈미르 여행
- 이즈미르교통
- izban
- 이즈미르공항
- 생존편향
- 변수 변환
- Difference in Difference
- Relative time model
- Leads-and lags model
- Event study approach
- 평행추세검증
- feature extractor
- 평행 추세 가정
- 인과그래프
- 잠재적결과프레임워크
- 외적타당성
- 조건부평균처치효과
- 평균처치효과
- 무작위통제실험
- 역인과관계
- Granger Causality
- 그랜져 인과관계
- 인과관계와 상관관계
- 셀추크
- pamukkale
- feature vector
- spark cluster
- 시계열 자료
- 기하분포
- 확률의 공리
- 임펄스 응답 함수
- 백터자기회귀 모형
- MLFlow
- seasonality
- 파이썬 구글드라이브 연동
- google drive file upload/download
- 구글드라이브 연동
- 구글드라이브 파일 다운로드
- 구글드라이브 파일 업로드
- 구글드라이브 api
- python으로 메일보내기
- 이미지첨부
- 메일첨부
- 동치관계
- Scatter Plot
- DB 연결
- executemany
- 메소드적용
- 함수적용
- 자연실험
- 평균으로의 회귀
- Auto_arima
- 시계열분석 자동화
- 분석사이클 자동화
- 분석사이클
- SARIMAX
- 계절성차분
- OEC
- ARIMA 표현식
- 단위근
- 적분 선형확률 과정
- 과차분
- SARMAX
- ARMAX
- 자기회귀이동평균
- 일반선형확률과정
- Auto-Regressive
- OneHotEncoder
- 편자기상관함수
- Heuristic Miner
- 휴리스틱마이닝
- PM4PY
- 프로세스마이닝
- PACF
- 항공사 승객수요
- 정상성 변환
- 정상성변환
- 약정상
- 강정상
- 빅분기
- 넷플릭스 규칙없음
- ADP후기
- ADP필기
- ADP합격후기
- 부분범위처리
- 클러스터링 팩터
- 테이블 액세스
- 인덱스튜닝
- 역정규화
- 개념적데이터모델링
- ADP20회
- 문제복기
- 초기하분포
- 다중선형회귀분석
- 시계열데이터전처리
- 지연값처리
- 시간현실반영
- 시계열 데이터 전처리
- 분석평가
- 시계열모델링
- 자기상관함수
- 2스텝 교차검사
- 1스텝 교차검사
- 데이터셋분리
- 상관관계시각화
- 분포시각화
- 증감폭
- 시계열분해시각화
- Triangles
- 시계열변수
- 가설조건
- 기토총계학
- 이산변수
- 순위변수
- 로지스틱 회귀분석 해석
- 로짓
- F값 계산
- SS의 종류
- 이원배치 분산분석
- 주효과
- Main effect
- Within Variance
- Between Variance
- F값
- GLS/FGLS regression
- WLS regresssion
- Robust Standard error
- Breusch-Pagan test
- Goldfeld-Quandt test
- White Test
- Dummy Variable
- 수정된 결정계수
- Adjusted R-squared
- 회귀계수
- Paired T-test
- Two-Sample T-test
- One-Sample Test
- 블록이동
- 쿠팡크롤링
- 네이버 open api
- 하둡이란
- 하둡 설치
- Gauss-Markov Theorem
- 가우스-마르코프 정리
- 최소자승추정량
- 완전공선성
- 잔차항
- 크래머공식
- 몬티홀문제
- 전결합 피드 포워드 신경망
- Fully_conndeted FFNN
- Sequential API
- tensorflow SaveModel
- HDF5 형식 저장
- 파라미터(weight)저장
- flow_from_directory
- ImageDataGenerator
- Image Augmentation
- 이미지 증식
- Fully Connected Layers
- 사용자 집계
- 사용자 구분
- 사용자 그룹핑
- RFM분석
- RFM
- DECILE분석
- 카테고리별집계
- 사용자집계
- 카테고리별 매출분석
- 카테고리별 분석
- Z차트
- functional API
- 파일 삽입
- Import CSV
- regexp_split_to_table
- 데이터행열변환
- 날짜/시간
- 결손값
- current_date
- 문자열 병합
- 문자열 분해
- SQLD 39회 후기
- SQLD준비
- 기둥과 보
- R-squared
- KMO
- Bartlett
- 탐색적요인분석
- 주성분 개수 구하기
- ADP실기후기
- ADP19회
- ADP기출
- 단계선택법
- 후진소거법
- 전진선택법
- 변수선택법
- Q-Q Plot
- 잔차의 정규성
- 잔차의 등분산성
- 잔차의 독립성
- 모형의선형성
- 잔차분석
- 범주형변수
- 연속형변수
- 이항검정
- 대응표본
- 일표본
- 데이터자격검정
- googlespreadsheet
- 이스탄불 야경
- Function API
- HDF5
- Fully-connected layer
- Max Polling Layer
- strides
- Hyper parameter tuning
- Learning Rate Decay
- Dropout Layer
- 카탈랑 수
- timeout expired aws
- unnest
- SRID
- csv->shp
- DBF
- 파생변수
- 최소 비용 신장 트리(MST)
- DNN 분류
- MNIST Fashion
- from_tensor_slices()
- 배치 경사하강법
- 딥러닝 프로세스
- freqdist
- 품사부착
- 텍스트처리
- GridSearchCV
- silhouette_score
- silhouette_samples
- 실루엣 지표
- Inertia value
- 이진 분류 모델
- 엘라스틱넷
- Macnine Learning
- R squrare
- 평가지표
- Extra Gradient Boost
- GradientBoosting
- 목적함수
- 최소하강법
- Soft Voting
- Hard Voting
- VotingClassifier
- 머신러닝 개발 절차
- 결정트리모델
- cross_val_score
- Stratified K 폴드
- K홀드
- HOLD OUT
- 데이터셋 나누기
- 원핫인코딩
- 연속형
- F1 Score
- 분류지표
- 데이터병합
- 커널 서포트 벡터 머신
- 서포트백터머신
- 이진분류
- 추석트래픽
- 카카오코딩테스트
- K-평균
- 사후검정
- 확률밀도함수
- 시계열데이터 전처리
- 지수분포
- 베르누이시행
- 직무부트캠프 후기
- 코멘토 후기
- train_test_split
- GridSearch
- 도수분포표
- 데이터정렬
- null
- 괄호변환
- 2020 KAKAO BLIND RECRUITMENT
- 카카오코테
- batchupdate
- ridge
- avro
- SparkSession
- partitioning
- 오차 역전파
- shuffling
- 이분산성
- 균등분포
- 2019 카카오 개발자 겨울 인턴십
- rms
- 피데
- 솔트배
- 사용자정의함수
- 정규성
- 자기회귀
- 푸아송분포
- kendal
- 빅데이터분석기사
- 중앙값
- Stop word
- 텍스트 토큰화
- k-최근접 이웃
- 합성곱 연산
- Convolutional Operation
- 논리연산
- ATV 투어
- 직무부트캠프
- 코멘토
- 합성곱 신경망
- 선형회귀분석
- 랏소
- agg
- SQL 튜닝
- PWF
- Early stopping
- 카카오 코딩테스트
- Process Mining
- 프리 티어
- 결정트리
- partitionby
- Propensity Score Matching
- 과적합
- Underfitting
- Overfitting
- k-Fold
- QGIS
- 백트레킹
- 결정계수
- bagging
- randomforest
- simpson's paradox
- 심슨의 역설
- 여행경로
- 의사결정나무
- 범주형
- 과소적합
- 과대적합
- Event log
- STRING_TO_ARRAY
- NTILE
- 윈도우함수
- WINDOW FUNCTION
- cte
- CountVectorizer
- TfidfVectorizer
- 배치정규화
- N-Queen
- 최빈값
- 랜덤포레스트
- 데이터베이스 생성
- external table
- credential
- keras
- Estimator
- ROC Curve
- batch normalization
- 추론통계
- 순서쌍
- 값비교
- ReLU
- N-gram
- Decision Tree
- Random Forest
- 탐욕법
- 데이터프레임
- One-Way ANOVA
- 일원배치분산분석
- 에페소스
- Kruskal
- K-means
- classification
- 비지도학습
- 경사하강법
- AUC
- 질적변수
- 양적변수
- 단측검정
- 양측검정
- 확률질량함수
- 드래곤보트
- 유의수준
- 귀무가설
- 합성함수
- 안탈리아 구시가지
- 연속확률분포
- 누적분포함수
- spreadsheet
- 무리함수
- PyMySql
- 직사각형
- DB업데이트
- 포함배제의 원리
- 선형회귀
- Gradient Descent
- 강화학습
- 이항분포
- 문자열 추출
- 중심극한정리
- executor
- 이항계수
- 시간변수
- pooling
- 우분투설치
- sqlalchemy
- 아시아지구
- 군집
- 산점도
- support vector machine
- 데이터 삽입
- 평행사변형
- 불용어
- 교차검증
- Groupby
- konlpy
- sigmoid
- 로지스틱회귀
- wordcount
- 특이도
- matching
- 표본추출
- p값
- p-value
- 그릿
- 행열변환
- 종속변수
- 독립변수
- t검정
- 안탈리아 여행
- 하맘
- a/b test
- abc분석
- PSM
- full join
- DeepLearning
- 표준오차
- 표준정규분포
- 사다리꼴
- 텐서플로우
- VPC
- 형태소
- 분산 파일 시스템
- 파티셔닝
- ACF
- grit
- snappy
- 재현율
- arma
- Case When
- 상용로그
- 데이터 처리
- 으흘라라
- 카이세리
- 데이터분석전문가
- lambda
- 이스탄불 여행
- 릿지
- 정밀도
- workbench
- 평균값
- 표본공간
- 학습률
- SST
- 유의확률
- interval
- 유리함수
- 로그함수
- 지수함수
- 문자열 합치기
- 기하평균
- 워드클라우드
- coupang
- 홍합밥
- SQLD
- DENSE_RANK
- OrderBy
- hadoop 설치
- 역함수
- SVM
- 거듭제곱근
- 매출분석
- 탁심
- 히에라폴리스
- 돌마바흐체
- Transformation
- 다항식
- dataset
- 빈도
- 주성분분석
- 블루모스크
- 일차함수
- current_timestamp
- least
- conv
- explode
- 파일첨부
- 계절성
- 성능개선
- RIGHT JOIN
- INNER JOIN
- 캐글
- 아야소피아
- 레드투어
- 버스예약
- 스피어만
- 에페스
- İzmir
- asc
- Inner
- SOFTMAX
- 구글메일
- SSR
- RDB
- 기댓값
- UPSERT
- KAS
- psql
- 백색소음
- SQRT
- 명목변수
- 고등어케밥
- hive
- Epoch
- 사각형
- LSE
- 보트투어
- self join
- 척도
- 테일러급수
- imap
- reduce
- 어간
- 배깅
- 뉴런
- Google Drive
- 최소자승법
- mime
- pipeline
- 정사각형
- union all
- smtp
- 양고기
- 넷플릭스
- erd
- 실험연구
- 그린투어
- 원형복원
- 셀축
- 데니즐리
- SSE
- 정규표현식
- UDF
- 근의공식
- 커리큘럼
- AIC
- RANK
- oltp
- substring
- mse
- 삼각함수
- clustering
- Greatest
- 이차방정식
- 구글드라이브
- 도형
- 거시경제
- 진리집합
- 히스토그램
- 벤다이어그램
- 삼각형
- Holiday
- 집합의 연산
- 논리연산자
- desc
- driver
- csv
- 추세
- RDD
- 마름모
- scope
- 피어슨
- growth
- 쉬린제
- java 설치
- 파묵칼레
- age
- job
- 확률변수
- HDFS
- 조건부 확률
- 편차
- EDA
- Interaction
- 상호작용
- Odds
- 오즈비
- Action
- 정확도
- padding
- Task
- 이차함수
- 경우의 수
- placeholder
- trim
- 이벤트로그
- ROW_NUMBER
- 필터
- 다각형
- PARTITION BY
- 그룹화
- insert
- 차분
- parameter
- transformer
- 자연어처리
- 선라이즈
- category
- Cast
- IRIS
- 오차
- Stack
- abs
- 표준편차
- 주기
- 그래프
- 하둡
- API
- 시계열
- POINT
- 함수
- Outer Join
- 야간버스
- 합격후기
- STAGE
- union
- order by
- 필기
- Trend
- 오즈
- SIGN
- 클라우드
- regex
- 추이분석
- extract
- DB
- create
- 시험후기
- 와인
- split
- 파라미터
- 편의
- 바클라바
- 집합
- 사회과학
- 환경변수
- 시뮬레이션
- 분류
- 카쉬
- 지수
- FA
- 모델링
- Gmail
- Sort
- map
- 날짜
- 기울기
- 로그
- 평균
- 변수
- 케이블카
- 스쿠버다이빙
- 쿠팡
- 규제
- 야경
- ss
- 편향
- 패딩
- 우분투
- =
- 데이터
- 아마존
- POWER
- 네트워크
- 리눅스
- 데이터베이스
- 마케팅
- 여행
- 버스
- 자격증
- 시간
- 백종원
- with
- 자료
- 네이버
- CF
- 관계