이 자료는 고려대학교 SW AI 대학원 빅데이터융합학과 석사과정 면접을 준비하면서 만들었던 자료입니다. 데이터 관련 특수대학원을 지원하는 분들에게 많은 도움이 되기를 바랍니다.
확률
- 확률: 주사위를 던졌을 때 특정 숫자가 나올 확률을 계산하는 것.
- 통계: 여러 번 주사위를 던져 나온 결과를 분석하여 주사위가 공정한지 여부를 판단하는 것.
- 확률의 정의는?
- 확률은 어떤 사건이 일어날 가능성을 수치적으로 나타낸 값입니다. 0에서 1 사이의 값을 가지며, 0은 사건이 일어날 가능성이 전혀 없고 1은 반드시 일어난다고 가정합니다.
- 조건부 확률이란?
- 조건부 확률은 사건 B가 발생한 조건 하에서 사건 A가 발생할 확률입니다.
- 독립 사건이란?
- 두 사건 A와 B가 독립적일 때, 하나의 사건이 발생했는지 여부가 다른 사건에 영향을 주지 않습니다.
- 베이즈 정리란?
- 베이즈 정리는 조건부 확률을 구하는 법으로, 사전 지식(사건 A)에 대한 확률을 업데이트하여 사건 B에 대한 사후 확률을 계산하는 방법입니다.
- 기댓값의 정의는?
- 기댓값은 확률변수의 평균적인 값으로, 각 가능한 값에 그 확률을 곱한 값들의 합입니다.
- 분산의 정의는?
- 분산은 확률변수의 값이 기댓값으로부터 얼마나 퍼져 있는지를 나타내는 척도입니다.
- 공분산이란?
- 공분산은 두 확률변수 간의 관계를 측정하는 값으로, 두 변수의 변화가 함께 일어나는 정도를 나타냅니다. Cov(X,Y)=E[(X−E[X])(Y−E[Y])]Cov(X, Y) = E[(X - E[X])(Y - E[Y])]Cov(X,Y)=E[(X−E[X])(Y−E[Y])]입니다.
- 상관계수란?
- 상관계수는 두 변수 간의 선형 관계 정도를 측정하는 지표로, -1에서 1 사이의 값을 가집니다. 값이 1이면 완벽한 양의 상관관계, -1이면 완벽한 음의 상관관계를 의미합니다.
- 공분산에서 각각의 표준편차를 곱한것을 나눈것
- 중심극한정리란?
- 중심극한정리는 표본 크기가 충분히 크면, 표본 평균의 분포는 정규분포에 근사한다는 이론입니다. 이는 모분포가 무엇이든 관계없이 적용됩니다.
- 대수의 법칙이란?
- 대수의 법칙은 표본 평균이 모집단 평균에 점점 가까워진다는 이론입니다. 즉, 표본이 클수록 표본 평균은 더 정확한 모평균을 추정합니다.
- 결합확률분포란?
- 결합확률분포는 두 사건이 동시에 발생할 확률을 나타내는 분포입니다. 두 확률변수가 동시에 일어날 확률을 계산하는 데 사용됩니다.
- 주변확률분포란?
- 주변확률분포는 결합확률분포에서 하나의 변수에 대한 확률을 얻기 위해 다른 변수에 대해 합산 또는 적분한 분포입니다.
- 조건부분포란?
- 조건부분포는 다른 사건이 발생한 조건 하에서 한 사건의 확률분포를 나타냅니다.
- 균등분포란?
- 균등분포는 모든 사건이 동일한 확률로 발생하는 분포로, 이산형 또는 연속형일 수 있습니다.
- 베르누이 분포란?
- 베르누이 분포는 두 가지 가능한 결과(성공 또는 실패)가 있을 때 발생하는 확률분포입니다. 성공 확률을 p로 정의합니다.
- 이항분포란?
- 이항분포는 일정 횟수의 독립적인 베르누이 시행에서 성공 횟수를 나타내는 분포입니다.
- 기하분포란?
- 기하분포는 첫 번째 성공이 발생할 때까지의 시행 횟수를 나타내는 분포입니다.
- 포아송 분포란?
- 포아송 분포는 일정 시간 또는 공간 내에서 희귀한 사건이 발생하는 횟수를 나타내는 분포입니다. 예를 들어, 시간당 전화가 걸려오는 횟수.
- 지수분포란?
- 지수분포는 특정 사건이 발생할 때까지의 시간을 나타내는 분포입니다. 예: 기계 고장이 발생하기까지의 시간.감마분포 : 주로 대기 시간 또는 소요 시간을 모델링하는 데 사용됩
- 카이제곱분포란?
- 표본의 분산이 실제 분산과 얼마나 일치하는지를 검사하는 분포, 자유도에 따라 모양이 달라지며 0 이상의 값만 가질수있음
- 정규분포란?
- 정규분포는 대칭적인 벨 곡선을 가진 연속 확률분포로, 평균과 표준편차로 정의됩니다. 많은 자연현상에서 나타납니다.
- 정규분포의 성질
- 정규분포는 대칭적이며 평균, 중앙값, 최빈값이 모두 동일하고, 표준편차에 따라 폭이 결정됩니다.
- 정규화(표준화)란?
- 정규화는 데이터의 평균을 0, 표준편차를 1로 변환하여 분포를 표준 정규분포로 만드는 과정입니다.
- 정규분포에서 확률 구하기
- 정규분포에서 확률을 구할 때는 Z-값을 사용하여 표준정규분포표를 참조합니다.
- 정규분포의 대칭성 활용
- 정규분포의 대칭성은 평균을 기준으로 양쪽의 확률이 동일하다는 성질을 가지고 있어, 한쪽에서 구한 확률을 그대로 반영할 수 있습니다.
- 다변량 정규분포란?
- 다변량 정규분포는 여러 개의 정규분포가 결합된 형태로, 벡터로 표현되는 여러 변수를 다루는 확률분포입니다.
- 몬테카를로 시뮬레이션이란?
- 몬테카를로 시뮬레이션은 확률적 문제를 해결하기 위해 난수를 이용해 실험을 반복하여 해를 구하는 방법입니다. 인공지능
- 마르코프 과정이란?
- 마르코프 과정은 현재 상태만으로 미래 상태가 결정되는 확률적 과정입니다. 이전 상태는 중요하지 않습니다. 강화학습
- 확률분포 함수와 확률 밀도 함수 차이?
- 확률분포 함수(PMF)는 이산형 변수의 확률을 구하는 데 사용되며, 확률밀도 함수(PDF)는 연속형 변수에 적용됩니다.
- 확률의 합법칙이란?
- 확률의 합법칙은 두 사건 A와 B에 대해 P(A∪B)=P(A)+P(B)−P(A∩B)P(A \cup B) = P(A) + P(B) - P(A \cap B)P(A∪B)=P(A)+P(B)−P(A∩B)라는 관계를 나타냅니다.
- 확률의 곱셈법칙이란?
- 확률의 곱셈법칙은 두 사건 A와 B가 독립일 경우 P(A∩B)=P(A)P(B)입니다. 사건이 독립적이지 않으면 조건부 확률을 고려해야 합니다. A의 확률과 B의 확률을 곱한것과 A와 B가 동시에 일어나는 확률이 같습니다.
- 베르누이 과정이란?
- 베르누이 과정은 각 시도에서 두 가지 결과(성공 또는 실패)가 있는 실험으로, 각 실험은 서로 독립적입니다.
- 기댓값을 이용한 분포 비교
- 기댓값을 이용해 두 분포의 평균적인 값을 비교할 수 있습니다. 동일한 기댓값을 가진 분포들이 있을 수 있지만, 분포의 형태는 다를 수 있습니다.
- 확률의 엔트로피 : **엔트로피(Entropy)**는 "불확실성의 정도" 또는 "정보량"을 측정하는 값
- 즉, 어떤 확률 분포가 있을 때, 그 분포가 얼마나 예측하기 어려운가, 또는 얼마나 많은 정보를 담고 있는가를 나타냅니다.
- 즉 불확실성(uncertainty)을 정량화하는 척도
통계
- 표본과 모수의 차이?
- 표본은 전체 집단에서 일부를 추출한 데이터이며, 모수는 전체 집단의 특성(예: 평균, 분산)을 나타내는 값입니다.
- 표본평균, 모평균 차이
- 표본평균은 표본 데이터의 평균 값이고, 모평균은 전체 모집단의 평균 값입니다. 표본평균은 모평균을 추정하는 데 사용됩니다.
- 표준편차란?
- 표준편차는 데이터가 평균값을 중심으로 얼마나 퍼져 있는지를 나타내는 값입니다. 값이 클수록 데이터의 분포가 넓습니다.
- 표준오차란?
- 표준오차는 표본평균의 표준편차로, 표본을 통해 모집단의 평균을 추정할 때의 불확실성을 나타냅니다.
- 왜도와 첨도란?
- 왜도는 분포의 비대칭 정도를 나타내고, 첨도는 분포의 꼬리의 두께를 나타냅니다.
- 신뢰구간이란?
- 신뢰구간은 모집단 모수가 특정 구간 내에 있을 확률이 일정 수준 이상임을 나타내는 범위입니다.
- 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법
- 신뢰도 : 95% : 100번 표본을 봅았을때 95번은 모집단 평균이 신뢰구간안에 있을것이다
- 표본 크기: 신뢰 구간의 너비는 표본 크기에 따라 달라집니다. 표본 크기가 작으면 신뢰 구간이 넓어지고, 표본 크기가 크면 신뢰 구간이 좁아집니다.
- 신뢰구간은 모집단 모수가 특정 구간 내에 있을 확률이 일정 수준 이상임을 나타내는 범위입니다.
- t-분포란?
- t-분포는 모집단 분산을 모를 때, 표본의 분산을 이용하여 평균 차이를 검정하는 데 사용하는 분포입니다. 표본 크기가 작을 때 사용됩니다.
- z-분포란?
- z-분포는 표준정규분포를 따르는 분포로, 모집단 분산을 알고 있을 때 사용됩니다.
- F분포
- F분포는 두 카이제곱분포의 비율을 따르는 양의 값만 가지는 비대칭 연속 확률분포입니다.
- 주로 **분산 분석(ANOVA)**이나 회귀 분석에서 모델의 적합도, 두 분산의 차이 등을 검정하는 데 사용됩니다.
- 자유도가 두 개 있으며, 자유도에 따라 분포의 형태가 달라집니다.
- f값 : F값은 F분포에서 나온 통계량으로, 주로 **분산 분석(ANOVA)**나 회귀 분석에서 사용됩니다. F값은 두 집단의 분산을 비교하여 유의미한 차이가 있는지를 판단하는 데 활용됩니다.
- t-검정이란?
- t-검정은 두 집단의 평균 차이를 비교하는 방법입니다. 표본이 작고 모집단 분산을 모를 때 사용됩니다.
- t-검정과 z-검정 차이
- z-검정은 모집단의 분산을 알고 있을 때, t-검정은 모집단 분산을 모를 때 사용합니다. 표본이 작은 경우 t-검정을 사용합니다.
- 단측검정 vs 양측검정
- 단측검정은 한 방향으로만 차이가 있는지 확인하는 검정이고, 양측검정은 양쪽 방향에서 차이를 확인하는 검정입니다.
- 가설검정의 절차
- 귀무가설과 대립가설 설정
- 유의수준 설정
- 검정통계량 계산
- p-value와 유의수준 비교하여 귀무가설 기각 여부 결정
- 귀무가설과 대립가설 정의
- 귀무가설은 "변화가 없다"는 가설로, 보통 데이터를 통해 증명하고자 하는 가설입니다. 대립가설은 귀무가설에 반하는 주장을 합니다.
- 유의수준(α)이란?
- 유의수준은 가설검정에서 귀무가설을 기각할 기준을 설정하는 값입니다. 보통 0.05가 일반적입니다.
- p-value란?
- p-value는 귀무가설이 참일 때, 실제 관찰된 데이터보다 더 극단적인 결과가 나올 확률입니다.
- 제1종 오류, 제2종 오류란?
- 제1종 오류는 귀무가설이 참일 때 잘못 기각하는 오류이고, 제2종 오류는 귀무가설이 거짓일 때 잘못 채택하는 오류입니다.
- 검정력(Power)이란?
- 검정력은 실제로 대립가설이 참일 때, 귀무가설을 기각할 확률을 의미합니다.
- 카이제곱 검정이란?
- 카이제곱 검정은 두 범주형 변수의 관계를 분석하고 적합성(한 범주형 변수의 각 그룹 별 비율 확인 같은지 기존에 알려진 비율과 같은지 검정) , 동질성(분포동질한지), 독립성을 검정하는 방법입니다. 범주형 변수들의 관계를 파악하는데 활용
- ANOVA(분산분석)이란?
- ANOVA는 세 개 이상의 집단 간 평균 차이를 비교하는 통계적 방법입니다.
- 상관분석이란?
- 상관분석은 두 변수 간의 선형 관계를 측정하는 방법입니다. Pearson 상관계수로 계산됩니다.
- 피어슨 : 연속형, 스피아만 : 순위형
- Over-Fitting(과적합). 과적합이란, train-set에 너무 과하게 모델이 최적화된 상태
선형대수
- 벡터와 행렬 차이?
- 벡터는 크기와 방향을 가진 1차원 배열이며, 행렬은 2차원 배열로 여러 벡터들을 표현하거나 선형변환을 나타냅니다.
- 행렬의 역행렬 정의?
- 행렬의 역행렬은 주어진 행렬과 곱했을 때 단위행렬이 되는 행렬입니다. 역행렬이 존재하려면 행렬식이 0이 아니어야 합니다.
- 선형독립이란?
- 선형독립이란 벡터들이 서로 영향을 주지 않는다는 의미로, 벡터들 중 어느 것도 다른 벡터들의 선형 결합으로 나타낼 수 없을 때 이 벡터들은 선형독립입니다.
- 고유값과 고유벡터란?
- 고유값은 행렬이 고유벡터를 변형할 때 스케일을 나타내는 값입니다. 고유벡터는 변환 후에도 방향이 바뀌지 않는 벡터입니다.
- 행렬의 대각화 조건은?
- 행렬을 대각화하려면, 그 행렬이 충분히 많은 선형독립적인 고유벡터를 가져야 합니다.
- 행렬의 대각화 : 행렬을 D: 대각 행렬 (대각선에 숫자만 있고 나머지는 0) 로 만드는 방법
- 대각행렬 → 계산이 매우쉬워짐
- 선형변환 : 벡터를 다른 벡터로 바꾸는 규칙 중 특별히 덧셈과 스칼라곱을 보존하는 함수
- 스칼라곱 : 벡터의 크기를 조절하는 연산
- 덧셈과 스칼라곱에 대해 닫혀있다 : 그 결과가 원래 집합 안에 머무른다
- 스칼라, 벡터, 행렬 차이
- 스칼라는 크기만을 가진 수량으로, 방향은 없습니다. 예를 들어, 온도나 질량 같은 값들이 스칼라입니다.
- 벡터는 크기와 방향을 가진 양으로, 공간 내에서 특정 방향으로 크기를 가질 때 나타냅니다. 예를 들어, 속도나 힘이 벡터입니다.
- 행렬은 수나 기호들을 직사각형 배열로 배열한 것입니다. 행렬은 여러 개의 벡터를 묶어서 표현하거나 선형 변환을 나타내는 데 사용됩니다.
- 백터의 내적과 외적
- 벡터의 내적은 두 벡터의 크기와 그 사이의 각도에 의존하는 값입니다.
- 내적은 벡터의 유사도를 나타내기도 하며, 두 벡터가 직각이면 내적은 0입니다.
- 벡터의 외적은 3차원 공간에서만 정의되는 연산으로, 두 벡터가 이루는 평면에 수직인 새로운 벡터를 만듭니다.
- 외적의 크기는 두 벡터가 이루는 평행사변형의 면적에 해당합니다.
- 행렬의 전치 (Transpose)
- 행렬의 전치는 주어진 행렬의 행과 열을 바꾸는 연산입니다.
- 행렬의 곱 정의
- 행렬의 곱은 두 행렬의 곱셈에서, 첫 번째 행렬의 행과 두 번째 행렬의 열을 내적하여 얻은 값으로 정의됩니다.
- 단위행렬 (Identity Matrix)
- 단위행렬은 주대각선 원소가 모두 1이고, 나머지 원소가 모두 0인 정사각행렬입니다. 예를 들어, 2x2 단위행렬은 I=[1001]I = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}I=[1001]입니다.
- 단위행렬은 다른 행렬과 곱했을 때 그 행렬 자체가 됩니다. 예: A×I=AA \times I = AA×I=A.
- 역행렬 정의 및 조건
- 역행렬은 주어진 행렬과 곱했을 때 단위행렬을 만드는 행렬입니다. 행렬 A에 대한 역행렬은 A−1A^{-1}A−1로 나타냅니다.
- 역행렬이 존재하려면, 행렬 A의 행렬식(determinant)이 0이 아니어야 합니다
- 역행렬이 존재하려면 행렬이 정방행렬이어야 하고, 행렬식이 0이 아니어야 합니다.
- 정방행렬 (Square Matrix)
- 정방행렬은 행과 열의 개수가 같은 행렬입니다. 예를 들어, 2x2, 3x3 행렬 등이 정방행렬입니다.
- 행렬식 (Determinant)
- 행렬식은 행렬이 가지는 특성 값으로, 행렬의 크기, 회전, 확대/축소 여부 등을 나타냅니다.
- 예를 들어, 2x2 행렬 A=[abcd]A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}A=[acbd]의 행렬식은 det(A)=ad−bc\text{det}(A) = ad - bcdet(A)=ad−bc입니다.
- 행렬식이 0일 때 의미
- 행렬식이 0이면 해당 행렬은 역행렬이 존재하지 않으며, 선형독립이 아니고, 행렬이 **특이행렬(singular matrix)**에 해당합니다.
- 선형독립 (Linearly Independent), 선형결합, 선형종속
- 벡터들이 선형독립이라면, 그 벡터들 중 어떤 벡터도 다른 벡터들의 선형결합으로 표현할 수 없습니다. 즉, 비영벡터들이 서로 독립적으로 존재하는 상태입니다.
- 선형결합은 여러 벡터를 일정한 스칼라(실수) 값으로 곱한 후, 그 결과를 더하는 연산입니다.
- 벡터들이 선형종속이라면, 그 중 적어도 하나의 벡터가 다른 벡터들의 선형결합으로 표현될 수 있습니다. 즉, 벡터들 중 일부가 다른 벡터들의 중복입니다.
- 벡터공간 (Vector Space),부분공간 (Subspace)
- 벡터공간은 벡터들이 덧셈과 스칼라 곱에 대해 닫혀있는 집합입니다. 예를 들어, 모든 n차원 벡터들의 집합은 벡터공간을 이룹니다.
- 부분공간은 벡터공간의 부분집합으로, 덧셈과 스칼라 곱에 대해 닫혀있는 집합입니다. 예를 들어, 3차원 공간에서 특정 평면은 2차원 부분공간입니다.
- 기저 (Basis)
- 기저는 벡터공간을 생성할 수 있는 선형독립적인 벡터들의 집합입니다. 이 벡터들로 벡터공간의 모든 벡터를 표현할 수 있습니다.
- 차원 (Dimension)
- 차원은 벡터공간을 구성하는 기저 벡터의 개수로 정의됩니다. 예를 들어, 3차원 공간에서 벡터공간의 차원은 3입니다.
- 랭크 (Rank)
- 랭크는 행렬에서 선형독립적인 행 또는 열의 개수를 의미합니다. 행렬의 랭크는 행렬의 차원과 관련이 있습니다.
- 행렬에 있는 벡터들 중 서로 독립적인 벡터가 몇 개 있는지를 나타내는 수
- 해의 개수 판단 (선형 연립방정식), PCA(차원축소),
- 역행렬 존재 조건 : n×n 행렬의 랭크가 n이면가역(invertible)
- 의미 설명
| 차원 | 행/열 벡터들이 만드는 공간의 차원 |
| 독립성 | 중복 없이 유일한 방향이 몇 개인가 |
| 정보량 | 행렬이 실제로 담고 있는 유효한 정보의 수 |
- 행공간, 열공간의 의미
- 행공간은 행렬의 행들이 이루는 벡터공간을 의미합니다.
- 열공간은 행렬의 열들이 이루는 벡터공간을 의미합니다.
- 영공간 (Null Space)
- 영공간은 주어진 행렬을 곱했을 때 결과가 영벡터가 되는 모든 벡터들의 집합입니다. 이 벡터들은 선형시스템의 해를 나타냅니다.
- 정사영 (Projection)
- 정사영은 벡터를 특정 부분공간에 수직으로 내린 그림자 또는 투영을 말합니다. 이를 통해 벡터를 다른 벡터공간에 투영할 수 있습니다.
- 선형변환 (Linear Transformation)
- 선형변환은 벡터공간의 원소를 다른 벡터공간의 원소로 변환하는 함수로, 두 가지 조건을 만족해야 합니다: 덧셈에 대해 닫혀있고, 스칼라 곱에 대해 닫혀있습니다.
- 고유값, 고유벡터 정의
- 고유값은 행렬이 특정 벡터를 변환할 때 스케일을 나타내는 값입니다.
- 고유벡터는 변환 후에도 방향이 변하지 않는 벡터입니다.
- 행렬의 역행렬을 구하는 방법 : 가우스-조던 소거법 (Gauss-Jordan Elimination)
- 가장 직관적이며 수작업과 코드 구현에 널리 사용되는 방법입니다.
- 과정:
- 행 교환(Row Exchange): 두 행을 교환하여 주 대각선 요소(pivot element)가 0이 아닌 값이 되도록 한다.
- 스케일링(Scaling): 주 대각선 요소가 1이 되도록 행의 모든 요소를 동일한 값으로 나눕니다.
- 행 덧셈(Row Addition): 다른 행의 요소를 사용하여 주 대각선 요소 외의 열의 모든 요소를 0으로 만듭니다.
https://link.coupang.com/a/d1zzIa
삼성전자 그랑데 드럼세탁기 21kg 방문설치 - 드럼세탁기 | 쿠팡
현재 별점 4.8점, 리뷰 4521개를 가진 삼성전자 그랑데 드럼세탁기 21kg 방문설치! 지금 쿠팡에서 더 저렴하고 다양한 드럼세탁기 제품들을 확인해보세요.
www.coupang.com
이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.
728x90
반응형
'대학원 후기 & 자격증 & 문제풀이 > 대학원 후기' 카테고리의 다른 글
| [대학원 후기] 고려대학교 SW AI 대학원 빅데이터융합학과 석사과정 합격후기 (1) | 2025.12.14 |
|---|