λ°μν
κΈ°μ΄ ν΅κ³ (basic statistics)
κΈ°μ ν΅κ³ (Descriptive Statistics)
κΈ°μ ν΅κ³(Descriptive Statistics)λ λ°μ΄ν° μ§ν©μ μ€μ¬ κ²½ν₯, λΆμ°λ λ° μ λ°μ μΈ λΆν¬λ₯Ό μμ½νμ¬
λ°μ΄ν°μ μΌλ°μ μΈ ννμ νΉμ±μ λΉ λ₯΄κ² νμ νλ λ° μ¬μ©λλ ν΅κ³μ μμΉμ λλ€.
- μ΄λ λ°μ΄ν° λΆμμ μ΄κΈ° λ¨κ³μμ λ°μ΄ν°μ κΈ°λ³Έμ μΈ νΉμ±μ μ΄ν΄νκ³ μμ½νλ λ° μ€μν μν μ ν©λλ€.
μ£Όμ κΈ°μ ν΅κ³ μ§ν
μ€μ¬ κ²½ν₯μ± (Measures of Central Tendency)
- νκ· (Mean): λ°μ΄ν°μ λͺ¨λ κ°μ λν ν λ°μ΄ν°μ κ°μλ‘ λλ κ°μΌλ‘, λ°μ΄ν°μ μ€μ¬μ λνλ λλ€.
import pandas as pd
data = pd.Series([1, 2, 3, 4, 5])
mean_value = data.mean()
print(f'νκ· : {mean_value}')
# νκ· : 3.0
- μ€μκ° (Median): λ°μ΄ν°μ μ μ λ ¬νμ λ μ€μμ μμΉν κ°μΌλ‘, λ°μ΄ν°μ μ€κ° κ°μ λνλ λλ€.
median_value = data.median()
print(f'μ€μκ°: {median_value}')
# μ€μκ°: 3.0
- μ΅λΉκ° (Mode): λ°μ΄ν°μ μμ κ°μ₯ μμ£Ό λνλλ κ°μ λλ€.
mode_value = data.mode()[0]
print(f'μ΅λΉκ°: {mode_value}')
# μ΅λΉκ°: 1
λΆμ°μ± (Measures of Dispersion)
- λ²μ (Range): λ°μ΄ν°μ μμ κ°μ₯ ν° κ°κ³Ό κ°μ₯ μμ κ°μ μ°¨μ΄μ λλ€.
range_value = data.max() - data.min()
print(f'λ²μ: {range_value}')
# λ²μ: 4
- λΆμ° (Variance): λ°μ΄ν°μ κ°λ€μ΄ νκ· μΌλ‘λΆν° μΌλ§λ λ¨μ΄μ Έ μλμ§λ₯Ό μ κ³±νμ¬ νκ· ν κ°μ λλ€.
variance_value = data.var()
print(f'λΆμ°: {variance_value}')
# λΆμ°: 2.5
- νμ€νΈμ°¨ (Standard Deviation): λΆμ°μ μ κ³±κ·ΌμΌλ‘, λ°μ΄ν°μ κ°λ€μ΄ νκ· μΌλ‘λΆν° μΌλ§λ λ¨μ΄μ Έ μλμ§λ₯Ό λνλ λλ€.
std_dev = data.std()
print(f'νμ€νΈμ°¨: {std_dev}')
# νμ€νΈμ°¨: 1.5811388300841898
- μ¬λΆμμ (Quartiles): λ°μ΄ν°μ μ λ€ λΆλΆμΌλ‘ λλλ κ°λ€λ‘, Q1(25λ²μ§Έ λ°±λΆμμ), Q2(50λ²μ§Έ λ°±λΆμμ, μ€μκ°), Q3(75λ²μ§Έ λ°±λΆμμ)λ₯Ό ν¬ν¨ν©λλ€.
Q1 = data.quantile(0.25)
Q3 = data.quantile(0.75)
IQR = Q3 - Q1
print(f'Q1: {Q1}, Q3: {Q3}, IQR: {IQR}')
# Q1: 2.0, Q3: 4.0, IQR: 2.0
νν (Shape)
- μλ (Skewness): λ°μ΄ν°μ λΉλμΉλλ₯Ό λνλ΄λ μ§νλ‘, κ°μ΄ 0μ κ°κΉμΈμλ‘ λμΉμ κ°κΉμμ μλ―Έν©λλ€. μμ μλλ μ€λ₯Έμͺ½μΌλ‘ μΉμ°μΉ¨μ, μμ μλλ μΌμͺ½μΌλ‘ μΉμ°μΉ¨μ λνλ λλ€.
skewness = data.skew()
print(f'μλ: {skewness}')
# μλ: 0.0
- 첨λ (Kurtosis): λ°μ΄ν°μ λ΄μ°λ¦¬μ λμ΄λ₯Ό λνλ΄λ μ§νλ‘, κ°μ΄ 3λ³΄λ€ ν¬λ©΄ λΎ°μ‘±ν λΆν¬λ₯Ό, 3λ³΄λ€ μμΌλ©΄ ννν λΆν¬λ₯Ό μλ―Έν©λλ€.
kurtosis = data.kurt()
print(f'첨λ: {kurtosis}')
# 첨λ: -1.2000000000000002
Example: λ°μ΄ν°μ 'μ μ λ²μ' μ€μ
λ°μ΄ν°μ ‘μ μ λ²μ’λ₯Ό μ€μ νκΈ° μν΄ λ°μ΄ν°μ νκ· κ³Ό νμ€νΈμ°¨λ₯Ό μ¬μ©ν΄ λ³΄κ² μ΅λλ€.
- λ°μ΄ν°μ νκ· κ³Ό νμ€νΈμ°¨λ₯Ό μ¬μ©νμ¬ 'μ μ λ²μ'λ₯Ό μ€μ ν μ μμ΅λλ€.
- μλ₯Ό λ€μ΄, νκ· ± 1νμ€νΈμ°¨ λ²μλ λ°μ΄ν°μ μ½ 68%λ₯Ό ν¬ν¨νλ©°, μ΄λ λ°μ΄ν°κ° μ κ· λΆν¬λ₯Ό λ°λ₯Έλ€κ³ κ°μ ν λ μ μ©ν©λλ€.
mean_value = data.mean()
std_dev = data.std()
normal_range_lower = mean_value - std_dev
normal_range_upper = mean_value + std_dev
print(f'μ μ λ²μ: {normal_range_lower} ~ {normal_range_upper}')
# μ μ λ²μ: 1.4188611699158102 ~ 4.58113883008419
Correlation (μκ΄κ΄κ³)
μκ΄κ΄κ³λ λ λ³μ κ°μ κ΄κ³λ₯Ό λνλ΄λ©°, ν λ³μμ λ³νκ° λ€λ₯Έ λ³μμ λ³νμ μ΄λ»κ² μ°κ΄λμ΄ μλμ§λ₯Ό λνλ΄λ μ§νμ λλ€.
- μκ΄κ΄κ³λ λ λ³μ κ°μ μ ν κ΄κ³μ κ°λμ λ°©ν₯μ μΈ‘μ ν©λλ€.
- κ·Έλ¬λ©΄ μ£Όμ μκ΄ κ΄κ³λ€μ λ°νμ¬ μμλ³΄κ² μ΅λλ€.
νΌμ΄μ¨ μκ΄ κ³μ (Pearson Correlation Coefficient)
- λ λ³μ κ°μ μ ν κ΄κ³λ₯Ό μΈ‘μ νλ μ§νλ‘, -1μμ 1 μ¬μ΄μ κ°μ κ°μ§λλ€.
- 1μ κ°κΉμΈμλ‘ κ°ν μμ μκ΄κ΄κ³λ₯Ό, -1μ κ°κΉμΈμλ‘ κ°ν μμ μκ΄κ΄κ³λ₯Ό, 0μ κ°κΉμΈμλ‘ μκ΄κ΄κ³κ° μμμ μλ―Έν©λλ€.
import pandas as pd
from scipy.stats import pearsonr
data = pd.DataFrame({
'x': [1, 2, 3, 4, 5],
'y': [2, 3, 5, 7, 11]
})
pearson_corr, _ = pearsonr(data['x'], data['y'])
print(f'νΌμ΄μ¨ μκ΄ κ³μ: {pearson_corr}')
# νΌμ΄μ¨ μκ΄ κ³μ: 0.9722718241315029
μ€νΌμ΄λ§ μμ μκ΄ κ³μ (Spearman's Rank Correlation Coefficient)
- λ λ³μ κ°μ λΉμ ν κ΄κ³λ₯Ό μΈ‘μ νλ μ§νλ‘, λ°μ΄ν°μ μμλ₯Ό κΈ°λ°μΌλ‘ κ³μ°ν©λλ€.
- -1μμ 1 μ¬μ΄μ κ°μ κ°μ§λ©°, νΌμ΄μ¨ μκ΄ κ³μμ μ μ¬ν μλ―Έλ₯Ό κ°μ§λλ€.
from scipy.stats import spearmanr
spearman_corr, _ = spearmanr(data['x'], data['y'])
print(f'μ€νΌμ΄λ§ μμ μκ΄ κ³μ: {spearman_corr}')
# μ€νΌμ΄λ§ μμ μκ΄ κ³μ: 0.9999999999999999
μΈκ³Όκ΄κ³ (Causality)
μΈκ³Όκ΄κ³λ ν λ³μ(μμΈ)μ λ³νκ° λ€λ₯Έ λ³μ(κ²°κ³Ό)μ λ³νλ₯Ό μ λ°νλ κ΄κ³λ₯Ό λνλ λλ€.
- μκ΄κ΄κ³μλ λ¬λ¦¬, μΈκ³Όκ΄κ³λ λ λ³μ κ°μ μ§μ μ μΈ μμΈ-κ²°κ³Ό κ΄κ³λ₯Ό μλ―Έν©λλ€.
μ€ν μ€κ³ (Experimental Design)
- ν΅μ λ νκ²½μμ λ³μλ₯Ό μ‘°μνμ¬ μμΈκ³Ό κ²°κ³Όμ κ΄κ³λ₯Ό μ§μ κ΄μ°°νλ λ°©λ²μ λλ€.
- 무μμ λμ‘° μ€ν(Randomized Controlled Trials, RCT)μ΄ λνμ μΈ μμ λλ€.
- μμ: μ μ½μ ν¨κ³Όλ₯Ό ν μ€νΈνκΈ° μν΄ μ€νκ΅°κ³Ό λμ‘°κ΅°μ 무μμλ‘ λλμ΄ μ½λ¬Ό ν¬μ¬μ ν¨κ³Όλ₯Ό λΉκ΅ν©λλ€.
νκ· λΆμ (Regression Analysis)
- ν λ³μ(μ’ μ λ³μ)μ λν λ€λ₯Έ λ³μ(λ 립 λ³μ)μ μν₯μ μΈ‘μ νμ¬ μΈκ³Όκ΄κ³λ₯Ό μΆλ‘ νλ ν΅κ³μ λ°©λ²μ λλ€.
import statsmodels.api as sm
X = data['x']
Y = data['y']
X = sm.add_constant(X) # μμν μΆκ°
model = sm.OLS(Y, X).fit()
print(model.summary())
OLS Regression Results
==============================================================================
Dep. Variable: y R-squared: 0.945
Model: OLS Adj. R-squared: 0.927
Method: Least Squares F-statistic: 51.86
Date: Thu, 18 Jul 2024 Prob (F-statistic): 0.00552
Time: 07:34:48 Log-Likelihood: -5.6451
No. Observations: 5 AIC: 15.29
Df Residuals: 3 BIC: 14.51
Df Model: 1
Covariance Type: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
const -1.0000 1.013 -0.987 0.396 -4.225 2.225
x 2.2000 0.306 7.201 0.006 1.228 3.172
==============================================================================
Omnibus: nan Durbin-Watson: 1.700
Prob(Omnibus): nan Jarque-Bera (JB): 0.730
Skew: 0.344 Prob(JB): 0.694
Kurtosis: 1.259 Cond. No. 8.37
==============================================================================
Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.
/usr/local/lib/python3.10/dist-packages/statsmodels/stats/stattools.py:74: ValueWarning: omni_normtest is not valid with less than 8 observations; 5 samples were given.
warn("omni_normtest is not valid with less than 8 observations; %i "
κ²½λ‘ λΆμ (Path Analysis)
- μ¬λ¬ λ³μ κ°μ μΈκ³Όκ΄κ³λ₯Ό λμμ λΆμνμ¬ μΈκ³Ό κ²½λ‘λ₯Ό μΆλ‘ νλ λ°©λ²μ λλ€.
- ꡬ쑰 λ°©μ μ λͺ¨λΈλ§(Structural Equation Modeling, SEM)λ μ΄μ ν¬ν¨λ©λλ€.
import pandas as pd
import numpy as np
from statsmodels.graphics.tsaplots import plot_pacf
import matplotlib.pyplot as plt
# μμ λ°μ΄ν° μμ±
data = pd.DataFrame({
'x': np.random.randn(50) # 50κ°μ μμμ λ°μ΄ν° μμ±
})
# μκ³μ΄ λ°μ΄ν°μ λΆλΆ μκΈ°μκ΄ν¨μ(PACF) λΆμ
lags = min(len(data['x']) // 2 - 1, 20)
plot_pacf(data['x'], lags=lags)
plt.show()
μκ΄κ΄κ³μ μΈκ³Όκ΄κ³λ λκ° λ€λ₯Έκ°μ?
μκ΄κ΄κ³ (Correlation)
μκ΄κ΄κ³λ λ λ³μ κ°μ κ΄κ³λ₯Ό μμΉμ μΌλ‘ μ€λͺ νλ μ§νλ‘,
ν λ³μμ λ³νκ° λ€λ₯Έ λ³μμ λ³νμ μ΄λ»κ² μ°κ΄λμ΄ μλμ§λ₯Ό λνλ λλ€.
κ·Έλ¬λ μκ΄κ΄κ³λ λ λ³μ κ°μ μΈκ³Όκ΄κ³λ₯Ό μ€λͺ νμ§λ μμ΅λλ€.
μ¦, μκ΄κ΄κ³κ° μλ€κ³ ν΄μ ν λ³μκ° λ€λ₯Έ λ³μλ₯Ό μ§μ μ μΌλ‘ μ λ°νλ€κ³ κ²°λ‘ μ§μ μ μμ΅λλ€.
- μ μ: λ λ³μ κ°μ κ΄κ³λ₯Ό μμΉμ μΌλ‘ μ€λͺ .
- μ€λͺ : μκ΄κ΄κ³λ λ³μ κ°μ μ°κ΄μ±μ λνλ΄μ§λ§, μΈκ³Όκ΄κ³λ₯Ό μ€λͺ νμ§ μμ.
- μμ: μμ΄μ€ν¬λ¦Ό ν맀λκ³Ό μμμ₯ μ¬κ³ 건μ κ°μ μκ΄κ΄κ³. λ λ³μλ λͺ¨λ μ¬λ¦μ² μ μ¦κ°νμ§λ§, μμ΄μ€ν¬λ¦Ό ν맀λμ΄ μμμ₯ μ¬κ³ λ₯Ό μ§μ μ λ°νμ§λ μμ.
μΈκ³Όκ΄κ³ (Causality)
μΈκ³Όκ΄κ³λ ν λ³μ(μμΈ)μ λ³νκ° λ€λ₯Έ λ³μ(κ²°κ³Ό)μ λ³νλ₯Ό μ§μ μ μΌλ‘ μ λ°νλ€λ κ²μ μλ―Έν©λλ€.
μΈκ³Όκ΄κ³λ₯Ό μ¦λͺ νκΈ° μν΄μλ μ€ν μ€κ³, νκ· λΆμ, κ²½λ‘ λΆμ λ±μ λ°©λ²μ μ¬μ©νμ¬ λ³μ κ°μ μ§μ μ μΈ μμΈ-κ²°κ³Ό κ΄κ³λ₯Ό λ°νμΌ ν©λλ€.
- μ μ: λ³μ Aμ λ³νκ° λ³μ Bμ λ³νλ₯Ό μ§μ μ μΌλ‘ μ λ°ν¨.
- μ€λͺ : μΈκ³Όκ΄κ³λ λ λ³μ κ°μ μμΈκ³Ό κ²°κ³Όμ κ΄κ³λ₯Ό μ€λͺ .
- μμ: ν‘μ°κ³Ό νμ λ°μλ₯ κ°μ μΈκ³Όκ΄κ³. μ°κ΅¬λ₯Ό ν΅ν΄ ν‘μ°μ΄ νμ λ°μμ μ§μ μ μΈ μμΈμμ μ¦λͺ ν¨.
μκ΄κ΄κ³ μ€μ μμ (Example)
- μμ΄μ€ν¬λ¦Ό ν맀λκ³Ό μμμ₯ μ¬κ³ 건μ κ°μ μκ΄κ΄κ³.
- μ€λͺ
: μ¬λ¦μ² μ μμ΄μ€ν¬λ¦Ό ν맀λμ΄ μ¦κ°ν λ μμμ₯ μ¬κ³ 건μλ μ¦κ°νλ κ²½ν₯μ΄ μμ΅λλ€.
- μ΄λ λ λ³μ κ°μ μκ΄κ΄κ³κ° μμμ λνλ΄μ§λ§, μμ΄μ€ν¬λ¦Ό ν맀λμ΄ μμμ₯ μ¬κ³ λ₯Ό μ§μ μ μΌλ‘ μ λ°νλ€κ³ κ²°λ‘ μ§μ μλ μμ΅λλ€.
- λ λ³μλ λͺ¨λ λμ΄ λ μ¨λΌλ 곡ν΅λ μΈλΆ μμΈμ μν΄ μν₯μ λ°μ΅λλ€.
import matplotlib.pyplot as plt
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
ice_cream_sales = [20, 25, 30, 40, 60, 80, 100, 90, 70, 50, 30, 20]
pool_accidents = [1, 1, 2, 3, 5, 7, 9, 8, 6, 4, 2, 1]
plt.plot(months, ice_cream_sales, label='Ice Cream Sales')
plt.plot(months, pool_accidents, label='Pool Accidents')
plt.xlabel('Month')
plt.ylabel('Count')
plt.title('Ice Cream Sales vs Pool Accidents')
plt.legend()
plt.show()
μΈκ³Όκ΄κ³ μ€μ μμ (Example)
- ν‘μ°κ³Ό νμ λ°μλ₯ κ°μ μΈκ³Όκ΄κ³.
- μ€λͺ : μ°κ΅¬μ μ€νμ ν΅ν΄ ν‘μ°μ΄ νμ λ°μμ μ§μ μ μΈ μμΈμμ΄ μ¦λͺ λμμ΅λλ€.
- μ΄λ ν‘μ°μ΄ νμ λ°μμ μ§μ μ μΌλ‘ μ λ°νλ μΈκ³Όκ΄κ³κ° μμμ λνλ λλ€.
- ν‘μ°μ νλ μ¬λλ€μ΄ λΉν‘μ°μλ€μ λΉν΄ νμ λ°μλ₯ μ΄ μ μλ―Ένκ² λλ€λ κ²°κ³Όλ μΈκ³Όκ΄κ³λ₯Ό λ·λ°μΉ¨ν©λλ€.
import matplotlib.pyplot as plt
groups = ['Non-smokers', 'Smokers']
lung_cancer_rates = [10, 70] # λ¨μ: 100,000λͺ
λΉ λ°μλ₯
plt.bar(groups, lung_cancer_rates, color=['blue', 'red'])
plt.xlabel('Group')
plt.ylabel('Lung Cancer Rate')
plt.title('Lung Cancer Rates: Smokers vs Non-smokers')
plt.show()
λΉμ¦λμ€ μμ¬κ²°μ μμμ μμ©
μκ΄κ΄κ³μ μμ©
μκ΄κ΄κ³λ₯Ό ν΅ν΄ λΉμ¦λμ€ λ°μ΄ν°μμ ν¨ν΄κ³Ό νΈλ λλ₯Ό μλ³ν μ μμ΅λλ€.
μ΄λ λ°μ΄ν° κ°μ κ΄κ³λ₯Ό μ΄ν΄νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ μμΈ‘νκ³ μ λ΅μ μΈμ°λ λ° μ€μν μν μ ν©λλ€.
- λΉμ¦λμ€ λ°μ΄ν°μμ ν¨ν΄κ³Ό νΈλ λ μλ³: μκ΄κ΄κ³λ₯Ό λΆμν¨μΌλ‘μ¨ λ³μ κ°μ κ΄κ³λ₯Ό νμ νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ λ―Έλμ νΈλ λλ₯Ό μμΈ‘ν μ μμ΅λλ€. μ΄λ μ ν ν맀 μμΈ‘, μμ₯ λν₯ λΆμ, κ³ κ° νλ λΆμ λ±μ μ μ©ν©λλ€.
- μ€λ¬΄ μμ
- μ ν ν맀 μμΈ‘: νΉμ μμ¦ λμμ ν맀 λ°μ΄ν°λ₯Ό λΆμνμ¬ ν₯ν ν맀λμ μμΈ‘νκ³ , μ¬κ³ κ΄λ¦¬ λ° μμ° κ³νμ μ΅μ νν μ μμ΅λλ€.
- μμ₯ λν₯ λΆμ: μμ λ―Έλμ΄ λ°μ΄ν°λ₯Ό λΆμνμ¬ μλΉμ κ΄μ¬μ λ³νλ₯Ό νμ νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ λ§μΌν μ λ΅μ μ‘°μ ν μ μμ΅λλ€.
μΈκ³Όκ΄κ³μ μμ©
μΈκ³Όκ΄κ³λ₯Ό ν΅ν΄ λ§μΌν μΊ νμΈ, μ μ± λ³κ²½ λ±μ ν¨κ³Όλ₯Ό λΆμν μ μμ΅λλ€.
μ΄λ νΉμ λ³νκ° λΉμ¦λμ€ κ²°κ³Όμ λ―ΈμΉλ μν₯μ μ΄ν΄νκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ μμ¬κ²°μ μ λ΄λ¦¬λ λ° νμμ μ λλ€.
- λ§μΌν μΊ νμΈ, μ μ± λ³κ²½ λ±μ ν¨κ³Ό λΆμ: μΈκ³Όκ΄κ³λ₯Ό λΆμν¨μΌλ‘μ¨ νΉμ μ λ΅μ΄λ λ³νκ° μ€μ λ‘ μ΄λ€ μν₯μ λ―Έμ³€λμ§ νκ°ν μ μμ΅λλ€. μ΄λ₯Ό ν΅ν΄ ν¨κ³Όμ μΈ μ λ΅μ μ μ§νκ³ , λΉν¨μ¨μ μΈ μ λ΅μ κ°μ ν μ μμ΅λλ€.
- μ€λ¬΄ μμ
- λ§μΌν μΊ νμΈ ν¨κ³Ό λΆμ: μλ‘μ΄ λ§μΌν μΊ νμΈμ ν¨κ³Όλ₯Ό μΈ‘μ νμ¬, μΊ νμΈμ΄ λ§€μΆ μ¦κ°μ λ―ΈμΉ μν₯μ νκ°νκ³ , μ±κ³΅μ μΈ μΊ νμΈ μ λ΅μ λ°λ³΅ν μ μμ΅λλ€.
- μ μ± λ³κ²½ ν¨κ³Ό λΆμ: μλ‘μ΄ μ μ± λμ ν, κ³ κ° λ§μ‘±λμ 맀μΆμ λ―ΈμΉ μν₯μ λΆμνμ¬ μ μ± μ ν¨κ³Όλ₯Ό νκ°νκ³ , νμν μ‘°μΉλ₯Ό μ·¨ν μ μμ΅λλ€.
λ°μν
'π Data Analysis' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[Data Analysis] μκ³μ΄ λ°μ΄ν° & λ€λ³λ λΆμ (0) | 2024.07.21 |
---|---|
[Data Analysis] κ°μ€ κ²μ κ³Ό A/B Test, μλλ¦¬μ€ (0) | 2024.07.20 |
[Data Analysis] λ°μ΄ν°μ μ’ λ₯μ μμ± & λ°μ΄ν° νμ (EDA) (0) | 2024.07.18 |
[Data Analysis] Data Analysis - λ°μ΄ν° λΆμ (0) | 2024.07.17 |
[Data Analysis] λ°μ΄ν° μ μ²λ¦¬ (Data Pre-Processing) (0) | 2024.07.12 |