본문 바로가기

데이터분석/전처리6

mixup기법 Mixup은 데이터 증강(Data Augmentation) 기법 중 하나로, 학습 데이터의 다양성을 높이는 데 도움을 줍니다. Mixup은 기존의 두 개의 무작위 샘플 데이터를 선형적으로 결합하여 새로운 학습 샘플을 생성하는 방식입니다. Mixup 기법은 다음과 같은 과정으로 이루어집니다: 두 개의 임의의 샘플 (x_1, y_1) 및 (x_2, y_2)를 데이터셋에서 선택합니다. x는 입력 데이터이고, y는 해당되는 레이블입니다. 랜덤한 하이퍼파라미터 α(alpha)를 사용하여 베타 분포를 따르는 랜덤한 숫자 λ(lambda)를 샘플링합니다 (0 2023. 8. 1.

nan값 확인 pd.isna(x) 를 사용해보자. 2023. 5. 5.

groupby를 dataframe으로 바꾸기 df_last.groupby(["전용면적",'연도'])["평당분양가격"].mean() #시리즈 형태로 나온다. df_last.groupby(["전용면적",'연도'])["평당분양가격"].mean().to_frame() #데이터프레임으로 나오는데 더 전처리하기 어려운형태로 나오기때문에 index reset이 필요 df_last.groupby(["전용면적",'연도'])["평당분양가격"].mean().to_frame().reset_index() index_reset 2023. 3. 30.

피처(feature)가 3개이상일때 데이터프레임 원핫인코딩 적용 import seaborn as sns df = sns.load_dataset('titanic') df_sns = df[['sex','embarked','class']] df_sns df_1= pd.get_dummies(df_sns) df_1 2023. 3. 21.

이전 1 2 다음

티스토리툴바