본문 바로가기

데이터분석16

데이터프레임에 바로 원핫인코딩 적용 import pandas as pd df_1 = pd.DataFrame({'이름':['홍길동','김영희','김철수','박철수','오철수','정철수','배철수']}) df_1 pd.get_dummies(df_1) #원 핫인코딩 바로 사용 가능 2023. 3. 21.
원-핫인코딩 from sklearn.preprocessing import OneHotEncoder import numpy as np items = ['TV','냉장고','전자레인지','컴퓨터','선풍기','선풍기','믹서기','믹서기'] print(items) # 2차원 ndarray로 변환 items = np.array(items).reshape(-1,1) print(items) oh_encoder = OneHotEncoder() oh_encoder.fit(items) oh_labels = oh_encoder.transform(items) #OneHotEncoder로 변환된 결과는 희소행렬이므로 toarray()를 이용해 밀집 행렬로 변환 print(oh_labels) print('원-핫 인코딩 데이터') prin.. 2023. 3. 21.
python 데이터프레임 apply함수 d1=pd.read_table('pandas_data3.txt', index_col=0) d2=d1.iloc[:10,1:] d2 def f2(col): col2=col.loc[col%2==1] return col2.sum() d2.apply(f2, axis=0) 2023. 3. 16.
농업인손상요인분석 데이터경진대회 ppt 여기대회 작년에 나간대회인데 코드는 못찾고 ppt만 찾았다 ㅠㅠ.. 후기 학부생 1학년때 나간대회였었는데 여기대회에나가면서 시각화를 해보게되었고 나보다 잘하는 선배분들의 코드와 인사이트를 찾는과정들을보면서 데이터분석이 매력적이고 재미있다는것을 느꼈고 이후에 데이터분석에대해 흥미를 느꼈었다 농업인들이 농사일을하다가 다치는경우가 있는데 이런 주제를 중심적으로 분석을 진행하였다. 분석주제를 각자 하나씩 가지고와서 각자가 원하는 주제로 분석을하고 인사이트를 도출하고 ppt를 만드는식으로 진행을 했었다. 주제가 4개가 나왔었는데 1.성별, 연령별로 본 농업인의 손상 요인분석 2.안전사고 예방 물품 구비 여부와 구비한 물품 개수에 따른 농작업 관련 사고에서의 일하지 못한 일수에 대한 분포 분석 3.농가주민의.. 2023. 3. 13.