목록전체 글 (124)
개발은 처음이라 개발새발

exam_data = {'이름': ['민수', '철수', '광수'], '수학': [80, 90, 100], '영어': [95, 88, 56], '국어' : [72, 85, 95]} df = pd.DataFrame(exam_data) print(df, '\n') 이번에는 데이터 추가하기를 해보겠습니다. 우선 데이터 프레임을 불러오고 추가할 내용을 딕셔너리 형태로 미리 만들어 놓습니다. dj = {"이름":"찰스", "수학":80, "영어":100, "국어":65} df1 = df.append(dj, ignore_index =True) print(df1) 광수 하단에 찰스와 수학,영어,국어 점수가 추가된 것을 확인할 수 있습니다. 데이터 프레임에 새로운 데이터를 추가할 때는 append 함수를 사용하는데요...

우선 데이터 프레임을 만듭니다. import pandas as pd exam_data = {'이름': ['민수', '철수', '광수'], '수학': [80, 90, 100], '영어': [95, 88, 56], '국어' : [72, 85, 95]} df = pd.DataFrame(exam_data, index= ['A','B','C']) print(df) 우선 지난 1편에서 한 loc와 iloc를 활용해 특정 범위 데이터 표출 예시를 해보겠습니다. 이와 함께 광수와 철수의 영어 점수를 변경해보겠습니다. #iloc로 특정 데이터 보여주기 label1 = df.iloc[0 : 2] print(label1, '\n') #loc로 특정 데이터 보여주기 label2 = df.loc['A' : 'C'] print(..
일을 하는 데 있어 간단한 데이터 프레임 혹은 간단한 자료만 만나면 좋겠지만 현실은 시궁창이죠. 설령 간단한 자료를 만났더라도 이를 가지고 무엇인가 코딩을 짜려면 단순하게 이름만 알아선 힘듭니다. 보통은 특정 컬럼의 어느 위치의 데이터를 가지고 작업을 해야 하는데요. 판다스에서는 이를 'loc' 와 'iloc'로 나눕니다. loc: 인덱스 이름(index label) EX) df.loc['a:c'] -> 'a','b','c' iloc: 정수형 위치 인덱스(integer position) EX) df.iloc[3:7] -> 3,4,5,6 loc는 인덱스의 이름이 있을 때 그 이름을 직접 입력하는 방식입니다. iloc는 인덱스의 정수형 위치를 활용하는 방식입니다. 위의 예시를 보면 알겠지만 범위를 지정할 때..

스포츠 데이터를 다루는 직업을 하면서 게임에 적용할 새로운 가공 데이터를 생성하거나 게임 페이지에 표출할 데이터를 만들어야 할 때 항상 패시브로 들어가는 데이터가 있다면 '평균'입니다. 분량이 많지 않다면 엑셀로 간다하게 할수도 있지만 한 선수의 시즌 전체, 더 나아가 해당 시즌에 출전한 모든 선수의 평균을 구해야 한다고 하면 개인 역량상 엑셀 함수만으로 꽤나 막막합니다. 이때 간단한 판다스 코드가 있다면 "groupby(['column']).agg({key: value})" 입니다. 우선 데이터를 불러옵니다. 전 개인적으로 크롤링한 kbl 21/22 정규시즌을 불러오겠습니다. import pandas as pd import numpy as np df = pd.read_excel("kbl.xlsx", s..