목록Python (51)
개발은 처음이라 개발새발
오늘은 책을 한권 소개해볼까합니다. 보통 파이썬을 처음 공부하고자 마음 먹을 때, 특히 저와 같이 일을 하면서 필요성을 느껴 공부를 해보고자 할 때는 주변 지식이 없기에 무엇부터 시작해야 할지 꽤나 막막합니다. 그래서 이것저것 sns에서 광고하는 파이썬 강의 사이트를 찾아보며 이것저것 강의를 듣게 되는데요. 하지만 이렇게 시작하게 되면 금방 흥미를 잃어 강의를 완강하기가 꽤나 힘들더라고요. 왜냐하면 첫 번째로 일에 대한 필요성을 느껴 시작하게 됐다는 것은 내가 하는 실무에 바로 적용하길 원하다는 뜻인데, 사람들은 수많은 일을 하고 파이썬 다양한 곳에서 활용되고 있어 저에게 딱맞는 수업과 예제를 풀어보기란 정말 어렵습니다. 그리고 바로 실전에 활용하는 수업을 듣게 되면 기본 지식에 굉장히 소홀한 수업을 듣..
파이썬을 공부하면서 저는 개인적으로 조건문과 반복문을 이해하는 게 굉장히 어려웠습니다. 물론 지금도 완벽하게 알지 않지만 백준 단계별 문제 풀이를 통해서 알고리즘을 이해해 나가고 있는데요. 오늘은 백준 단계별 문제 풀이 반복문 챕터 중 두 문제에 대해 간단한 포스팅을 해볼까 합니다. 우선 2741번 문제입니다. 해당 문제는 매우 간단하게 n이라는 변수에 숫자를 입력하고 입력한 숫자만큼 순차적으로 표출 시키면 됩니다. 간단하니 바로 코드를 입력해 결과를 확인해보겠습니다. 저는 n에 예제와 달리 10을 넣어보겠습니다. 옳은 방법이라면 1부터 10까지 나오겠죠? n = int(input()) for i in range(1,n+1): print(i) 네 이렇게 1부터 10까지 숫자가 나왔습니다. 그렇다면 거꾸로..
지난 편에서는 한글 폰트를 사용했을 때 발생하는 오류를 해결했습니다. 이번 시간에는 matplotlib에서 제공하는 다양한 스타일을 소개하고 그래프를 좀 더 꾸며보기로 하겠습니다. 우선 지난 편에 만들었던 그래플 다시 한번 보겠습니다. 보게 되면 제목과 x,y축에 있는 한글들이 너무 작습니다. 그리고 연도들이 너무 붙어 있어 명확하게 무엇을 의미하는지 확인하기가 힘듭니다. 우선 이 3가지의 문제들을 해결해보겠습니다. 우선 연도부터 건드려보겠습니다. 숫자들이 붙어 있는 것은 크기를 줄여서 해결할 수도 있지만 그렇게 되면 너무 작아 안 보이는 것은 같겠죠. 이럴 때는 숫자의 각도를 변경해 해결할 수 있습니다. 그리고 표의 사이즈 크기를 키우는 것도 하나의 방법이니 모두 적용해보겠습니다. 그래프의 크기를 키우..
import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel('./시도별 전출입 인구수.xlsx', header=0) #빈칸 채워주기 df = df.fillna(method='ffill') #서울에서 다른 지역으로 이동하는 인구수 mask = (df['전출지별'] == '서울특별시') & (df['전입지별'] != '서울특별시') df_seoul = df[mask] df_seoul = df_seoul.drop(['전출지별'], axis=1) #불필요한 전출지별 제게 df_seoul.rename({'전입지별':'전입지'}, axis=1, inplace=True) #컬럼명 변경 df_seoul.set_index('전입지', inplace=Tr..
지난 시간에는 df.plot()을 이용해 여러 그래프를 그려봤는데요. 이번 시간에는 또다른 그래프 라이브러리인 maplotlib를 활용해 그래프를 그려보겠습니다. matplotlib는 "파이썬의 표준 시각화 도구"라고 부를 수 있을 정도로 평면 그래프와 관련해 다양한 포맷과 기능을 지원합니다. 또한 객체지향 프로그래밍을 지원해 그래프 요소를 세세하게 꾸밀 수 있는 장점 또한 가지고 있습니다. matplotlib 설명은 여기까지 하고 본격적으로 matplotlib를 이용해 그래프를 그려 보도록하겠습니다. matplotlib를 실행시키기 위해서는 import를 해야 겠죠? 이번에 활용할 데이터프레임은 시도별 전출입 인구수입니다. 코드를 진행해보겠습니다. import pandas as pd import mat..
반복문을 활용한 합을 구하는 문제입니다. 문제를 쭉 읽어보면 n이라는 숫자가 주어졌을 때 1부터 n까지의 합산을 반복문을 통해 구해보라는 것인데요. 예제 1의 3을 입력했더니 출력이 6이 나오는 것을 감안했을 때 "1 + 2 + 3 = 6" 을 의미하는 것을 알 수 있습니다. 그렇다면 일단 n의 변수를 만들어야 겠죠? input() 함수를 활용할 것이고 연산을 해야 하기 때문에 int를 씌어야 합니다. 코드를 진행해 보겠습니다. n = int(input()) 변수 n을 만들었으니 반복문을 작성하기 전에 또 하나 만들어야 할게 있습니다. n은 어디까지나 반복문의 범위를 지정해주는 변수이기 때문에 반복문을 통해 더해질 변수를 하나더 적어야 합니다. 그 변수는 반복문을 통해 처음 더해졌을 때 1이 되어야 하니..
1, 2편에서는 선그래프에 대해 배웠다면 이제는 그래프의 다양한 종류에 대해 알아보겠습니다. df.plot 매소드를 통해서 여러 그래프를 만들 수 있는데요. 판다스에 내장된 그래프 종류는 아래와 같습니다. 선 그래프는 df.plot()을 통해서 바로 나올 수 있지만, 다른 그래프 종류들은 그렇지 않습니다. 다른 그래프를 그리기 위해서는 괄호 안에 " kind = " 옵션을 추가해 적용해야 합니다. 지난 시간에 사용한 남북한 발전전량합계 자료를 가지고 막대 그래프를 한번 그려보겠습니다. 코드는 아래와 같습니다. import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel('./남북한발전전력량.xlsx', engine='openpyxl') #..
지난 1편에서(데이터프레임 그래프 그리기 - 1 https://data-so-hard.tistory.com/17) 그래프는 완성했지만 시각적으로 명확하게 데이터의 차이를 보여줬다고 볼순 없었는데요. 1편에서의 최종 코드와 그래프를 다시 한번 보겠습니다. import pandas as pd import matplotlib.pyplot as plt df = pd.read_excel('./남북한발전전력량.xlsx', engine='openpyxl') # 데이터프레임 변환 print(df) print('\n') df_ns = df.iloc[[0,5], 3:] # 남북한 연도별 발전전량 합계 추출 df_ns.index = ['South', 'North'] # 행 인덱스 변경 print('\n') print(df_..
판다스는 데이터 분석뿐만 아니라 그래프를 통해 데이터의 시각화 역시 가능한 라이브러리인대요. 이번 시간에는 "df.plot()" 을 통해 데이터프레임의 데이터를 시각화 그래프로 표현하는 법을 배우겠습니다. 그렇다면 우선 데이터를 먼저 불러와야 겠죠. 지난 판다스 데이터 분석 자료실을 소개드린 적이 있는데요. 그중 "남북한발전전량.xlsx"을 활용해보겠습니다. 자료실이 궁금하신 분들은 아래의 링크를 통해 확인해주세요. https://data-so-hard.tistory.com/15 파이썬 머신러닝 판다스 데이터 분석 자료실 오늘은 파이썬 교재 중 데이터 분석에 필요한 판다스에 대해 공부할 수 있는 교재와 예제를 다운 받을 수 있는 사이트를 추천드리려고 합니다. 우선 교재는 아래의 링크에 해당하는 교재입니다..
문제를 읽어보면 반복문을 통해 A+B의 값을 출력해야 하는 한다는 것과 반복문 전에 T라는 계수. 즉, T라는 변수를 만들어야 한다는 것을 알 수 있습니다. 그리고 예제 입력과 출력을 보게 되면 예제 입력 맨위에 5가 있고 이후에는 두개씩 짝지은 숫자들 5쌍이 보입니다. 그리고 예제 출력에는 두개씩 짝지은 숫자들의 더하기 결과물들이 보입니다. 이를 통해 알 수 있는 건 T는 반복문의 범위가 된다는 것을 알 수 있습니다. 코드를 한번 작성해보겠습니다. T = int(input()) for i in range(T): 이렇게 범위까지 만들었는데요. 반복문 안에 들어갈 것들은 이전에도 많이 다뤘던 변수 A,B를 한번에 input과 정수화를 시켜야 한다는 것, 이 두변수의 합을 프린트해야 한다는 것입니다. 결과입..