[SKN FAMILY AI CAMP]/주간

🐉 SKN FAMILY AI CAMP 13기 4주차 후기 (2025.04.14 ~ 2025.04.18)

ki-june 2025. 4. 18. 19:27

📍 간단 후기

🏷️  수업

이번 주 부터는 VSCode에서 수업이 진행됐다. 데이터 분석에서 가장 중요한 Pandas와 Matplotlib에 대해 배웠다. 기대했던 것 만큼 배울 때 성취도도 큰 한주 였던 것 같다. Pandas에서 DataFrame을 어떻게 활용하는지, Series를 시각화 하는 법이나 원하는 값에 대해 CRUD를 해보기도 했다. Matplotlib에서는 선 그래프, 히스토그램, Boxplot 등의 시각화 툴을 사용하며 직접 변화시켜 보았다.

 

🏷️ 코딩 테스트 스터디

 

이번 주에 처음 코딩 테스트 스터디를 진행했다. 각 조 6명씩 팀을 이뤘다. 우리 조는 팀장이 문제를 배부하고, 팀원들이 일주일 간 문제를 풀어온 후 각자 어떻게 풀었는 지 확인해 보는 방식으로 진행했다. 각자 푸는 방법이 다르고, 접근 방식이 달라 스터디 시간이 생각보다 꽤 길어진다는 것을 깨달았다.

 

 


 

📍 좋았던 점

 

  • Pandas 활용

Pandas 활용 예시

 

사실 Pandas Library 자체를 처음 사용했다. 생소하기도 하고, 처음 보는 함수도 존재하다 보니 강사님의 강의만 무작정 따라 실행했었다. 위 사진에서도 알 수 있듯이, pandas의 별칭을 pd로 준 후 Pandas Library에 있는 메소드들을 사용한다는 것 자체에 의의를 두었다. csv 파일이나 html 파일 등 다양한 형태의 확장자를 가져와 데이터 활용에 사용할 수 있었다. 사실 이 정도는 Python에서 가볍게 사용해 봤던 부분이라 따라갈 만 했었다. 그러나 Pandas 만의 기본 메소드들 중 간편한 메소드들이 있어서 신기했다.

  • head() :  원하는 갯수의 데이터만 뽑아서 확인 할 수 있었다.
  • set/reset_index() : Index의 이름을 처리한다. set을 통해 해당 열이 index 명이 되면서 Data set에서 제거된다. / reset을 통해 해당 열을 첫 번째 열로 다시 복원한다.
  • loc/iloc() : 행을 조회한다. loc을 통해 index 이름으로 조회 가능하다. / iloc을 통해 행 번호로 조회 가능하다.

Pandas query 문 활용 예시

  • Pandas Library에서 sql문 처럼 query 메소드가 있는 것이 신기했다. 거의 Boolean indexing이 주 목적이었지만, 평소 sql에 친숙했던 터라 더욱 반가웠다고 생각한다.

 

  • Pandas Library : Fancy indexing

Fancy indexing 활용 예시

 

사실 Pandas에서 가장 활용하기 편한 방법이 Fancy indexing 이라고 생각한다. List 형태로만 원하는 값들을 지정하면 바로 조회가 된다는 것이 편리한 기능이다. 다만 원하는 데이터의 이름을 정확히 입력해야 한다는 점이 함정이다. 그렇지만 잘만 활용하면 많은 곳에서 꽤 유용하게 쓰일 수 있을 것 같다는 생각이 들었다.

 

 


 

📍 부족한 점

 

  • Matplitlib 주요 그래프

Matplitlib 활용 예시

 

대학교 때 Matlab을 통해 많이 활용해 봐서 다 안다고 생각했다. 아는 사람은 알 만한 Lena 이미지나 고릴라(?) 이미지 활용할 때 좌표 찾기에 고생해 본 사람이라면 공감할 수도 있다. plot을 사용해서 눈 가리기나 얼굴 blur 처리하기 등을 해보며 '이제 지겹다...그만해야지...' 생각했던 것 같다. 오랜만에 활용해 보고 배워보니 모르던 기능들이 많이 존재했다.

 

  • legend() : 데이터 값에 이름을 붙일 수 있다. loc()를 통해 어디를 기준점으로 박스를 만들 지 정할 수도 있다.
    • bbox_to_anchor() : 좌표 기준점에서부터 크기를 어떻게 할 지 정할 수 있다.
  • rotation() : 데이터 이름들의 각도를 조절해 많은 양의 데이터들이 겹치지 않을 수 있게 조정할 수 있다.

 

  • Pandas Library 활용

Todo 예시

 

파일로 따지자면 01~04번까지 Pandas Library 활용 및 실습 파일이였다. 그러나 Todo 문제는 02 파일 하나밖에 없었다. Pandas를 처음 사용하는 입장에서, 또 기대했던 입장에서 직접 활용해 볼 수 있는 예제가 적어서 아쉬웠다. 이 부분은 나눠준 책을 보면서 따로 학습해 볼 필요가 있겠다고 느꼈다. 02 파일에 있는 Todo 문제 푸는 것만 해도 나름 신기한 경험이었다.

 

 

 


 

 

📍 성찰 및 마무리

 

수업은 수업 대로 잘 듣고 있다고 생각한다. 5일 중 3일 이상은 1시간이라도 남아서 공부하고 가려고 노력 하고 있다. 물론 운동 시간도 생각해야 되는 것도 있다. 수업 때 이해가 안가거나, 막히는 부분이 있다면 강사님께 바로바로 질문하는 것도 이젠 서슴없이 한다. 다만 좀 더 수업에 집중해 볼 필요가 있다고 느껴 태블릿을 가져와 뭐라도 끄적이기 시작했다. 성과가 보이면 좋겠다.

 

코딩테스트 스터디가 처음 시작되었는데, 조장을 맡은 만큼 진행 방법에 고민이 많아지는 것 같다. 이번 주엔 백준 기준 브3~실5문제를 배부했다. 조원 분들의 실력에 맞춰 점점 늘려가면서 고민해보는 시간을 가져야 할 것 같다. 매주 월요일마다 스터디가 진행되는 만큼, 주말 동안 고심해야겠다.

 

거의 한 달이 다 되어가는 시기이다. 이제 점차 친해질 사람은 친해지고, 쉬는시간에도 제법 시끌벅적하다. 분위기도 분위기지만, 각자 원하는 결과를 얻었으면 좋겠다.