본문 바로가기

전체 글

(22)
[삼성 SDS Brightics] 개인 분석 과제 - 2. EDA 탐색적 데이터 분석 Exploratory Data Analysis (2) 안녕하세요, 은서예요! ^_^ 오늘은 개인 분석 미션 세 번째 포스팅 을 들고 왔습니닷 이게 맞는 건지,, 많은 고민이 있지만 그걸 '혼자서' 파헤쳐 나간다는 게 참 의미 있는 일인 것 같아요 멘토님께서도 하나부터 열까지 혼자서 분석해 나가는 일 자체가 의미 있을 거라고 조언해 주셨으니 이번 포스팅도 힘내 봅시당 파이팅 (ノ・∀・)ノ ​ ​ 데이터 타입 살펴보기 먼저 저번 포스팅에서는 어떤 변수가 있는지 살펴보았었죠? 이번에는 그 변수들을 면밀히! 파헤쳐 봅시닷 ​ 이해를 돕기 위해 변수를 정리했던 내용을 가지고 왔어요 ​ ID : 소비자 ID Year_Birth : 출생년도 Education : 교육 수준 Marital_Status : 혼인 여부 Income : 수입 Kidhome : 가정 내 아이 수..
[삼성 SDS Brightics] 개인 분석 과제 - 2. EDA 탐색적 데이터 분석 Exploratory Data Analysis (1) 안녕하세요, 은서예요! 오늘은 개인 분석 과제의 두 번째 포스팅, 편입니다 짝짝 저번 포스팅에서는 분석 주제를 정하고 데이터를 다운받았었죠 ? 이번에는 데이터를 로드하고 컬럼들을 자세히 살펴보는 시간을 가지겠습니다! 바로 가 보실ㄱㄱ ㅏ 요 ? EDA EDA (Exploratory Data Analysis) 탐색적 데이터 분석 저는 서포터즈를 시작하기 전에는 EDA가 무엇인지도 몰랐습니다,, 하지만 EDA는 데이터 분석에서 아주 중요한 단계죠! ​ EDA의 필요성, 중요성은 무엇일까요? ​ 탐색적 데이터 분석 단계에서 데이터의 통계량 및 분포 등을 검토함으로써 데이터를 더 잘 이해하고 문제를 발견할 수 있습니다 본격적인 분석에 들어가기 전에! 추가적으로 데이터를 수집할 수도 있고, 가설을 수정할 수도 있..
[삼성 SDS Brightics] 개인 분석 과제 - 1. 분석 주제 선정 (Kaggle Datasets 활용하기!) 안녕하세요, 은서예요! 이번에는 개인 분석 과제로 돌아왔습니다 . . . 호달달 Brightics 서포터즈를 끝마칠 때까지 아주 긴 기간에 걸쳐 진행하는 과제라 그런지 부담감이 장난 아니네욥 흑 ㅠ ​ 하지만 개인의 역량에 맞추어서 데이터 분석을 하라는 사무국의 미션에! 저도 제 역량에 맞추어서 성장하는 시간을 가져 보려고 합니다 ㅎ ㅎ 그럼 데린이 탈출은 가능하지 않을까요 ?! ​ 주제 선정하기 ㅜ.ㅜ 첫 주차는 가볍게 주제 선정 시간이었습니다만 , , 전혀 가볍지 않았습니다 ㅠ.ㅠ 주제를 선정하는 일이 여간 까다로운 게 아니더라구요 주제가 마음에 들면 데이터셋이 그닥이고, 데이터셋이 괜찮나 싶으면 전혀 관심 없는 주제고 휴 일단 시작이 반이니까 ! 데이터셋을 빨리 정해 버린 뒤 마인드맵을 그려 나가는..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 03. 영상 제작 & 보고서 제출 안녕하세요, 은서예요! 오늘도 어김없이 포스팅을 올리러 왔슴니다 춍춍,, 오늘은 조금 슬픈 소식을 전해야겠는데요 ㅜ.ㅜ 약 두 달 간의 팀 프로젝트가 이번 포스팅을 끝으로 막을 내릴 것 같습니다............ 너무 슬프네요 ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ 코로나 때문에 영상 촬영 이후로 한 번을 못 만나고,, 이렇게 마무리하게 된 게 ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ 하지만 저희 조는 꼭 코로나가 풀리면 회식을 하기로 다짐했슴니다 꼭 만나요 (제발) .·´¯`(>▂
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 02. 회귀 모형 적합(2) / Kaggle도 Brightics로! 안녕하세요, 은서예요! ㅎ.ㅎ 이제 팀 분석 과제의 막바지에 도달했습ㄴㅣ다 오늘은 저번 포스팅에 이어서 모델링을 마무리하고, Kaggle competition에 제출하는 방법까지 보여 드릴게요 파이팅 (ง•̀_•́)ง ​ 1. Linear Regression 저번 포스팅에서 전처리를 마쳤던 Train 데이터로 Linear Regression을 진행해 주었어요! Feature Column -> 독립변수, Label column -> 종속변수를 넣어 주세요 ​ 결과 화면 일부 결과 화면인데요! R-squared 외에도 여러 수치들을 확인할 수 있습니다 ㅎ.ㅎ 그리고 또 한 가지 중요하게 다룬 것은 바로 VIF입니다 ​ 그런데, VIF란 무엇일까요? ​ VIF가 무엇인지 알기 전에 다중공선성을 먼저 알 필요가..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 02. 회귀 모형 적합(1) / Kaggle도 Brightics로! 대표사진 삭제 사진 설명을 입력하세요. 안녕하세요, 은서예요! 이번 주도 어김없이 팀 분석 과제로 돌아왔습니다 ㅎ.ㅎ 저번 포스팅에서는 제 나름대로의 전처리 방식을 Brightics로 구현해서 보여 드렸다면, 이번에는 팀 회의 결과로 나온 EDA&데이터 전처리와 모델링을 보여 드리려고 합니다 그 전에! 브라이틱쓰리 조의 홍보 영상이 드디어 올라왔습니다 ㅎ.ㅎ 열심히 만든 영상이니 모두 링크 한 번씩 클릭해 주시고 댓글도 달아 주세요 ㅜ.ㅜ 저는 온 단톡방과 SNS에 홍보를 열시미 돌렸답니다,,, 친구들아 고마워 ! https://www.youtube.com/watch?v=GjWg866IvYE&t=16s 1. 수치형 변수 정리 저희 팀은 이렇게 구글 공유 문서를 이용해서 모든 변수의 처리 방법을 논의했습니..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 01. 데이터 전처리 / Kaggle도 Brightics로! ​ 안녕하세요, 은서예요 !_! Brightics 포스팅은 정말 오랜만이죠 ?! 지난주부터 !팀 분석 미션! 과제에 돌입하게 되어서 그동안 데이터 분석 계획서를 작성하고 있었답니다 데린이 홍은서,, 과연 잘 할 수 있을지,, 걱정이 많이 되지만,, 이번 주차는 데이터 전처리 과정까지 보여 드릴 예정이니 지켜봐 주세요~ ​ 이번 데이터 분석 미션의 주제는 1) 캐글 Competition Brightics로 도전하기(필수) 2) 공개 데이터셋 활용한 분석 프로젝트(추가선택) 두둥 ​ 저희 브라이틱쓰리(three)조는 먼저 캐글 Competition의 주제를 정해 봤습니다! 고민 고민 끝에 정해진 주제는 https://www.kaggle.com/c/house-prices-advanced-regression-t..
[삼성 SDS Brightics] 팀 미션 두 번째! Brightics 홍보 영상 제작 - 02. 멀고도 먼 영상 편집의 길 ​ 안녕ㅎㅏ세요, 은서예요! 저는 지금 막 편집을 마치고 돌아왔답니다,, ^_^ 편집할 때마다 느꼈던 것: 유튜버들 정말 대단하다 저도 한때 유튜버를 꿈꿨었는데,,,,,,,,,, 조금 더 고민해 볼게요 이제 영상 제출도 얼마 안 남았겠다 ! 브라이틱쓰리의 영상 제작기를 풀어 보려고 합니다 ㅎ.ㅎ 정말,, 정말,, 저희 팀원들 고생 많았거든요 ㅜ 그래도 끝까지 고생해 준 팀원들에게 박수 짝짝 1. 영상 편집 시-작 저희는 줌 회의를 정말 정말 많이 했는데요! 거의 하루에 한 번 회의를 했기 때문에 친구들보다도 많이 만났다고 할 수 있쬬 zoom모음.jpg 브라이틱쓰리 고생 많았ㄷㄷㅏ... ​ 줌 회의를 통해서 편집 툴을 다빈치 리졸브로 정하고! 모두가 편집에 참여하기로 결정했습니닷 다들 본격적인 영상 편집..