본문 바로가기

삼성 SDS Brightics

(20)
[삼성 SDS Brightics] 개인 분석 과제 - 2. EDA 탐색적 데이터 분석 Exploratory Data Analysis (1) 안녕하세요, 은서예요! 오늘은 개인 분석 과제의 두 번째 포스팅, 편입니다 짝짝 저번 포스팅에서는 분석 주제를 정하고 데이터를 다운받았었죠 ? 이번에는 데이터를 로드하고 컬럼들을 자세히 살펴보는 시간을 가지겠습니다! 바로 가 보실ㄱㄱ ㅏ 요 ? EDA EDA (Exploratory Data Analysis) 탐색적 데이터 분석 저는 서포터즈를 시작하기 전에는 EDA가 무엇인지도 몰랐습니다,, 하지만 EDA는 데이터 분석에서 아주 중요한 단계죠! ​ EDA의 필요성, 중요성은 무엇일까요? ​ 탐색적 데이터 분석 단계에서 데이터의 통계량 및 분포 등을 검토함으로써 데이터를 더 잘 이해하고 문제를 발견할 수 있습니다 본격적인 분석에 들어가기 전에! 추가적으로 데이터를 수집할 수도 있고, 가설을 수정할 수도 있..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 03. 영상 제작 & 보고서 제출 안녕하세요, 은서예요! 오늘도 어김없이 포스팅을 올리러 왔슴니다 춍춍,, 오늘은 조금 슬픈 소식을 전해야겠는데요 ㅜ.ㅜ 약 두 달 간의 팀 프로젝트가 이번 포스팅을 끝으로 막을 내릴 것 같습니다............ 너무 슬프네요 ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ 코로나 때문에 영상 촬영 이후로 한 번을 못 만나고,, 이렇게 마무리하게 된 게 ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ ㅠ 하지만 저희 조는 꼭 코로나가 풀리면 회식을 하기로 다짐했슴니다 꼭 만나요 (제발) .·´¯`(>▂
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 02. 회귀 모형 적합(2) / Kaggle도 Brightics로! 안녕하세요, 은서예요! ㅎ.ㅎ 이제 팀 분석 과제의 막바지에 도달했습ㄴㅣ다 오늘은 저번 포스팅에 이어서 모델링을 마무리하고, Kaggle competition에 제출하는 방법까지 보여 드릴게요 파이팅 (ง•̀_•́)ง ​ 1. Linear Regression 저번 포스팅에서 전처리를 마쳤던 Train 데이터로 Linear Regression을 진행해 주었어요! Feature Column -> 독립변수, Label column -> 종속변수를 넣어 주세요 ​ 결과 화면 일부 결과 화면인데요! R-squared 외에도 여러 수치들을 확인할 수 있습니다 ㅎ.ㅎ 그리고 또 한 가지 중요하게 다룬 것은 바로 VIF입니다 ​ 그런데, VIF란 무엇일까요? ​ VIF가 무엇인지 알기 전에 다중공선성을 먼저 알 필요가..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 02. 회귀 모형 적합(1) / Kaggle도 Brightics로! 대표사진 삭제 사진 설명을 입력하세요. 안녕하세요, 은서예요! 이번 주도 어김없이 팀 분석 과제로 돌아왔습니다 ㅎ.ㅎ 저번 포스팅에서는 제 나름대로의 전처리 방식을 Brightics로 구현해서 보여 드렸다면, 이번에는 팀 회의 결과로 나온 EDA&데이터 전처리와 모델링을 보여 드리려고 합니다 그 전에! 브라이틱쓰리 조의 홍보 영상이 드디어 올라왔습니다 ㅎ.ㅎ 열심히 만든 영상이니 모두 링크 한 번씩 클릭해 주시고 댓글도 달아 주세요 ㅜ.ㅜ 저는 온 단톡방과 SNS에 홍보를 열시미 돌렸답니다,,, 친구들아 고마워 ! https://www.youtube.com/watch?v=GjWg866IvYE&t=16s 1. 수치형 변수 정리 저희 팀은 이렇게 구글 공유 문서를 이용해서 모든 변수의 처리 방법을 논의했습니..
[삼성 SDS Brightics] 팀 분석 미션 Kaggle Competition <House Prices> - 01. 데이터 전처리 / Kaggle도 Brightics로! ​ 안녕하세요, 은서예요 !_! Brightics 포스팅은 정말 오랜만이죠 ?! 지난주부터 !팀 분석 미션! 과제에 돌입하게 되어서 그동안 데이터 분석 계획서를 작성하고 있었답니다 데린이 홍은서,, 과연 잘 할 수 있을지,, 걱정이 많이 되지만,, 이번 주차는 데이터 전처리 과정까지 보여 드릴 예정이니 지켜봐 주세요~ ​ 이번 데이터 분석 미션의 주제는 1) 캐글 Competition Brightics로 도전하기(필수) 2) 공개 데이터셋 활용한 분석 프로젝트(추가선택) 두둥 ​ 저희 브라이틱쓰리(three)조는 먼저 캐글 Competition의 주제를 정해 봤습니다! 고민 고민 끝에 정해진 주제는 https://www.kaggle.com/c/house-prices-advanced-regression-t..
[삼성 SDS Brightics] 팀 미션 두 번째! Brightics 홍보 영상 제작 - 02. 멀고도 먼 영상 편집의 길 ​ 안녕ㅎㅏ세요, 은서예요! 저는 지금 막 편집을 마치고 돌아왔답니다,, ^_^ 편집할 때마다 느꼈던 것: 유튜버들 정말 대단하다 저도 한때 유튜버를 꿈꿨었는데,,,,,,,,,, 조금 더 고민해 볼게요 이제 영상 제출도 얼마 안 남았겠다 ! 브라이틱쓰리의 영상 제작기를 풀어 보려고 합니다 ㅎ.ㅎ 정말,, 정말,, 저희 팀원들 고생 많았거든요 ㅜ 그래도 끝까지 고생해 준 팀원들에게 박수 짝짝 1. 영상 편집 시-작 저희는 줌 회의를 정말 정말 많이 했는데요! 거의 하루에 한 번 회의를 했기 때문에 친구들보다도 많이 만났다고 할 수 있쬬 zoom모음.jpg 브라이틱쓰리 고생 많았ㄷㄷㅏ... ​ 줌 회의를 통해서 편집 툴을 다빈치 리졸브로 정하고! 모두가 편집에 참여하기로 결정했습니닷 다들 본격적인 영상 편집..
[삼성 SDS Brightics] 팀 미션 첫 번째! Brightics 홍보 영상 제작 - 01 ​ 안녕하세요, 은서예요! 오랜만에 포스팅을 쓰네욧 ㅎ.ㅎ 그동안 정말 많은 일이 있었슴니다...( •̀∀•́ )✧ ​ 드디어 팀 미션을 하게 되었어요 YEAH !!!!!! 저는 3조로 배정을 받았고,,! 메일을 통한 연락으로 단톡방을 만들게 되었습니닷 첫 만남 & 첫 회의 ㄱㅇㅇ... 다들 훈훈하게 인사를 건네고,, ^_^ 따숩 바로 기획안을 위한 첫 회의를 잡기로 합니다! ​ ​ ​ ​ ​ 성공적으로 첫 회의를 마쳤슴니다 ㅎ.ㅎ 회의를 하면서 다들 정말 능력자시구나,,, 하고 감탄했던 기억이 나네욥 다들 정말 열심히 참여해 주셔서 정말 순조롭게 끝났답니다 ! ​ 저희는 전 기수분들의 영상과는 조금 차별점을 두어서 보다 구체적이고 전문적으로 Brightics의 우수성을 강조하기로 했어요 사무국 측에서도..
[삼성 SDS Brightics] 개인 분석 미션 03. 설문 통계 분석 - 2 / ANOVA 분산분석, Kruskal-wallis 검정, 상관관계 분석하기 ​ 안녕하세요, 은서예요! 저는 종강을 하고 찾아온 방학을 맘껏 누리고 있습니다 ^____^ 공부해야 하는데 참 몸이 따라 주지를 않네요,,? (마음도 안 따라줌) 7월부터 열심히 할 것을 다짐하며 . . . ٩(๑•̀ㅂ•́)و ​ 아쉽지만 이번이 마지막 개인 분석 미션 포스팅이네요 ㅜ.ㅜ 그래도 꽤 의미가 있었지 않나 ~ 싶슴니다 다음 주부터는 팀 활동이라고 해서 너모너모 기대 중이에욥 ​ 그럼 마지막 설문 통계 분석 시작-! 1. One way ANOVA 저번에 성별에 따라 만족도를 비교한 T-검정, 기억나시나요? 이번에는 연령대에 따라서 만족도를 비교해 보려고 합니다! 그리고 제가 사용할 방법은 ANOVA가 되겠습니다 !_! 짝짝 ​ ANOVA가 무엇이냐 ?! ​ ANOVA(Analysis of V..