데이터분석 25

[BOAZ] ADV 기업 연계 프로젝트 리뷰② - 추천시스템

지난 포스팅에 이어서 기업 연계 프로젝트에 대한 이야기입니다. 지난 번에는 컨택에 대해서 말씀드렸는데요, 오늘은 제가 담당했던 추천시스템에 대해 다뤄보려고 합니다. 추천시스템 스터디 추천시스템은 Base 세션에서 다루는 주제가 아닙니다. 또한, 저를 비롯한 팀원들도 추천시스템에 대한 이해가 높지 않아서 스터디가 필요하다고 생각했어요. 컨택을 진행하면서 스터디를 함께 진행했고, 스터디 커리큘럼은 아래와 같습니다. 추천시스템 인터넷 강의 수강 : 강의를 듣고, 돌아가면서 해당 주차의 강의 내용을 정리하여 발제하는 형식으로 진행하였습니다. 추천시스템 관련 이슈 : 추천시스템에는 cold start, sparsity problem 등의 문제가 있습니다. 추천시스템에 대해 보다 깊게 이해하기 위해서 강의 내용과 ..

[BOAZ] ADV 기업 연계 프로젝트 리뷰① - 컨택

오늘부터는 보아즈에서 진행했던 기업 연계 프로젝트를 리뷰해보려고 합니다. 프로젝트 취지 저희 팀은 모두 실무 데이터 핸들링에 대한 니즈가 있었습니다. 다들 빅데이터/AI 분야로의 진로를 희망하고 있다보니 전처리부터 분석, 시각화까지 현업 분석가의 업무 처리 프로세스를 경험하고 싶었던 것 같아요. 기업 연계 프로젝트를 희망하는 다른 팀도 많았는데요, 컨택 대상이 겹치면 보아즈에 대한 대외적인 이미지가 떨어질 수 있겠다는 판단이 들었습니다. 그래서 운영진에게 팀별로 제안서를 공유하여 컨택 대상이 겹치지 않게 하는 것을 제안하였습니다. 리스트업 컨택 대상을 선정하기 위해 저희는 자체적으로 몇 가지 기준을 정했습니다. 스타트업일 것 : 데이터 제공 가능성을 높이기 위해 B2B 기업보다는 B2C 기업을 우선적으로..

빅데이터 연합동아리 보아즈 BOAZ 수료 후기

지난달에 열린 제19회 컨퍼런스를 마지막으로 보아즈를 수료하였습니다. 오늘은 대학생활 마지막 1년을 함께 한 보아즈 활동에 대해서 포스팅해보려고 합니다. 제가 수료한 분석 세션을 기준으로 말씀드린다는 점 참고하세요! BASE 방학 방학에는 머신러닝과 딥러닝 관련 개념을 학습합니다. 방학 정규 세션은 adv 기수가 준비하며, 멘토-멘티에서는 팀마다 차이가 있지만 base 기수가 주로 세션을 준비합니다. 지도/비지도학습, RandomForest 등의 모델에 대해 배우고, 주차별 과제를 수행합니다. 딥러닝 파트에서는 CNN, RNN, LSTM 등 베이직한 모델에 대해서 배웁니다. 딥러닝 파트 발제 들으면서 명강을 많이 들을 수 있었습니다. 본인이 부족하다고 미안하다고 하시는데 대체 어디가 부족한 건지 잘 모르..

기타 정보 2024.02.04

빅데이터 학회 BDA 고급반 6기 후기

활동 기간 : 2023.03 ~ 2023.08, 6개월 활동 내용 매칭된 팀원과 함께 공모전에 출전 2주에 1번 팀 보고서 제출 1달에 1번 정기회의 진행 및 개인 보고서 제출 개인적으로 느낀 장단점 장점 어느 정도 강제성이 있기 때문에 무임승차를 방지할 수 있습니다. 거주지, 학교 위치를 고려해서 팀매칭을 하기 때문에 만날 장소를 정하기가 쉽습니다. 학회에서 제공하는 혜택(현직자 강의, 채용설명회 등)을 받을 수 있습니다. 저는 현직자 강의가 꽤 만족스러웠어요. 공모전 경험 : 출전했던 4개의 공모전 중 2개의 공모전에서 본선 진출을 했습니다. 1개는 아쉽게 최종에서 떨어졌고, 1개는 현재 최종 pt를 준비 중입니다. 단점 미흡한 운영 : 마지막 정기회의가 사전 공지 없이 취소되었어요. 사유는 학회장님..

Data 2023.08.31

[텍스트마이닝] 자연어 네트워크 분석 및 시각화

최근 팀원들과 함께 전주시 공모전에 나갔었는데요, 저는 네트워크 분석을 담당했습니다. 결과적으로 수상은 하지 못했지만, 텍스트마이닝에 대해서 좀 더 공부할 수 있었습니다. 오늘은 연관규칙 분석과 동시출현빈도를 기준으로 네트워크 분석을 진행하는 법에 대해서 포스팅해보겠습니다. 공모전에서는 두 가지를 모두 사용해봤지만, 시각적인 결과를 고려하여 동시출현빈도만을 보고서에 포함시켰어요. 연관규칙 분석 연관규칙 분석은 주로 매출 데이터를 분석할 때 사용합니다. 어떤 상품이 함께 구매되는지 파악하는 것인데요, 이를 텍스트에 적용한다면 어떤 키워드가 함께 나타나는지를 파악할 수 있습니다. 연관규칙 분석을 위해서는 단어 2차원 리스트가 있어야 합니다. 데이터프레임 내 문장 컬럼을 단어 2차원 리스트로 바꾸기 위해서는 ..

Data/Python 2023.07.24
반응형