데이터문화 4

데이터 품질관리(2) - 데이터 민주화

정의 : 모든 구성원이 데이터를 쉽게 업무에 활용하고 data-informed decision을 하는 것규칙구성원이 데이터 관련 질문을 편하게 할 수 있을 것 데이터 리터러시 필수적 : 데이터 민주화의 가장 큰 병목현상(데이터 접근성) 해소 가능 회사가 어떤 데이터를 수집하는지, 어떻게 생긴 데이터인지 누가 어느 데이터에 접근하는지 정의할 것 필요한 데이터 리터러시 역량은 부서의 업무에 따라 다르다모든 사람이 데이터로 일할 수 있는 tool을 제공할 것 전문가는 각자의 tool에만 전문적이다 : 추가적인 데이터 tool에 투자해야한다 Data warehouse BI tool ELT tool Reverse ETL tool데이터 민주화를 진행 중인 프로세스로 볼 것 : 조직 전체의 문화적 변동이 필요할 수도..

데이터 품질관리(1) - Model Drift, Data Silo

앞으로 데이터 품질관리와 관련된 용어를 정리해보려고 합니다. 오늘은 model drift와 data silo에 대해 정리해봤어요. Model Drift모델을 배포한 이후, 시간이 지남에 따라 모델 성능이 저하되는 현상원인 : 데이터가 현실의 패턴을 반영하기 못하기 때문에영향 : Outdated된 모델로 인하여 부정확한 예측으로 이어질 수 있다.해결 방법 : 일정 주기마다 모델을 재학습하거나 알고리즘을 수정, 유입되는 데이터의 분포를 자동적으로 트래킹유형Data Drift(Covariate Shift) : 시간이 지남에 따라 input의 분포가 변함Sample Selection Bias : 학습 데이터를 구성할 때 bias가 존재하여 모델이 test 데이터를 충분히 반영하지 못함Non-Stationary ..

5. 6개월차 BA 후기 - JD 다시 보기, 데이터 문화 etc

이전 포스팅입사 1달차 BA 후기 https://lifeofsw.tistory.com/99입사 3달차 BA 후기 https://lifeofsw.tistory.com/105입사한지 반년이 다 되어 간다. 정확히 말하자면 5개월을 조금 넘긴 상태이지만, 다음달에 처리할 프로젝트를 보고 있으니 다음달에 포스팅을 못할 수도 있겠다는 생각이 들어서 일찍 로그를 쓴다(크리스마스에). 0. JD 다시보기연말 평가를 준비하면서 처리한 티켓 개수를 세어봤다. 처리율은 98.4%였다. 64개를 할당받았는데 1개는 리소스 문제로 인해 홀딩했고 나머지는 다 처리했다. 아직 팀장님한테 말씀은 안 드렸는데 팀장님은 한 20개 정도 처리한 줄 아신다 하하하 (다음주에 어필해야지)분기 평가 때는 많은 것을 잘해줘야 하는 자리에서 잘..

Career/Career log 2024.12.25

Tableau DataFest Korea 2024 참여 후기

목요일에 Tableau DataFest를 다녀왔습니다. 저희 회사는 Tableau를 사용하지 않지만, 외부 컨퍼런스 참여 권장이라 다녀왔어요.Tableau를 실무에서 사용하지 않다보니 기술 세션보다는 각 기업의 데이터 활용 방법을 담은 세션을 들었어요.데이터 직무/팀의 미래나 데이터 문화에 대해 많은 생각이 드는 세션이었습니다.조직의 데이터 문화가 고도화됨에 따라 데이터 팀의 역할은 변하기 때문입니다.데이터 접근이 제한되어 있고, 구성원의 데이터 역량이 낮은 조직에서는 분석을 위해 데이터팀에 별도로 요청을 합니다.그러나 데이터 문화가 고도화될수록, 즉 구성원의 데이터 역량이 향상되고 데이터 접근이 자유로워질수록 스스로 분석을 하는 사람이 많아집니다.분석을 위해 데이터팀에 별도로 요청을 하지 않게 된다면 ..

반응형