공부 18

데이터 조회 및 추출 플랫폼 사용 후기

오늘은 제가 지금까지 사용해 본 데이터 플랫폼 사용 후기를 간단히 남겨보려고 합니다. 원활하게 직장 생활을 계속해나간다면, 앞으로 저는 데이터 브릭스를 오래 사용하게 될 것 같습니다. 사용 후기를 작성하기에 앞서 먼저 현재 저의 SQL 쿼리 실력을 설명하고 가겠습니다. 중간 정도의 스킬을 갖고 있고, 데이터끼리 조인하고, 서브 쿼리나 집계 함수를 사용하는데 큰 무리가 없는 정도입니다. 하지만 아직도 SQL을 사용하다가 원하는 형태의 데이터를 얻지 못하면, 파이썬을 활용하고 싶다는 생각이 종종 드는 그런 상태입니다. 이런 관점에서 사용해 본 데이터 플랫폼 MSSQL, Superset, Databricks에 대한 생각을 남겨보겠습니다.  데이터 조회 및 추출 플랫폼  1. MSSQL(사용 기간 : 1년)  ..

공부/글또 10기 2025.03.02

느즈막히 세워보는 2025년 새해 목표

마지막 글 이후로 한 달 만에 글을 작성하려고 보니 오래간만에 블로그에 들어온 느낌이 드네요! 작년 12월 마지막 글에서 2024년 회고글에 새해맞이 마음가짐이랄지 대략적인 계획을 간단히 작성하여 2025년 새해 목표글을 따로 남길 생각이 원래는 없었습니다. 그런데 새 회사에서 4~5개월을 다니며 적응하고, 새해맞이 겸 설 연휴 여행을 다녀오고 보니, 새해가 시작되고 무엇을 했는지 돌아보니 딱히 이루거나 건강한 생활을 하지 못한 것을 발견했습니다. 그리고 체감상 저의 진정한 2025년은 이제 막 시작된 듯하고, 매일매일 상황이 바뀌는 회사를 다니다 보니, 업무적으로, 일상적으로 카테고리를 나누어서 목표를 구체적이고 명확하게 작성하려고 합니다.  일상 목표 1. 다이어리 꾸준히 작성하기(1달 이상 기록이 ..

공부/글또 10기 2025.02.15

선형 회귀 모형의 OLS와 경사하강법

2025년 새해 첫 글은 원래 25년 1월 5일이 마감일이었는데요! 연말을 좀 길게 쉬고, 출근을 하다 보니 정신없는 1월 초를 보내게 되었습니다. 결국 패스를 하고, 25년 첫 번째 글을 1월 말에 게재하게 됐네요! 새해가 시작되니, 새해 목표나 다짐을 작성할까 했지만, 작년 마지막 글이 2024년 회고 글이라서, 일상글보다는 최근에 공부한 것들을 주제로 하는 게 좋을 것 같아서 선형 회귀 모형 추정 방법인 OLS와 경사하강법에 대해서 설명해보려고 합니다. 선형 회귀 모형을 알아가기 위해서는 먼저 회귀 모형, 독립 변수, 종속 변수에 대한 개념을 알아야 하므로, 각각의 개념과 함께 작성해 보겠습니다. 개념 정리 종속 변수  출력 변수, 반응 변수라고도 부르며, y라 표기하고, 우리가 예측하고자 하는 혹..

공부/글또 10기 2025.01.19

2024년 회고록

2024년 글또 10기 마지막 글 주제를 클러스터링이나 논문 리뷰를 할까 고민을 했었습니다. 그러나 하반기에 다사다난했기 때문에 2024년에 있었던 일들과 여러 가지 생각을 한번 정리하고 앞으로의 계획을 짧게나마 세워보는 회고록으로 마무리하려고 합니다.  2024년에 있었던 일 23년 어느 여름에 퇴사를 하고, 약 1년 동안 리프레시 기간을 가졌고, 24년 4월부터 취업 준비를 시작했습니다. 그렇게 합격, 불합격을 반복하면서, 추석이 지나고 게임 회사에 데이터 분석가로 취업을 했고, 수습기간도 잘 마쳤습니다. 이 과정 속에서 어떤 회사에 가고 싶은지, 나의 퇴사 시그널은 무엇인지, 업무적으로 어떤 성장을 했는지 등등 깊게 고민했고, 아직도 정리되지 않은 부분들이 있습니다. 이번 기회에 나름대로 정리해보려..

공부/글또 10기 2024.12.22

Predicting Purchase Decisions in Mobile Free-to-Play Games 리뷰(2)

이번 글은 지난번 논문을 이어서 설명하고 리뷰하는 내용입니다! 평균 구매 횟수에 대한 회귀 모델에 대한 설명 논문 저자는 10만명의 유저의 데이터를(국적, 기기, 사용한 게임 스킬, 목표 달성, 월드 위치, 친구와의 상호 작용 수, 플레이 시간, 접속 세션 간격 등) 활용하여 구매 횟수를 예측했습니다.   구매 횟수가 이산형이고, 자연수라서 음수가 존재하지 않기 때문에 포아송 회귀 트리를 사용했다고 합니다. 10 fold 교차 검증을 통해 포아송 회귀 트리 모형의 성능과 베이스라인 모델을 비교했습니다. 베이스 라인 모델은 독립 변수를 없이 종속 변수인 구매 횟수만 활용한 모델이고 포아송 회귀 트리는 독립 변수와 종속 변수를 모두 활용한 모ㄱ델입니다.   해당 표의 1열, 2열은 각각 1일, 3일, 7일 ..

공부/글또 10기 2024.11.24

Predicting Purchase Decisions in Mobile Free-to-Play Games 리뷰(1)

드디어 글또 활동기 최초로 논문 리뷰를 해보려고 합니다. 그동안은 따로 시간 내서, 논문을 정독하고 정리해서 글을 작성하는 게 쉽지 않았습니다. 한글로 된 논문이든 영문으로 된 논문이든, 읽는 것까진 괜찮지만, 내용을 완전히 이해하기 전까지는, 저만의 언어로 저의 생각으로 정리하는 게 어렵기 때문에 목표로 세우기만 하고 실행을 할 엄두가 나지 않았습니다. 요즘은 챗지피티가 내용을 빠르고 쉽게 요약을 해준다고는 하지만 챗지피티의 도움을 받으면 이해가 조금 쉬워질 뿐, 여전히 내용 이해 및 응용은 인간의 몫이라고 생각합니다. 아무튼 모바일 게임에서의 유저 구매 여부 예측에 대한 논문에 대한 내용을 정리해 보겠습니다. 해당 논문에서는 구매 여부에 대한 분류 모델과 구매 횟수에 대한 회귀 모델을 다뤘는데, 이번..

공부/글또 10기 2024.11.10

다른 직무 사람들과의 의견 차이

오늘은 제가 약 5년 간 끊임없이 고민하고 있는 문제에 대해서 작성해보려고 합니다. 저는 3년 차 데이터 분석가인데, 지금 4번째 회사를 다니고 있습니다. 4개의 회사를 다녀봤지만, 항상 같은 문제를 겪고 있고, 아직도 명쾌한 해답을 찾지는 못했습니다. 그럼에도  글을 남겨놓고 실무 경험을 쌓다 보면, 언젠가 해답을 얻을 수 있지 않을까?라는 기대감으로 글을 작성해 보겠습니다. 모든 데이터 분석가가 그러는 건 아니겠지만, 데이터 분석가들이 속하는 직무 또한 애매하고, 업무를 단독으로 수행하기는 어렵습니다. 데이터가 흐르는 조직이라면 이런 문제들이 별로 없겠지만, 빅데이터 및 AI가 크게 발전하고, 많은 회사에서 데이터를 잘 활용하려고 하지만, 여전히 데이터 분야에서 사수 없는 회사가 많고, 데이터 분석가..

공부/글또 10기 2024.10.27

글또 10기에 임하는 마음가짐

안녕하세요! 정말 오랜만입니다! 글또(글또는 글 쓰는 또라이가 세상을 바꾸는 모임으로 2주에 한 번씩 개발, 분석 및 IT 관련된 글을 작성하는 개발자들의 모임이에요!)의 목적인 글쓰는 습관을 들이자! 와는 달리 글또 활동기가 아니면 글쓰기와는 자연히 멀어지는 것 같습니다. 나름 변명을 해보자면 그동안 현생이 바빴달까요? 그래도 활동을 재개하고 10기가 마지막 활동인 만큼 더 열심히 조금은 새롭게 활동을 해보려고 합니다. 첫 글은 아무래도 저의 근황과 글또 10기 활동의 목표 및 계획을 작성해 보는 게 좋다고 생각합니다. 조금은 글쓰기가 귀찮아질 때 다시 돌아보며 마음을 다잡을 수 있으니까요! 근황지난 8기 활동부터 조금 말씀 드려보자면 8기 활동 끝날 무렵 퇴사를 결정하고 9기부터 계속해서 갭 이어를 ..

공부/글또 10기 2024.10.13

'OpenAI 파이썬 API 부트캠프: AI와 GPT, 파이썬으로 AI 애플리케이션 개발하기!' 수강 후기(feat.Udemy)

계획 상으로는 한 달 전쯤 강의를 완강하고, 후기를 올리려고 했었는데요! 취업에 더 도움이 될 것 같은 코드트리를 체험하고 실제로 결제를 하고 스터디를 하고 올라오는 공고들을 둘러보다 지원을 하다 보니 벌써 글또 활동 기간의 끝이 다가오고 강의는 완강을 하지 못했습니다. 그래도 쿠폰을 제공받아서 수강을 했기 때문에 현재 상태에서 후기를 남겨보려고 합니다. 이 강의를 선택하게 된 이유는 파이썬으로 데이터를 전처리하고 분석하는 도구를 넘어서서 무언가 개발해보고 싶어서였습니다. 지금 당장 뭔가 개발을 해볼 순 없지만 나중에 여유가 생기면 개인 과제를 할 때 도움이 될 것 같습니다.    강의 소개  'OpenAI 파이썬 API 부트캠프: AI와 GPT, 파이썬으로 AI 애플리케이션 개발하기!'강의는 깔끔한 영..

공부/글또 9기 2024.05.12

요리사와 데이터 분석가

이번에 작성할 글은 최근 4년 간 틈이 나면 어딘가 깊이 생각하게 되던 저의 생각을 작성해보려고 합니다. 통장은 슬펐지만, 마음은 행복했던 갭이어를 끝내고, 틈틈이 채용공고를 탐색하고 지원하다 보니, 마음의 평화가 깨지며 감정 기복이 심해지고 불안해지기 시작했습니다. 3주 간 경력 기술서를 고치고, 제출하고, 코딩 문제 풀기를 반복하고 원하지 않는 결과를 확인하다 보니 금주 월요일 시작부터 힘이 나지 않아서, 한 주 쉬어보기로 했습니다. 그러다 디즈니플러스에서 시크릿 셰프라는 요리 경연 쇼를 보면서 현재 데이터 분석가의 현실과 비슷하다는 생각이 들더라고요! 시크릿 셰프가 어떤 쇼인지, 어떤 점에서 데이터 분석가가 떠올랐는지, 그래서 앞으로 저는 어떠한 태도로 나아갈지 간략히 작성해보려고 합니다.시크릿 셰..

공부/글또 9기 2024.04.27
반응형