[Data analyst] Today I Learn 22

[WIL Week 4] 광활한 태평양을 헤엄치는 느낌

이번주는 pandas와 matplotlib 그리고 약간의 SQL 코드카타 문제에 심취?했던 주였다. 핑계라고 해야되나... 월/화/수 - 파이썬 데이터 시각화 듣고 VS code에 정리 + 쥬피터 장착 / 전 튜터님 pandas 라이브 섹션월/화 - 파이썬 서 튜터님 알고리즘 과제 1~5번 풀기수 - 파이썬 서 튜터님 알고리즘 고난도 과제 6~8번 풀이 복습 (사실 이건 아직도 못했음..) / 전 튜터님 pandas 라이브 섹션 목 - 하루 ADsP 3과목 정리/복습 (그나마 시간이 많았는데, 암기가 잘 되지 않고 있다.)금 - QCC (SQL 쿼리 시험 2 문제) 이 후 풀이 학습 및 SQL 코드카타 (프로그래머스 75번) / 전 튜터님 pandas 라이브 섹션 이렇게 공부를 진행하였다. 모든 파이썬 ..

[WIL Week 3] 프로그래밍 기초 첫 주 돌파

이번 주는 지난 2 주간의 온 보딩 보다 알차게 시간을 보냈다. [배운 것들과 아쉬운 점](1) SQL > 이제 왠만하면 with와 서브쿼리를 동원해서 문제를 접근할 수 있게 되었다. > 다만, 가끔은 필터에 필터에 집계함수를 써야되는 경우 한번 꼬였을 때 다시 리셋해서 접근해야되는데 한번 오류난 곳에 매몰되어서 문제 해결하는데 시간이 많이 걸릴 때가 있다. (2) Python > 사실 대학원때 진짜 3 달 동안 죽도록 해서 언어가 낯설진 않다. > 다만, 그로 부터 대략 10년을 손 놨기 때문에 실무에서 과거의 나를 끄집어 내려면 SQL과 마찬가지로 심층 퀴즈를 좀 많이 풀어봐야 될 듯하다. (3) ADsP > 사실 SQLD는 캠프 들어오기 전에 따놨지만, 본 캠프를 진행하면 할 수록 자격증은 그냥 허..

[TIL Day 13] Python 진입!

사전 캠프 때는 유튜브 강의('나도코딩')를 참고해서 학습했는데 그땐 무려 6시간 짜리...본 캠프 서정욱 튜터님의 Python은 딱 데이터 분석가에게 핵심이 되는 것들로 알찬 구성이 되어있었다.그래도 한 동안 SQL이랑 ADsP 공부 하느라 Python을 잊고 있던 찰라에 종합반 강의를 듣게 되어서 나름 블로그에 진또베기만 기록 하였다. [NBcamp Python] For (tistory.com) 0 and x % 2 == 0 else "음수 또는 0"print(result)### 1부터 시작하여 10 이전까지 2씩 증가하는 정수 시퀀스 생성for i in range(1, 10, 2): print(i, end=' ')# 출" data-og-host="pjw250.tistory.com" data-og-s..

[TIL Day 12] 헬스케어 도메인의 데이터 분석가 채용공고 스크랩

[Evidnet (에비드넷) - 의료 데이터분석가 직군 (1년 이상) 채용공고 분석]  > Evidnet (에비드넷) 양재역 부근 뱅뱅빌딩에 위치하고 있고 업력 약 6년에 50여명 정도 근무하는 중소기업이다.> 각각 병원 마다 보유하고 있는 의료데이터들을 표준화 하여 CDM으로 보유하고 실제 임상 근거를 제공해서 연구개발과 헬스케어 업체의 비즈니스 의사결정을 지원하는 IT 업체라고 한다.> 좀 더 구체적으로 어떤 서비스를 제공하냐면, 환자들의 실제 진료 데이터, RWE (Real World Data) 기반으로 효율적인 임상진행을 위한 환자군 분포 및 Site 현황 파악, RCT 결과 시뮬레이션, 약물 효능/부작용 분석, 처방 분석 등 임상 설계, 진행 후 결과를 통한 시뮬레이션과 같은 작업을 통해 헬스케..

[TIL Day 11] WINDOW FUNTION과 자주 쓰는 함수들

[SELECT 절에서 사용되는 윈도우 함수 기본 문법]SELECT WINDOW_FUNTION () OVER (PARTITION BY CAL1 ORDER BY CAL2 ASC/DESC)FROM TABLE [특징]- GROUP BY와 병행하여 사용할 수 없지만 서브쿼리에는 사용할 수 있다. 종류특징함수순위 ***같으면 같은 등수 부여 후 건너뛰고 순차적 번호 부여1,1,3,4,4,6,7, ...(ORDER BY 필수)RANK()순위같으면 같은 등수 부여 후 순차적 번호 부여1,1,2,2,3,3, ...(ORDER BY 필수)DENSE_RANK()순위 ***같아도 정렬 기준에 따라 연속된 번호 부여1,2,3,4,5,6,7,8, ...(ORDER BY 필수)ROW_NUMBER()집계집계함수와 동일SUM, MAX..

[TIL Day 10] 실무에서 쓰이는 지표 (Funnel & LTV)

[ Funnel (퍼널) ]유저들이 어디서 이탈하는가? - 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정 - 모든 서비스와 비즈니스는 각 단계로 갈 수록 이용자 수가 줄어들게 됨 - 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정  [ 퍼널 기법 AARRR ] - 디지털 마케팅 시 활용하는 프레임 워크 - 단계별 전환율을 지표화 하여 서비스 부완 지점을 찾음 > Acquisition 유입 > Activation  활성화 > Retention  재방문(재구매) > Revenue   수익 > Referral    추천  [ LTV (Life Time Value, 고객 평생 가치) ]해당 유저가 우리에게 평생 주는 이익은 얼마나 될까? - 고객 생애 주기 : 한 명의 유저가 서..

[TIL Day 9] 실무에서 쓰이는 지표 (Active User와 Retention)

오늘은 "데이터 리터러시" 강좌에서 지표 설정 chapter의 내용이 너무 유익해서 정리하여 글로 내재화 하고자 한다. [ 지표란? ] - 문제 정의를 통해서 '어떤 문제를 풀고자 하는가?'를 정의했다면  > 문제 정의 : 둘 이상의 해석이 나오지 않도록 구체적으로 표현하고 정의하였는가? - 지표는 '어떤 결과를 기대하는가?'에 대한 정량화된 기준  > 지표 설정 : 정의한 문제를 확인하는데 적합한가? 주요 지표[ Active User (활성유저) ] - 정의에 따라 범위가 다름 1) 사이트 진입 유저 - 메인 홈 화면에 진입 시 활성 유저로 정의 - 허들이 가장 낮음 - AU 지표가 가장 높게 측정됨 - 그러나 해당 유저 대상 액션 효율이 떨어짐  2) 사이트 진입 후 추가 행동을 한 유저 - 허들이 ..

[WIL Week 2] 온 보딩 2주차 마무리

벌써 온 보딩 2 주차 마지막날이 되었다. 지난 주에는 조를 운영하고 첫 발표도 진행하면서 본 캠프의 흐름을 익히는 것이 주가 되었다면, 이번 주는 SQL에 대한 쿼리 활용과 응용에 집중한 주가 되었다. 여러 팀들의 과제 발표를 들으면서 아쉬운 점도 많았고 좋은 점도 많았는데 다음 주차로 가서 이런 점을 보완해야겠다. 다음 주차 부터는 SQL은 코드 카타 2~3 문제 푸는 걸로 하고Python 달리기반 선택 해서 Python에 집중할 예정이다. 그리고 ADsP 자격 시험이 11월 3일 일요일 경원중학교에서 예정되어있어서 ADsP 문제지 풀이와 요약강의를 꾸준히 들어야 겠다.

[TIL Day 8] SQL 풀이와 아티클 정리

어제 9 to 9 시간 이후, 샤워를 하고 다시 자리에 앉아 SQL 라이브 섹션 마지막 문제를 풀기 시작해서 오늘 오전에 마무리 지었다. 그와 동시에 SQL 코드카타도 대략 2문제? 정도 푼거 같다. SQL 라이브 섹션 마지막 문제는 2번 문제를 풀 줄알면 충분히 풀 수 있는 내용들이였다.또한 코드카타를 풀면서 WITH table AS ()라는 파이썬의 클래스? 기법과 유사한 SQL 기법도 알게 되었다.[MySQL] JOIN과 CTE의 활용 (tistory.com) [MySQL] JOIN과 CTE의 활용코딩테스트 연습 - 조건에 맞는 사용자 정보 조회하기 | 프로그래머스 스쿨 (programmers.co.kr) 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 ..

[TIL Day 7] SQL 집중 탐구 시간

오늘은 하루 종일 SQL에 빡! 집중하는 시간을 갖었다.조원들과 빠르게 스크럼을 작성/논의하고 바로 코드카타와 SQL 라이브 섹션 풀기비록 오늘도 ADsP 공부가 밀리긴 했는데 이제 SQL을 중급정도 다룰 수 있는 경험을 했다.마지막, SQL 라이브 섹션 문제 풀이가 오늘 TIL의 정점! [MySQL] 서브쿼리를 이용한 그룹 내 max 값만 뽑아오기 (tistory.com) [MySQL] 서브쿼리를 이용한 그룹 내 max 값만 뽑아오기코딩테스트 연습 - 즐겨찾기가 가장 많은 식당 정보 출력하기 | 프로그래머스 스쿨 (programmers.co.kr) 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞pjw250.tistory.com[MySQL] 데이터 내 중복 값들을..