LBGM 익숙해지는 게 좋다.
한국어 임베딩 - 책 2020년도 초창기까지의 연혁을 잘 다룬 NLP 책
딥러닝 쪽으로 갈수록 전통적인 틀 회귀, 분류 이런 것에는 맞지는 않다
2017년도까지의 분야별 논문 연혁
https://coggle.it/diagram/Wf5mYoJbsgABUF9P/t/neural-net-arch-genealogy
sota (state of the art)
https://paperswithcode.com/sota
모델링 이외의 업무
1. 데이터 수집: 요건을 잡고 정형 비정형 데이터를 뒤지고. sql 조금 알아둬야 된다.
2. 분석(모델링)
3. 평가
까지를 데이터 분석 업무라고 본다.
MLOps
알고리즘에 대한 이해도가 중요하다. 면접 때 물어보면 잘 대답 못하는 것이 아쉽다고 생각하셨다고 한다.
-> 알고리즘으로 부딪히는 문제를 푸는 것들이기 때문에..
https://stablediffusionweb.com/#demo
마이데이터 서비스 요즘 핫한. 고객의 정보를 알 수 있는.
이상거래탐지 - AutoEncoder 관련..
고려사항
- 잘못된 알고리즘 설명 -> 알고리즘 설명은 정확히 맞는 정보로, 용어는 애매하게 말고 차라리 영어로
- 전형적인 모델링 과정 설명 -> 어떤 점을 개선했는지, 경험했는지에 대해서 쓰면 좋음
- 최신 알고리즘 나열 -> 누구나 할 수 있는 것.
- 인사이트 내용 치중, 기획이나 아이디어 관련 내용 치중 -> 데이터 분석가인지 모델러인지에 따른 내용 수정
- 핵심가치가 천차만별이지만 전문성, 경험 평가 비중이 높음
면접
- 자기소개서 내용 숙지
- 기본적인 알고리즘 설명 준비
- 면접 시 애매모호할 때 다시 질문 확인
- 모를 때는 인정하는 솔직한 자세
- 멘탈
- 본인이 분석한 과제 및 프로젝트관련 알고맂름 최신 트렌드 숙지
- 향후 커리어업을 위한 계획 정리
데이터 결과를 볼 때는 히스토그램, 스케터 차트
결과를 보여줄 때는 파이, 바, 라인 차트
quiz!
'개발' 카테고리의 다른 글
문서 간 유사도를 구하는 3가지 방법 (0) | 2022.11.19 |
---|---|
CountVectorizer 를 이용해서 문서에 나온 단어 빈도수 뽑아보기 (0) | 2022.11.19 |
텍스트 마이닝 총정리 (0) | 2022.11.16 |
python googletrans (0) | 2022.11.10 |
분류모델 평가 (0) | 2022.11.10 |