[토크ON세미나] 딥러닝 기반 음성인식 기초 1,2강 - 딥러닝 기초 I, II

공부/튜토리얼

내공얌냠 2023. 5. 3. 18:33

들어가기 전에.

1강에는 딥러닝 관련된 부분이 나오고 2강에는 코드 리뷰를 합니다.

아래 정리한 부분은 1강의 앞부분입니다. 1강 후반부의 딥러닝 부분은 생략하였습니다.

2강 코드의 경우 눈으로 보면 될 것 같아서 혼자 훑고 끝났습니다.

Amplitude : 진폭(intensity)

Frequency : 주파수, the number of compressed

Phase : 위상(Degree of displacement)

Complex wave : 복합파

입력 신호를 주기 함수들의 합으로 분해하여 표현

CNN : sampleCNN : waveform 그대로 사용 가능(phase spectrum까지 사용, phase-invariant representation)

RNN : 이전 출력을 입력으로 사용, weight sharing이 됨

LSTM : RNN의 vanishing gradient 처리

Attention : hidden state 간의 alignment를 맞출 때

728x90