본문 바로가기

전체 글

(25)
전기전자컴퓨터공학 전공 석사의 취업 후기 (feat. 전문연구요원 편입, IT 개발자 취업) 2편: 취업준비 경험 공유 및 이력서 작성 팁 늦어서 미안합니다... 2달 만이라니. 석사 졸업 이후 코로나 엔데믹에 따른 2022년의 취업 호황이 지나가자 2023년 it업계 채용시장은 크게 얼어붙었다. 카카오는 면접 예정이던 지원자들에게까지 불합격을 통보했고, 내 졸업한 선배들 대부분은 그들의 회사에 신입 채용 계획이 없다고 말했다. 박사 선배들은 취업 시장의 암울한 상황을 고려해 박사 진학을 권유했다. 이런 조언들은 도움을 주려는 마음에서였겠지만, 나에게는 석사 취업에 실패할 수도 있다는 큰 불안감을 주었다. 하지만 이런저런 사정상 박사 진학이라는 선택지는 나에게 없었다. 그렇기에 나는 6개월 동안 취업을 열심히 준비하기로 했다. 만약 그 기간 동안 원하는 결과를 얻지 못한다면, 바로 공익복무를 시작할 각오로 최선을 다했다. 결국 6개월보다 훨..
전기전자컴퓨터공학 전공 석사의 취업 후기 (feat. 전문연구요원 편입, IT 개발자 취업) 1편: 프롤로그 현생에 치여 살면서, 블로그에는 오랜만에 돌아오는 주인장이다. 저번에 게시물이 11월이니, 거의 9개월만에 돌아오는 셈이다. 필자는 2023년 2월에 석사를 졸업한 이후 6월부터 판교의 모 기업에서 전문연구요원으로 복무하기 시작했다. 일반적으로는 석사 4학기때부터 취업 준비를 하고 졸업을 하자마자 취업하는 것이 일반적인 테크트리이나, 나는 it업계 채용시장의 침체 및 이모저모 개인적인 상황 때문에 약간의 공백기를 가지게 되었다. 본 포스트에서는 석사때부터 취준생 기간 동안 전문연구요원 편입을 위해 준비한 과정을 리뷰해 보려고 한다. 참고로 필자는 전기전자컴퓨터공학 전공의 학석사 학위를 취득했고, 그 중에도 (오디오 처리) 인공지능을 연구했으며, 보충역 편입 대상자로서 본인 to를 가지고 있는 상태로 it..
딥러닝 모델 개발 대학원생의 맥북 에어 M1 (MacBook Air M1) 10개월 사용기 필자는 석사 디펜스가 며칠 남지 않은 대학원생이다. 대학원생 생활의 여러 터닝 포인트 중 가장 임팩트가 컸던 시점은 첫 세미나를 했을 때도, 국제 학회에 방문했을 때도 아닌 (대학원생으로서 이게 맞나 싶지만) 맥북을 사용하기 시작한 때였던 것 같다. 이번 포스팅에서는 왜 필자가 맥북을 사용하게 되었는지, 그리고 맥북 에어 M1, 넓게는 Apple Silicon MacBook이 딥러닝 개발자 혹은 대학원생 입장에서 어떤 장단점을 가지고 있는지 썰을 좀 풀어보도록 하겠다. 맥북을 구매한 계기 올해 1월, 삼성전자 주식이 7만 원인가 8만 원이었던가 하던 시절 십만전자 얘기가 나오는 것을 보고 사주에도 없던 주식 애플리케이션을 깔아 삼성전자 주식을 100만 원어치 구매했었는데, 한 주 사이에 주당 1000원 ..
[논문리뷰] Parallel Wavegan: A Fast Waveform Generation Model Based on Generative Adversarial Networks with Multi-Resolution Spectrogram R. Yamamoto, E. Song and J. -M. Kim, "Parallel Wavegan: A Fast Waveform Generation Model Based on Generative Adversarial Networks with Multi-Resolution Spectrogram," ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020, pp. 6199-6203, doi: 10.1109/ICASSP40776.2020.9053795. 세줄 요약 - Parallel Wavegan은 multi-resolution STFT loss와 waveform-domain ..
[논문리뷰] WaveNet: A generative model for raw audio A. van den Oord, S. Dieleman, H. Zen, K. Simonyan, O. Vinyals, A. Graves, N. Kalchbrenner, A. W. Senior, and K. Kavukcuoglu, “WaveNet: A generative model for raw audio,” CoRR, vol. abs/1609.03499, 2016. 세줄 요약 - Wavenet은 autoregressive generative model에서 영감을 받아 만들어진 raw audio generation technique이다. - Dilated Causal Convolution은 Wavenet에서 큰 receptive field를 가지는 autoregressive model을 만들 수 있게 해주는 기..
Human Speech Production(음성 생성과정)-2 음성 생성과정은 한 포스트로 끝내려 했는데, 이전 포스트에서 음성 생성의 회로적인 관점에 대해서 언급하지 않았더라. 이 개념을 짚고가지 않으면 Short-time 분석의 motive에 대해 설명하기 힘들어서, 원래 있던 글에 붙여 쓰려다가 포스트 수나 늘릴 겸 음성 생성과정도 두 포스트로 나눠서 설명한다. 음성 생성과정 첫 번째 포스트에서 설명했던 single tube model이다. 공기가 폐를 통해 밀려 올라오면 vocal cords의 닫힘 혹은 열림에 따라 무성음/유성음 여부가 결정되고, 이후 vocal tract에서 소리가 조각이 되는 구조이다. Single tube model은 인간의 음성 생성과정을 이해하는데는 도움이 되는 모델이지만, 신호처리 관점에서 실제로 음성을 생성하는데 활용하기는 어려..
Speech Perception(음성 인지)-2 청각 시스템의 블록 다이어그램은 다음과 같다. 음성인지 1편에서 설명했듯, 소리가 신경 자극으로 바뀌는 과정은 꽤나 잘 알려져 있지만, 이 신경 자극이 뇌에서 어떻게 해석되는 지에 대해서는 잘 알려져 있지 않다. 즉 위 블록 다이어그램에서, (음성인지 1편에서 설명한) 'Acoustic to Neural Conversion'은 잘 알려져 있지만 Neural Transduction과 Neural Processing에 대해서는 연구해야 할 부분이 아직 많다고 한다. 신경계를 이해하기 위한 인류의 지식이 아직 부족하기 때문에, 청각을 연구하는 과학자들은 음파와 인간의 (심리학적인) 소리 인지가 어떻게 연관있는지를 알아보기 위해 블랙박스 모델을 도입했다. 블랙박스 모델 모델이라고 하기도 뭐한 블랙박스 모델은, ..
Speech Perception(음성 인지)-1 다시 Speech Chain에서 시작한다... The Speech Chain Speech(음성)은 인간들 사이의 communication에 있어서 가장 간편한 형태 중 하나이다. 두 사람이 speech를 통해 소통하는 과정을 Speech Chain이라고 부른다. The Speech Chain Speech chain을 더 구체적으로 설.. youngwonchoi.tistory.com Speech chain의 청자 부분을 보자. 음성이 음파(소리)를 통해 귀로 전달되면 귀 내의 음압 변화를 통해 소리가 신경 자극으로 바뀌게 되고(physiological level), 이 신경 자극은 뇌에서 linguistic form으로 변환(linguistic level)되게 된다. Speech production과 유사..
Human Speech Production(음성 생성과정)-1 이전 포스트에서 speech chain에 대해 알아봤다. 더 자세한 내용은 해당 포스트를 참고하시길. The Speech Chain Speech(음성)은 인간들 사이의 communication에 있어서 가장 간편한 형태 중 하나이다. 두 사람이 speech를 통해 소통하는 과정을 Speech Chain이라고 부른다. The Speech Chain Speech chain을 더 구체적으로 설.. youngwonchoi.tistory.com 화자는 머릿속의 생각을 linguistic form(언어형식이라는데, 대충 문장이라고 생각하면 되겠다.)으로 바꾸고(linguistic level), 운동 신경을 이용해 발성 기관을 활성화하여 linguistic form을 다시 음파, 즉 소리로 바꾸는 과정(physiol..
The Speech Chain Speech(음성)은 인간들 사이의 communication에 있어서 가장 간편한 형태 중 하나이다. 두 사람이 speech를 통해 소통하는 과정을 Speech Chain이라고 부른다. The Speech Chain Speech chain을 더 구체적으로 설명하면, '화자가 조음기관을 이용해 발화하면, 청자가 귀를 통해 진동이 전달되고 청자가 의미를 해독하는 일련의 과정'이라고 할 수 있다. 이 과정은 화자가 처리하는 과정과 청자가 처리하는 과정으로 나뉘어진다. 화자 1. Linguistic level: 머리 속의 생각을 linguistic form으로 변환하는 과정이다. 화자가 사용하는 언어의 문법, 단어 등에 영향을 받는다. 2. Physiological level: 화자의 linguistic lev..