Software/Trying N-gram
-
[n-gram] Trying Code modelingSoftware/Trying N-gram 2021. 3. 11. 16:06
이번에는 수집한 정보를 이해하면서 Github 사이트의 도움으로 N-gram modeling code를 구현해보겠습니다. 코드 추천은 제가 학부연구생으로 일하고 있는 연구실의 박사학위를 준비하시는 분께 받았습니다. 코드 내용 : 문맥에 맞도록 다음 단어를 예측하여 text를 생성 github.com/olegborisovv/NGram_LanguageModel/blob/main/text_generator_ngram.py olegborisovv/NGram_LanguageModel Contribute to olegborisovv/NGram_LanguageModel development by creating an account on GitHub. github.com 코드를 copy하고 설명하기 전에 알고 넘어갈 ..
-
[n-gram] 자료 수집Software/Trying N-gram 2021. 3. 2. 21:21
본 자료는 자연어 처리를 위한 공부를 하던 중에 알게 된 N-gram에 대해 관심이 생겨 조사를 하여 작성한 글입니다. 계획 : 자료 수집 - Github를 이용한 코드 작성 - 보기 편하도록 코드 변경 +) 이 자료에서 틀린 부분이 있다면 알려주시면 감사하겠습니다! 반도체 쪽에서 공부하다가 추가적인 딥러닝 공부를 위해 공부하다보니 모르는 것이 많습니다! 이론적인 내용 - N-gram : 확률적 언어 모델. N개 단어의 연쇄를 확률적으로 표형해 두면 실제로 발성된 문장의 기록을 계산할 수 있도록 도와준다. N이 클수록 모델은 잘 이해된 space-time tradeoff을 통해 더 많은 문맥을 저장할 수 있으므로 소규모 실험을 효율적으로 확장할 수 있다. 이점 : 단순성, 확장성 -> N의 값에따라 다음..