Software
-
[Google API STT, text파일] 코드 작성Software/Trying STT 2021. 5. 3. 22:27
이 게시글은 이전 게시글의 응용으로 엑셀에 저장하는 것이 아닌 하나의 음성 데이터 => 하나의 text파일로 변화하는 코드 입니다. def run_quickstart(): import io import os from google.cloud import speech client = speech.SpeechClient() path_dir = 'D:/Dataset/Violence/' file_list = os.listdir(path_dir) for i in range(len(file_list)): file_name = path_dir + file_list[i] with io.open(file_name, "rb") as audio_file: content = audio_file.read() audio = spe..
-
[Google API STT, openpyxl] 코드 작성Software/Trying STT 2021. 5. 3. 22:21
이번에 졸업작품 준비로 제작하게된 '음성파일을 문자로 변환' 코드를 변형하여 google API를 사용하여 Speech To Text로 변환하고 엑셀의 B열에 행을 바꿔가며 저장하는 코드입니다. 먼저 전체적인 코드를 올리고 부분으로 설명을 하겠습니다. import openpyxl def run_quickstart(): import io import os from google.cloud import speech wb = openpyxl.load_workbook(filename='STT.xlsx') ws = wb.active client = speech.SpeechClient() path_dir = 'D:/Dataset/Violence/' file_list = os.listdir(path_dir) for i..
-
[n-gram] Trying Code modelingSoftware/Trying N-gram 2021. 3. 11. 16:06
이번에는 수집한 정보를 이해하면서 Github 사이트의 도움으로 N-gram modeling code를 구현해보겠습니다. 코드 추천은 제가 학부연구생으로 일하고 있는 연구실의 박사학위를 준비하시는 분께 받았습니다. 코드 내용 : 문맥에 맞도록 다음 단어를 예측하여 text를 생성 github.com/olegborisovv/NGram_LanguageModel/blob/main/text_generator_ngram.py olegborisovv/NGram_LanguageModel Contribute to olegborisovv/NGram_LanguageModel development by creating an account on GitHub. github.com 코드를 copy하고 설명하기 전에 알고 넘어갈 ..
-
[n-gram] 자료 수집Software/Trying N-gram 2021. 3. 2. 21:21
본 자료는 자연어 처리를 위한 공부를 하던 중에 알게 된 N-gram에 대해 관심이 생겨 조사를 하여 작성한 글입니다. 계획 : 자료 수집 - Github를 이용한 코드 작성 - 보기 편하도록 코드 변경 +) 이 자료에서 틀린 부분이 있다면 알려주시면 감사하겠습니다! 반도체 쪽에서 공부하다가 추가적인 딥러닝 공부를 위해 공부하다보니 모르는 것이 많습니다! 이론적인 내용 - N-gram : 확률적 언어 모델. N개 단어의 연쇄를 확률적으로 표형해 두면 실제로 발성된 문장의 기록을 계산할 수 있도록 도와준다. N이 클수록 모델은 잘 이해된 space-time tradeoff을 통해 더 많은 문맥을 저장할 수 있으므로 소규모 실험을 효율적으로 확장할 수 있다. 이점 : 단순성, 확장성 -> N의 값에따라 다음..