코드리뷰

    [CodeReview] NLP_문장 및 단어 유사도 분류

    [CodeReview] NLP_문장 및 단어 유사도 분류

    https://github.com/kkobooc/NLP_KoreanHateSpeech GitHub - kkobooc/NLP_KoreanHateSpeech: 한국어 자연어 처리 기술을 이용하여, 온라인 연예 기사 뉴스의 댓 한국어 자연어 처리 기술을 이용하여, 온라인 연예 기사 뉴스의 댓글들을 혐오 및 공격성에 따라 hate/offensive/none으로 분류하는 Kaggle 프로젝트 - GitHub - kkobooc/NLP_KoreanHateSpeech: 한국어 자연어 처리 github.com 01_data_skimming (3)-checkpoint.ipynb from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_..

    [CodeReview] 웹크롤링/유틸스 코드리뷰

    [CodeReview] 웹크롤링/유틸스 코드리뷰

    기존 유사 프로젝트에 대한 코드리뷰를 계속해서 진행하고 있다. 출처 : https://github.com/LEEMINJOO/Beeeep--/blob/master/utils.py GitHub - LEEMINJOO/Beeeep--: 유튜브 비속어 음성 자동 필터링 - 제 9회 투빅스 컨퍼런스 유튜브 비속어 음성 자동 필터링 - 제 9회 투빅스 컨퍼런스. Contribute to LEEMINJOO/Beeeep-- development by creating an account on GitHub. github.com [utils.py] from pytube import YouTube, Playlist 파이튜브 라이브러리를 통해 유튜브와 플레이리스트의 영상 및 음성을 저장한다. def make_dir(dir_): ..

    [CodeReview] 음성클래스 분류 코드리뷰

    [CodeReview] 음성클래스 분류 코드리뷰

    팀프로젝트 진행 전, 기존 유사 프로젝트에 대한 코드 리뷰를 진행하기로 하였다. [get_data.py] 우선 해당 프로젝트 내 get_data.py는 데이터 준비 단계에 해당하며, 유튜브에서 음성을 얻어내는 코드이다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 chrome_dir = './chromedriver.exe' if __name__ == '__main__': parser = argparse.ArgumentParser() parser.add_argument("--get_links", default=False, action="store_true") parser.add_argument("--get_videos", default=False, action="stor..