본문 바로가기

분류 전체보기36

pytube 오류 pytube 라이브러리 설치 후 코드 실행하니 아래와 같은 에러 2가지 발생 cipher.py 오류 cipher.py 코드 수정 경로 윈도우 : C:/ProgramData\Anaconda3\Lib\site-packages/pytube 맥 : spotlight 검색 or 폴더 Users/[Username]/opt/anaconda3/lib/python3.9/site-packages/pytube https://github.com/pytube/pytube/issues/1281 참고 # 오리지날 코드 nfunc=function_match.group(1)) # 바꾼 코드 nfunc=re.escape(function_match.group(1))) # 오리지날 코드 nfunc=function_match.group(1).. 2022. 10. 30.
ROUGE score ROUGE score ROUGE Recall-Oriented Understudy for Gisting Evaluation 텍스트 요약 모델의 성능 평가 지표. 텍스트 자동 요약, 기계 번역 등 자연어 생성 모델의 성능을 평가하기 위한 지표이며, 모델이 생성한 요약본 혹은 번역본을 사람이 미리 만들어 놓은 참조본과 대조해 성능 점수를 계산 if 시스템 요약(모델 생성 요약) : the cat was found under the bed 참조요약(Gold standard, 대게 사람이 직접 만든 요약) : the cat was under the bed 모델이 생성한 시스템 요약과 사람이 만들어 놓은 참조 요약 간 겹치는 단어 총 6개 하지만 이 6이라는 숫자는 성능 지표(Metric)로 바로 사용하기에 적합하.. 2022. 10. 30.
[파이썬/머신러닝] 보험료 예측하기 - 전처리 보험료 예측하기 - 전처리 https://www.kaggle.com/datasets/mirichoi0218/insurance # 필요한 파이썬 라이브러리 import pandas as pd import numpy as np import seaborn as sns import missingno from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.impute import SimpleImputer import matplotlib.pyplot as plt from sklearn.preprocessing import MinMaxScaler from sklearn.preprocessing import StandardScale.. 2022. 10. 21.
YouTube 뉴스 정보 획득 서비스 - 동영상 요약, 텍스트 추출 유튜브 동영상 요약, 키워드 추출 1. 기획 의도 온라인 동영상 플랫폼 이용이 확대 되고 정보도 이 경로를 통해 정보를 많이 얻고 있다. 사용자들의 인식도 변화되어 언론으로 인식하는 비율이 확대되고 있다. 유튜브를 통한 정보 검색 서비스를 많이 사용하지만 동영상을 처음부터 봐야하고, 원하는 정보를 한번에 얻기에는 조금 어려움이 있다. 그래서 영상을 다 보지않고 원하는 유튜브 동영상을 요약하고, 키워드 추출을 통해 간단하게 정보 제공을 하고 QA(Question Answering)을 통해 정보 검색과 간단한 퀴즈를 제공하면 어떨까? 2. 유튜브 텍스트 추출(자막이 있는 경우) pytube 유튜브 URL 입력 -> 언어 코드 선택('ko.7XP2tGORuV4') -> 전처리(불용어) -> 텍스트 추출 fro.. 2022. 10. 18.