반응형

PYTHON 10

YouTube 음악을 MP3로 다운로드하는 프로그램 만들기

YouTube 음악을 MP3로 다운로드하는 Python 프로그램 만들기: 단계별 가이드오늘은 Python을 사용하여 YouTube 동영상의 오디오를 MP3 파일로 다운로드하는 프로그램을 만드는 방법을 단계별로 알아보겠습니다. 이 프로그램은 사용하기 쉬운 GUI 인터페이스를 갖추고 있어 누구나 쉽게 사용할 수 있습니다.이번에도 광고가 붙은 웹사이트 기능 중에 활용도가 높은 기능을 선택했습니다. 그것이 바로 YouTube 음악 MP3 추출입니다. 많은 사이트에서 제공하는 이 기능을 직접 만들어 더 안전하고 효율적으로 사용해 보세요.목차프로그램 기능 미리보기1단계: 필요한 라이브러리 설치하기2단계: 기본 파일 구조 설정3단계: 필요한 바이너리 다운로드 스크립트 작성하기4단계: YouTube MP3 다운로드 모..

Python 2025.03.22

Python을 활용한 업무 자동화 예제 [Excel 파일 생성, 데이터 to Excel]

1. 개요현대 IT 환경에서 데이터는 다양한 형식으로 존재합니다. JSON, XML, OData 등 여러 형태로 API 응답이 오는데, 이를 분석하거나 보고서로 만들 때 가장 보편적으로 사용하는 도구가 바로 Excel입니다. 물론 온라인 변환기 사이트가 많이 있지만, 광고와 하루 횟수 제한으로 인해 굉장히 불편한 것이 현실입니다. 그래서 이런 제약 없이 자유롭게 사용할 수 있는 '엑셀 헬퍼'를 만들게 되었습니다.JSON, XML, OData(v2/v4) 데이터를 엑셀 형식으로 변환데이터에서 자동으로 헤더 추출사용자 정의 헤더 지원스타일이 적용된 깔끔한 엑셀 파일 생성2. create_excel_ex: 엑셀 예제 파일 생성create_excel_ex.py는 헤더와 데이터를 받아 스타일이 적용된 엑셀 파일을..

Python 2025.03.19

Python을 활용한 업무 자동화 예제 [폴더 정리 기능]

Python을 활용한 업무 자동화 예제 [폴더 정리 기능]많은 직장인들이 컴퓨터에서 파일을 관리하는 데 많은 시간을 소비합니다. 특히 여러 프로젝트나 작업을 진행하면서 다운로드 폴더나 문서 폴더가 금방 지저분해지곤 하죠. 물론 겪지 않으시는 정리 잘하시는 분들도 있겠습니다만... 필자는 정리를 하지 않기 때문에 스스로 해결해보고자 이 프로그램을 만들기로 마음 먹었습니다. 이 글에서는 Python으로 파일 관리 자동화 도구를 만드는 방법을 단계별로 알아보겠습니다. 실제 작동하는 코드와 함께 설명을 제공하니 끝까지 읽어주시면 감사하겠습니다.1. Python 설치가장 먼저 필요한 것은 Python입니다. Python 공식 웹사이트에서 최신 버전을 다운로드하고 설치합니다.설치 시 중요한 체크박스가 있습니다:✅ ..

Python 2025.03.18

[Python] Selenium 사용법 정리

find_element 가장 많이 사용하기도 하고 크롤링 중 항상 첫 시작을 알리는 find_element() 함수 입니다. # html 태그 id 값 button = myDriver.find_element(By.ID, "button") # html 태그 class_name button = myDriver.find_element(By.CLASS_NAME, "button") # html 태그 xpath (전체 경로) button = myDriver.find_element(By.XPATH, "/html/body/div[3]/form/section/div/div[2]/div[6]/div[2]") 저는 위 3개를 가장 많이 사용합니다. 위 3가지 방법을 지금까지 소규모 크롤링 토이 프로젝트를 몇 가지 해보고 나..

Python 2023.09.18

PointCloud란(pcd, ply)

정의 PointCloud는 Lidar 센서로 부터 얻은 3차원의 점 데이터를 생성해주는 라이브러리다. 특징 데이터의 노이즈가 다소 포함되어 있기 때문에 데이터 전처리 과정이 필요하다. numpy 형태로 데이터를 return 한다. ply 파일 data의 모습 ply #확장자 format ascii 1.0 comment PCL generated element vertex 17228754 # point 총 갯수 property float x #point x축 값 property float y #point y축 값 property float z #point z축 값 property uchar red #rgb 컬러 값 property uchar green #rgb 컬러 값 property uchar blue #..

BigData 2022.05.16

Pandas map, apply 예제

값 대치 값 대치 (딕셔너리) s = pd.Series([1, 2, 3]) # 3행 1열의 샘플 데이터 mapping = { 1:"drop", 2:"the", 3:"table" } # 딕셔너리 구조의 맵핑할 데이터 s1 = s.map(mapping) # 딕셔너리를 인자로 map 호출 print(s1) # 결과 0 drop 1 the 2 table dtype: object 값 대치 (함수) s.map(lambda x: x**2) # 각각 제곱 # 결과 0 1 1 4 2 9 dtype: int64 값 변환(함수 호출) # 제곱 함수 선언 def squared(value): return value * value # apply s.apply(squared) # 결과 0 1 1 4 2 9 dtype: int64 ..

Python 2022.02.16

Pandas 결측치 예제

결측치 확인 Python Pandas 라이브러리의 isnull() 활용 s = pd.Series([1, 2, 3, np.nan] * 3) # 4행 3열의 null 값이 존재하는 2차원 데이터 s.isnull().sum() # null 값의 건수 = 3 결측치 채움 Python Pandas 라이브러리의 fillna() 활용 fillna()는 return값이 복제본이다. 따라서 inplace = True 를 명시하지 않으면 원본 데이터의 변경을 피할 수 있다. s.fillna(4) # null 값을 모두 4로 채움 원본 데이터와 비교 # 원본 데이터 print(s) # 결과 0 1.0 1 2.0 2 3.0 3 NaN 4 1.0 5 2.0 6 3.0 7 NaN 8 1.0 9 2.0 10 3.0 11 NaN d..

Python 2022.02.16

Pandas 데이터 타입

Pandas에서 제공하는 기본 데이터 타입은 다음과 같습니다. 예제 # 데이터프레임 정보 df.info() RangeIndex: 3 entries, 0 to 2 Data columns (total 6 columns): 이름 3 non-null object 통솔 3 non-null int64 무력 3 non-null int64 지력 3 non-null int64 정치 3 non-null int64 매력 3 non-null int64 dtypes: int64(5), object(1) memory usage: 272.0+ bytes 데이터 타입 변경 데이터 타입을 변경할 때는 astype()을 이용할 수 있다. 문자열을 숫자형으로 변경하는 경우처럼 형변경을 할 수 없는 경우 오류가 발생하기 때문에 예외처리를 ..

Python 2022.02.16

데이터 분석 및 모델링 순서

데이터 전처리 과정 1. 문제 정의 및 가설 문제를 명확하게 정의하는 것이 가장 중요하다. 문제 정의부터 잘못 접근했다면 나오는 결과 또한 무의미한 결과이기 때문이다. 문제 정의에 앞서 배경을 살펴보고 전체적인 맥락을 이해하는데 중점을 둔다. 배경을 이해하는데 도움이되는 것은 도메인 지식이다. 문제를 정의했다면 “이 문제를 해결함으로 어떤 것이 해결 되는가?” 를 생각해야 한다. 즉 데이터 분석의 목적을 정의하고 그 문제를 해결하기 위한 가설을 세워야한다. i. 프로젝트시 고려사항 목적과 데이터 특성에 맞는 모델을 무엇인가? 일반화 가능성은 어떠한가? 성능 측정의 지표는? 성능을 높이기 위해 어떻게 Feature Engineering을 진행할 것인가? 제품 혹은 시스템에 모델을 적용할 시 계산량이나 언어..

BigData 2022.02.16
반응형