[2026] Python 작업 스케줄링 | 자동화 작업 예약 완벽 정리
이 글의 핵심
Python에서 주기 작업을 예약하려면 schedule, APScheduler, 시스템 cron 등을 활용할 수 있습니다. 이 글에서는 설치와 기본 문법, 매일·매주 실행, 백업·크롤링 예제와 운영 시 주의사항까지 다룹니다.
들어가며
배치 스크립트나 서버 안에서 주기적으로 작업을 돌리려면, 단순 while 루프보다 스케줄 라이브러리나 OS 스케줄러와 맞추는 편이 안전합니다. 이 글을 끝까지 읽으면 Python에서 반복 실행을 설계할 때 선택지를 비교하고, 예제를 자신의 프로젝트에 옮길 수 있습니다.
”작업을 자동으로 실행하기”
작업 스케줄링은 정해진 시간에 자동으로 작업을 실행하는 기술입니다.
실무 활용 사례: 데이터 분석, 웹 개발, 자동화 프로젝트에서 실제로 사용한 패턴과 코드를 바탕으로 정리했습니다. 초보자가 흔히 겪는 오류와 해결법을 포함합니다.
실무에서 느낀 Python의 매력
처음 Python을 배울 때는 “이게 정말 프로그래밍 언어인가?” 싶을 정도로 간결했습니다. C++에서 10줄로 작성하던 코드가 Python에서는 2~3줄로 끝나는 경우가 많았죠. 특히 데이터 분석 프로젝트를 진행하면서 Pandas와 NumPy의 강력함을 체감했습니다. 엑셀로 몇 시간 걸리던 작업이 Python 스크립트로는 몇 초 만에 끝나는 걸 보고 동료들이 놀라워했던 기억이 납니다. 하지만 처음부터 순탄하지만은 않았습니다. 들여쓰기 하나 잘못해서 몇 시간을 헤맨 적도 있고, 가상환경 설정이 꼬여서 프로젝트 전체를 다시 시작한 적도 있습니다. 이런 시행착오를 겪으며 깨달은 건, 환경 설정을 처음부터 제대로 하는 것이 얼마나 중요한지였습니다. 이 글에서는 제가 겪은 실수들을 바탕으로, 여러분이 같은 시행착오를 겪지 않도록 실전 팁을 담았습니다.
1. schedule 라이브러리
설치
pip install schedule
기본 사용
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
import schedule
import time
def job():
print("작업 실행!")
# 10초마다
schedule.every(10).seconds.do(job)
# 1분마다
schedule.every(1).minutes.do(job)
# 매일 오전 9시
schedule.every().day.at("09:00").do(job)
# 매주 월요일 오전 10시
schedule.every().monday.at("10:00").do(job)
# 실행
while True:
schedule.run_pending()
time.sleep(1)
2. 실전 예제
자동 백업 스크립트
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
import schedule
import time
from datetime import datetime
import shutil
from pathlib import Path
def backup_files():
"""파일 백업"""
timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
backup_name = f"backup_{timestamp}"
source = Path('./data')
backup_dir = Path('./backups')
backup_dir.mkdir(exist_ok=True)
backup_path = backup_dir / backup_name
shutil.copytree(source, backup_path)
print(f"[{datetime.now()}] 백업 완료: {backup_name}")
# 매일 자정에 백업
schedule.every().day.at("00:00").do(backup_files)
# 매주 일요일 오후 11시에 백업
schedule.every().sunday.at("23:00").do(backup_files)
print("백업 스케줄러 시작...")
while True:
schedule.run_pending()
time.sleep(60)
3. APScheduler
설치
pip install apscheduler
고급 스케줄링
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
from apscheduler.schedulers.blocking import BlockingScheduler
from datetime import datetime
scheduler = BlockingScheduler()
def job1():
print(f"[{datetime.now()}] Job 1 실행")
def job2():
print(f"[{datetime.now()}] Job 2 실행")
# Cron 스타일
scheduler.add_job(job1, 'cron', hour=9, minute=0) # 매일 9시
# 간격
scheduler.add_job(job2, 'interval', minutes=30) # 30분마다
# 특정 시간
scheduler.add_job(
job1,
'cron',
day_of_week='mon-fri',
hour=9,
minute=0
)
scheduler.start()
4. 웹 스크래핑 자동화
주기적 데이터 수집
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다, 에러 처리를 통해 안정성을 확보합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
import schedule
import requests
from bs4 import BeautifulSoup
import pandas as pd
from datetime import datetime
def scrape_prices():
"""상품 가격 수집"""
urls = [
'https://shop1.com/product/123',
'https://shop2.com/product/456'
]
prices = []
for url in urls:
try:
response = requests.get(url, timeout=10)
soup = BeautifulSoup(response.text, 'html.parser')
price = soup.select_one('.price').text
price = int(price.replace(',', ').replace('원', '))
prices.append({
'url': url,
'price': price,
'timestamp': datetime.now()
})
except Exception as e:
print(f"에러: {url} - {e}")
# CSV에 추가
df = pd.DataFrame(prices)
df.to_csv('price_history.csv', mode='a', header=False, index=False)
print(f"[{datetime.now()}] 가격 수집 완료")
# 1시간마다 실행
schedule.every(1).hours.do(scrape_prices)
while True:
schedule.run_pending()
time.sleep(60)
5. 이메일 알림
자동 리포트 발송
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다, 에러 처리를 통해 안정성을 확보합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
import schedule
def send_daily_report():
"""일일 리포트 이메일 발송"""
# 리포트 생성
report = generate_report()
# 이메일 설정
msg = MIMEMultipart()
msg['From'] = 'sender@example.com'
msg['To'] = 'recipient@example.com'
msg['Subject'] = f"일일 리포트 - {datetime.now().strftime('%Y-%m-%d')}"
msg.attach(MIMEText(report, 'html'))
# 발송
try:
server = smtplib.SMTP('smtp.gmail.com', 587)
server.starttls()
server.login('sender@example.com', 'password')
server.send_message(msg)
server.quit()
print("리포트 발송 완료")
except Exception as e:
print(f"발송 실패: {e}")
def generate_report():
"""리포트 HTML 생성"""
return """
<html>
<body>
<h1>일일 리포트</h1>
<p>총 매출: 1,000,000원</p>
<p>신규 고객: 50명</p>
</body>
</html>
"""
# 매일 오전 8시에 발송
schedule.every().day.at("08:00").do(send_daily_report)
6. 백그라운드 실행
Windows 작업 스케줄러
아래 코드는 bash를 사용한 구현 예제입니다. 코드를 직접 실행해보면서 동작을 확인해보세요.
# Python 스크립트를 Windows 작업 스케줄러에 등록
# 1. 작업 스케줄러 열기
# 2. 기본 작업 만들기
# 3. 프로그램: python.exe
# 4. 인수: C:\path\to\script.py
Linux cron
아래 코드는 bash를 사용한 구현 예제입니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
# crontab 편집
crontab -e
# 매일 오전 9시
0 9 * * * /usr/bin/python3 /path/to/script.py
# 매시간
0 * * * * /usr/bin/python3 /path/to/script.py
# 매주 월요일 오전 10시
0 10 * * 1 /usr/bin/python3 /path/to/script.py
로깅·예외·타임아웃으로 스케줄 작업 운영하기
while True 안에서 run_pending을 도는 방식은 알람을 맞춰 두고 정해진 함수만 반복 호출하는 시계와 비슷합니다. 장시간 돌리려면 로그 파일으로 실행 여부를 남기고, 작업 안에서 예외를 삼켜 버리지 말고 기록하며, 오래 걸리는 작업에는 타임아웃(환경에 따라 signal 등)을 검토합니다.
다음은 python를 활용한 상세한 구현 코드입니다. 필요한 모듈을 import하고, 함수를 통해 로직을 구현합니다, 에러 처리를 통해 안정성을 확보합니다. 각 부분의 역할을 이해하면서 코드를 살펴보시기 바랍니다.
# ✅ 로깅 추가
import logging
logging.basicConfig(
filename='scheduler.log',
level=logging.INFO,
format='%(asctime)s - %(message)s'
)
def job():
logging.info("작업 시작")
# 작업 수행
logging.info("작업 완료")
# ✅ 에러 처리
def safe_job():
try:
job()
except Exception as e:
logging.error(f"에러: {e}")
# ✅ 타임아웃 설정
import signal
def timeout_handler(signum, frame):
raise TimeoutError("작업 시간 초과")
signal.signal(signal.SIGALRM, timeout_handler)
signal.alarm(300) # 5분 제한
정리
핵심 요약
- schedule: 간단한 스케줄링
- APScheduler: 고급 스케줄링
- cron: Linux/Mac 시스템 스케줄러
- 자동화: 백업, 스크래핑, 리포트
- 모니터링: 로깅, 에러 처리
추천 활용
- 자동 백업
- 가격 모니터링
- 데이터 수집
- 리포트 생성
- 알림 발송