Extrair Manchetes do Observador

maio 27, 2024

import requests
from bs4 import BeautifulSoup
import time

def extrair_manchetes(url):
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        manchetes = soup.find_all('h1', class_='title')
        for manchete in manchetes:
            print(manchete.text.strip())
       #     time.sleep(2)
    else:
        print("Falha ao recuperar as manchetes.")

url = 'https://observador.pt/'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'
}

while True:
    print("Actualização ")
    extrair_manchetes(url)
    # Actualizar Manchetes de hora em hora
    time.sleep(3600)

# Outra forma

import time
import requests
from bs4 import BeautifulSoup

def extrair_manchetes_e_textos(url):
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        soup = BeautifulSoup(response.text, 'html.parser')
        manchetes = soup.find_all('h1', class_='title')
        textos = soup.find_all('div', class_='lead')
        for manchete, texto in zip(manchetes, textos):
            print("\033[32m" + manchete.text.strip() + "\033[m")
            print("\033[34m" + texto.text.strip() + "\033[m")
    except Exception as e:
        print("Ocorreu um erro:", e)

url = 'https://observador.pt/'

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36'
}

while True:
    extrair_manchetes_e_textos(url)
    print("Atualização.")
    time.sleep(3600)

Pesquisar neste blogue

Mundo em Python

Extrair Manchetes do Observador

Comentários

Enviar um comentário

Mensagens populares deste blogue

Criar Cartões de Visita

12 signos egípcios

Calcular a percentagem de ocupação