add comment

This commit is contained in:
2025-07-11 22:06:45 +02:00
parent 0022d0e326
commit b1ce9061b1
8 changed files with 212 additions and 591 deletions

View File

@@ -15,14 +15,26 @@ from utils.database import CSV_RECEIVED
from utils.csv.loaders import get_next_csv_atomic
# Crea una context variable per identificare il worker
worker_context = contextvars.ContextVar('worker_id', default='00')
worker_context = contextvars.ContextVar("worker_id", default="00")
# Formatter personalizzato che include il worker_id
class WorkerFormatter(logging.Formatter):
"""Formatter personalizzato per i log che include l'ID del worker."""
def format(self, record):
"""Formatta il record di log includendo l'ID del worker.
Args:
record: Il record di log da formattare.
Returns:
La stringa formattata del record di log.
"""
record.worker_id = worker_context.get()
return super().format(record)
# Initialize the logger for this module
logger = logging.getLogger()
@@ -31,11 +43,22 @@ CSV_PROCESSING_DELAY = 0.2
# Tempo di attesa se non ci sono record da elaborare
NO_RECORD_SLEEP = 60
async def worker(worker_id: int, cfg: object, pool) -> None:
"""Esegue il ciclo di lavoro per l'elaborazione dei file CSV.
Il worker preleva un record CSV dal database, ne elabora il contenuto
e attende prima di iniziare un nuovo ciclo.
Args:
worker_id (int): L'ID univoco del worker.
cfg (object): L'oggetto di configurazione.
pool: Il pool di connessioni al database.
"""
# Imposta il context per questo worker
worker_context.set(f"W{worker_id}")
debug_mode = (logging.getLogger().getEffectiveLevel() == logging.DEBUG)
debug_mode = logging.getLogger().getEffectiveLevel() == logging.DEBUG
logger.info("Avviato")
while True:
@@ -57,18 +80,35 @@ async def worker(worker_id: int, cfg: object, pool) -> None:
logger.error(f"Errore durante l'esecuzione: {e}", exc_info=debug_mode)
await asyncio.sleep(1)
async def load_csv(record: tuple, cfg: object, pool) -> bool:
debug_mode = (logging.getLogger().getEffectiveLevel() == logging.DEBUG)
"""Carica ed elabora un record CSV utilizzando il modulo di parsing appropriato.
Args:
record: Una tupla contenente i dettagli del record CSV da elaborare (id, unit_type, tool_type, unit_name, tool_name).
cfg: L'oggetto di configurazione contenente i parametri del sistema.
pool: Il pool di connessioni al database.
Returns:
True se l'elaborazione del CSV è avvenuta con successo, False altrimenti.
"""
debug_mode = logging.getLogger().getEffectiveLevel() == logging.DEBUG
logger.debug("Inizio ricerca nuovo CSV da elaborare")
id, unit_type, tool_type, unit_name, tool_name = [x.lower().replace(" ", "_") if isinstance(x, str) else x for x in record]
logger.info(f'Trovato CSV da elaborare: ID={id}, Tipo={unit_type}_{tool_type}, Nome={unit_name}_{tool_name}')
id, unit_type, tool_type, unit_name, tool_name = [
x.lower().replace(" ", "_") if isinstance(x, str) else x for x in record
]
logger.info(
f"Trovato CSV da elaborare: ID={id}, Tipo={unit_type}_{tool_type}, Nome={unit_name}_{tool_name}"
)
# Costruisce il nome del modulo da caricare dinamicamente
module_names = [f'utils.parsers.by_name.{unit_name}_{tool_name}',
f'utils.parsers.by_name.{unit_name}_{tool_type}',
f'utils.parsers.by_name.{unit_name}_all',
f'utils.parsers.by_type.{unit_type}_{tool_type}']
module_names = [
f"utils.parsers.by_name.{unit_name}_{tool_name}",
f"utils.parsers.by_name.{unit_name}_{tool_type}",
f"utils.parsers.by_name.{unit_name}_all",
f"utils.parsers.by_type.{unit_type}_{tool_type}",
]
modulo = None
for module_name in module_names:
try:
@@ -77,7 +117,10 @@ async def load_csv(record: tuple, cfg: object, pool) -> bool:
logger.info(f"Funzione 'main_loader' caricata dal modulo {module_name}")
break
except (ImportError, AttributeError) as e:
logger.debug(f"Modulo {module_name} non presente o non valido. {e}", exc_info=debug_mode)
logger.debug(
f"Modulo {module_name} non presente o non valido. {e}",
exc_info=debug_mode,
)
if not modulo:
logger.error(f"Nessun modulo trovato {module_names}")
@@ -92,8 +135,17 @@ async def load_csv(record: tuple, cfg: object, pool) -> bool:
logger.info(f"Elaborazione completata per ID={id}")
return True
async def main():
"""Main function: avvia i worker e gestisce il ciclo principale."""
"""Funzione principale che inizializza e avvia il sistema.
Questa funzione si occupa di:
- Caricare la configurazione.
- Impostare il logging.
- Creare un pool di connessioni al database.
- Avviare i worker concorrenti per l'elaborazione dei CSV.
- Gestire l'arresto controllato del sistema.
"""
logger.info("Avvio del sistema...")
cfg = setting.Config()
@@ -102,7 +154,7 @@ async def main():
try:
# Configura il logging globale
log_level = os.getenv("LOG_LEVEL", "INFO").upper()
debug_mode = (logging.getLogger().getEffectiveLevel() == logging.DEBUG)
debug_mode = logging.getLogger().getEffectiveLevel() == logging.DEBUG
# Configura il logging con il formatter personalizzato
handler = logging.FileHandler(cfg.logfilename)
@@ -126,15 +178,14 @@ async def main():
user=cfg.dbuser,
password=cfg.dbpass,
db=cfg.dbname,
minsize=4,
maxsize=cfg.max_threads*4,
pool_recycle=3600
minsize=cfg.max_threads,
maxsize=cfg.max_threads * 4,
pool_recycle=3600,
)
# Avvia i worker
workers = [
asyncio.create_task(worker(i, cfg, pool))
for i in range(cfg.max_threads)
asyncio.create_task(worker(i, cfg, pool)) for i in range(cfg.max_threads)
]
logger.info("Sistema avviato correttamente. In attesa di nuovi task...")
@@ -151,5 +202,6 @@ async def main():
except Exception as e:
logger.error(f"Errore principale: {e}", exc_info=debug_mode)
if __name__ == "__main__":
asyncio.run(main())
asyncio.run(main())