From fbac5aa27794fc9c286c654e539ee30eaee52286 Mon Sep 17 00:00:00 2001
From: Alessandro Battilani <alessandro.battilani@gmail.com>
Date: Sun, 10 Nov 2024 15:05:32 +0100
Subject: [PATCH] initial

---
 pyproject.toml    | 12 ++++++++
 transform_file.py | 77 +++++++++++++++++++++++++++++++++++++++++++++++
 transfrom.py      | 45 +++++++++++++++++++++++++++
 3 files changed, 134 insertions(+)
 create mode 100644 pyproject.toml
 create mode 100644 transform_file.py
 create mode 100755 transfrom.py

diff --git a/pyproject.toml b/pyproject.toml
new file mode 100644
index 0000000..a2197cd
--- /dev/null
+++ b/pyproject.toml
@@ -0,0 +1,12 @@
+[project]
+name = "csv-ase"
+version = "0.1.0"
+description = "Add your description here"
+readme = "README.md"
+requires-python = ">=3.12"
+dependencies = [
+    "json",
+    "pandas",
+    "psycopg2",
+    "sqlalchemy>=2.0.36",
+]
diff --git a/transform_file.py b/transform_file.py
new file mode 100644
index 0000000..af1ad09
--- /dev/null
+++ b/transform_file.py
@@ -0,0 +1,77 @@
+import pandas as pd
+import json
+import psycopg2
+from sqlalchemy import create_engine
+
+# Configura la connessione al database PostgreSQL
+engine = create_engine('postgresql://asepg:batt1l0@10.211.114.101:5432/asedb')
+
+# Leggi il file intero e separa l'intestazione dal resto dei dati
+with open('DT0029_20241106044856.csv', 'r') as file:
+    lines = file.readlines()
+
+# Estrarre le informazioni dalle prime 7 righe
+if len(lines) >= 7:
+    tipo_centralina = lines[1].split()[0]  # Prima stringa nella seconda riga
+    unit = lines[1].split()[1]  # Seconda stringa nella seconda riga
+    ip_centralina = lines[2].split()[1]  # IP della centralina dalla terza riga
+    ip_gateway = lines[4].split()[1]  # IP del gateway dalla quinta riga
+    path = lines[5].split()[2] # Path dalla quinta riga
+else:
+    raise ValueError("Il file non contiene abbastanza righe per estrarre i dati richiesti.")
+
+# Elabora le righe dei dati a partire dalla riga 8 in poi
+for line in lines[7:]:
+    # Rimuovi spazi bianchi o caratteri di nuova riga
+    input_data = line.strip()
+
+    # Suddividi la stringa in sezioni usando ";|;" come separatore
+    parts = input_data.split(';|;')
+
+    # Verifica che ci siano almeno tre parti (timestamp, misure e nodi)
+    if len(parts) < 3:
+        print(f"Riga non valida: {input_data}")
+        continue
+
+    # Estrai la data/ora e le prime misurazioni
+    timestamp = parts[0]
+    measurements = parts[1]
+
+    # Estrai i valori di ciascun nodo e formatta i dati come JSON
+    nodes = parts[2:]
+
+    node_list = []
+    for i, node_data in enumerate(nodes, start=1):
+        # Dividi ogni nodo in valori separati da ";"
+        node_values = node_data.split(';')
+
+        # Imposta i valori a -1 se trovi "Dis.", altrimenti convertili in float
+        val1 = -9999 if node_values[0] == "Dis." else float(node_values[0])
+        val2 = -9999 if len(node_values) > 1 and node_values[1] == "Dis." else (
+            float(node_values[1]) if len(node_values) > 1 else None
+        )
+
+        node_dict = {
+            "num": i,
+            "val1": val1,
+            "val2": val2
+        }
+        node_list.append(node_dict)
+
+    # Crea il DataFrame con una colonna JSONB per i nodi
+    df = pd.DataFrame([{
+        "event_timestamp": pd.to_datetime(timestamp),
+        "tipo_centralina": tipo_centralina,
+        "unit": unit,
+        "ip_centralina": ip_centralina,
+        "path": path,
+        "ip_gateway": ip_gateway,
+        "battery_level": float(measurements.split(';')[0]),
+        "temperature": float(measurements.split(';')[1]),
+        "nodes_jsonb": json.dumps(node_list)  # Converti la lista di dizionari in una stringa JSON
+    }])
+
+    # Carica il DataFrame in una tabella PostgreSQL
+    df.to_sql('dataraw', engine, if_exists='append', index=False)
+
+print("Tutte le righe del file sono state caricate con successo nella tabella PostgreSQL!")
diff --git a/transfrom.py b/transfrom.py
new file mode 100755
index 0000000..f78fc59
--- /dev/null
+++ b/transfrom.py
@@ -0,0 +1,45 @@
+import pandas as pd
+import json
+import psycopg2
+from sqlalchemy import create_engine
+
+# Dati di input
+input_data = "2024/11/06 07:01:35;|;13.3;-2.4;|;2948.3;6283.5;|;2909.9;6406.1;|;2237.5;9813.8"
+
+# Suddividi la stringa in sezioni usando ";|;" come separatore
+parts = input_data.split(';|;')
+
+# Estrai la data/ora e le prime misurazioni
+timestamp = parts[0]
+measurements = parts[1]
+
+# Estrai i valori di ciascun nodo e formatta i dati come JSON
+nodes = parts[2:]
+
+node_list = []
+for i, node_data in enumerate(nodes, start=1):
+    val1, val2 = node_data.split(';')
+    node_dict = {
+        "num": i,
+        "val1": float(val1),
+        "val2": float(val2)
+    }
+    node_list.append(node_dict)
+
+# Crea il DataFrame con una colonna JSONB per i nodi
+df = pd.DataFrame([{
+    "event_timestamp": pd.to_datetime(timestamp),
+    "battery_level": float(measurements.split(';')[0]),
+    "temperature": float(measurements.split(';')[1]),
+    "nodes_jsonb": json.dumps(node_list)  # Converti la lista di dizionari in una stringa JSON
+}])
+
+# Connessione al database PostgreSQL
+engine = create_engine('postgresql://asepg:batt1l0@10.211.114.101:5432/asedb')
+
+# Carica il DataFrame in una tabella PostgreSQL
+df.to_sql('dataraw', engine, if_exists='append', index=False)
+
+print("Dati caricati con successo nella tabella PostgreSQL!")
+
+