Come funziona ECATE AI

Il processo

Dal requisito al report: 3 passi

L'interfaccia è progettata per essere accessibile anche a chi non ha competenze cloud specifiche. L'AI si occupa della complessità; tu inserisci i requisiti in linguaggio naturale.

Descrivi il tuo workload

Inserisci i requisiti tecnici del tuo progetto cloud: numero di VM, vCPU, RAM, storage, sistema operativo, tipo di workload e ore/giorno di utilizzo previste. Puoi descrivere anche workload complessi con più VM di tipologia diversa (compute-intensive, memory-intensive, application server, database, ecc.).

L'interfaccia accetta anche descrizioni in linguaggio semi-naturale: il motore RAG interpreta il contesto e ricava i parametri tecnici in autonomia.

Numero VM · vCPU · RAM Storage · OS (Linux / Windows) Workload type Ore/giorno di utilizzo Configurazioni multi-VM

Il motore RAG analizza e confronta

Il cuore di ECATE AI è un motore RAG (Retrieval-Augmented Generation) basato su Mistral medium. Il processo è in due fasi:

Prima, il sistema recupera le knowledge base sui cataloghi istanze di AWS, Azure e GCP (naming convention, famiglie di istanze, rapporti vCPU/RAM, casi d'uso ottimali). Poi, con questo contesto iniettato nel prompt, il modello identifica le istanze ottimali per ogni provider in base ai requisiti dichiarati.

Contestualmente, il price agent recupera i prezzi live dalle API ufficiali — Infracost per AWS e GCP, Azure Retail Prices API per Azure — su datacenter italiani (eu-south-1 Milano, Italy North, europe-west8). Nessun dato statico: i prezzi sono aggiornati in tempo reale.

Mistral medium via API ChromaDB vector store Prezzi live (EUR) Istanze raccomandate + alternative Logica di raccomandazione deterministica

Ricevi il report comparativo

Il risultato è un report strutturato con raccomandazione primaria, confronto costi mensili in EUR per i tre provider, istanze alternative e piano di ottimizzazione.

Il recommendation engine usa logica deterministica (non LLM) per la raccomandazione finale: delta >15% = raccomandazione forte; 5–15% = raccomandazione condizionale; ≤5% = astensione esplicita con motivazione. Se l'utilizzo è ≥80% viene aggiunta una nota sul dimensionamento marginale.

Il report include anche la stima di risparmio ottenibile con Reserved Instances (AWS), Azure Reservations e Committed Use Discounts (GCP), che possono ridurre la spesa on-demand fino al 40%. Il report è esportabile in PDF.

Costo mensile stimato (on-demand) Confronto AWS vs Azure vs GCP Recommendation engine deterministico Piano RI / CUD fino a -40% Export PDF

Architettura

Come sono connessi i componenti

ECATE AI è un sistema multi-agente: ogni agente ha una responsabilità precisa e i risultati vengono aggregati prima di essere presentati all'utente.

Input

Frontend (HTML/JS)

↓

Backend

Node.js / Express

→

AI Agent

RAG Mistral

←→

Vector DB

ChromaDB

↓

AWS · GCP Pricing

Infracost API

Azure Pricing

Azure Retail API

Recommendation

Engine Python

↓

Output

Report PDF · Dashboard

Perché RAG e non LLM puro?

Un LLM generico addestrato su dati pubblici conosce i cataloghi cloud solo fino alla sua data di training. I prezzi cambiano, le istanze si aggiornano, le region italiane sono sottorappresentate nei dataset di addestramento.

Con il pattern RAG (Retrieval-Augmented Generation), il modello non si affida alla propria memoria parametrica per i dati di pricing: recupera prima le informazioni aggiornate (catalogo istanze, naming convention, pricing live) e poi le usa come contesto per generare la raccomandazione. Il risultato è più accurato, aggiornabile senza re-training e verificabile.

La raccomandazione finale è però deterministica (Python puro, nessun LLM): confronta delta di prezzo con soglie fisse, per evitare che variazioni nell'output del modello influenzino la raccomandazione commerciale verso il cliente.

Coverage

Provider e regioni supportate

Focus su datacenter italiani per garantire conformità GDPR e rispondere ai requisiti di sovranità del dato del mercato italiano.

AWS

Amazon Web Services

Region: eu-south-1 (Milano)
Prezzi on-demand e Reserved Instances
Linux & Windows
Famiglie: compute (c), memory (r), general (m), storage (i)
Confronto 1-year e 3-year RI

via Infracost Cloud Pricing API

Azure

Microsoft Azure

Region: Italy North
Prezzi in EUR senza autenticazione
Linux & Windows
Serie: Standard, Dv5, Ev5, Fsv2, NC
Azure Reservations 1Y e 3Y

via Azure Retail Prices API (ufficiale)

GCP

Google Cloud Platform

Region: europe-west8 (Milano)
Tipi: N2, E2, C3 machine types
Varianti: Standard, HighMem, HighCPU
Committed Use Discounts 1Y e 3Y
Spot VM estimate

via Infracost Cloud Pricing API

Funzionalità

Cosa fa concretamente

🤖

AI Analysis (RAG) Interpreta i requisiti in linguaggio semi-naturale, identifica le istanze ottimali per ogni provider tramite retrieval sul catalogo cloud aggiornato.

💰

Cost Forecast live Prezzi on-demand recuperati in tempo reale dalle API ufficiali. Stima mensile e annuale in EUR, separata per provider.

⚡

Report comparativo Raccomandazione primaria, provider alternativo, piano di ottimizzazione con Reserved Instances / Committed Use Discounts.

🧩

Multi-VM Supporto a configurazioni complesse con più VM di tipologia diversa (es. application server + database + storage node).

🌍

Focus region italiana Tutti i prezzi si riferiscono a datacenter in Italia. Nessuna stima su region estere come proxy.

🔒

SLA & Compliance Il report include considerazioni su GDPR, sovranità del dato e SLA differenziati per provider, non solo il confronto di costo.

📄

Export PDF Il report è esportabile in PDF strutturato, pronto per essere condiviso internamente o allegato a una proposta commerciale.

🎯

Recommendation engine deterministico La raccomandazione finale è calcolata con logica Python (delta di prezzo vs soglie fisse), non affidata all'output variabile dell'LLM.

Stack tecnologico

Tecnologie dichiarate apertamente

Crediamo nella trasparenza sulle scelte tecnologiche. Ogni componente è stato scelto per affidabilità, indipendenza e coerenza con il posizionamento europeo.

Motore AI

Mistral medium

LLM europeo per l'analisi dei requisiti e la generazione dei report.

Perché: LLM europeo, dati processati in EU, buon rapporto costo/qualità per task di classification e recommendation.

Vector store

ChromaDB

Database vettoriale per il retrieval delle knowledge base sui cataloghi istanze cloud.

Perché: Self-hosted, zero dipendenze esterne per il retrieval, integrazione nativa con LangChain.

Pricing AWS · GCP

Infracost Cloud Pricing API

API open source per i prezzi reali di AWS e Google Cloud, aggiornati settimanalmente. Self-hosted via Docker Compose su VPS OVH.

Perché: Dati non statici, self-hosted per latenza e privacy, open source e verificabile.

Pricing Azure

Azure Retail Prices API

API ufficiale Microsoft per i prezzi Azure in EUR. Accesso pubblico senza autenticazione.

Perché: Fonte ufficiale Microsoft, aggiornata in tempo reale, nessuna dipendenza da terze parti.

Backend

Node.js / Express + Python

Backend API in Node.js/Express. Agenti AI (RAG, price agent, translation agent, recommendation engine) in Python.

Perché: Node per l'API layer (veloce, event-driven), Python per l'ecosistema AI/ML (LangChain, Mistral SDK, Infracost).

Infrastruttura

OVH VPS · Milano

Hosting su VPS OVH in Italia. Nginx per SSL termination. MySQL per il database applicativo.

Perché: Dato ospitato in Italia, provider europeo, compliance GDPR by design, latenza ottimale per utenti italiani.

Orchestrazione AI

LangChain

Framework per orchestrare il pipeline RAG: chunking, embedding, retrieval e prompt construction.

Perché: Astrae la complessità del pipeline RAG, semplifica il switching di modelli e vector store.

Export

jsPDF

Generazione del report PDF lato client, con layout strutturato e branding ECATE AI.

Perché: Nessun server-side rendering necessario, il PDF viene generato direttamente nel browser dell'utente.