Introduzione a RunAI
Sempre più spesso mi capita di fare appuntamenti con aziende di ogni tipo e settore per parlare di efficientamento dei comparti aziendali.
Il problema della sicurezza dei dati
Molte di queste aziende vorrebbero sviluppare soluzioni basate su intelligenza artificiale ma la maggior parte delle aziende opera in contesti dove la sicurezza dei dati è un fattore critico e fondamentale da conservare.
Questo crea spesso un dilemma, poiché le tecnologie AI più avanzate richiedono l'accesso a grandi quantità di dati per funzionare al meglio e, per funzionare al meglio, riutilizzano molto spesso gli stessi dati degli utenti per riaddestrare e migliorare i loro modelli.
Da questo punto di vista, aziende che operano con dati sensibili e privati, con contratti riportanti dati come nomi e cognomi di clienti o informazioni finanziarie, potrebbero avere serie difficoltà a condividere i propri dati con piattaforme AI esterne.
La soluzione: un datacenter di inferenza interno
Perché non investire per creare un piccolo datacenter di inferenza in proprio?
Un datacenter di inferenza interno permetterebbe alle aziende di utilizzare modelli AI senza dover condividere i propri dati sensibili con terze parti, garantendo la massima sicurezza e controllo sui propri dati.

Architettura di RunAI
È così che è nato RunAI. RunAI offre una piattaforma sicura con uno schema architetturale semplice ma blindato.

Sicurezza e privacy dei dati
Il client invia una richiesta su RunAI.it, protetto da connessione SSL TLS 1.3, che funge da proxy. Un load balancer valuta il server meno impegnato e reindirizza la chiamata verso quel nodo. Proxy e Nodi sono collegati tramite un tunnel VPN criptato end-to-end.

La richiesta arriva sul nodo e viene processata dal modello. Una volta generata la risposta questa viene cancellata un millisecondo dopo essere stata inviata al client. Questo approccio garantisce che i dati sensibili non rimangano mai memorizzati sul server, garantendo il massimo livello di sicurezza e privacy.
I log salvati dalla piattaforma sono solo ed esclusivamente log tecnici, non contenenti informazioni sui dati inviati dagli utenti né le risposte fornite.
L'infrastruttura è totalmente italiana nel rispetto della normativa GDPR.
I modelli di RunAI
RunAI utilizza modelli linguistici di ultima generazione, addestrati su dataset di testo enormi e diversificati per garantire risposte accurate, creative e pertinenti a una vasta gamma di prompt.

RunAI Core
È il modello centrale, da utilizzare come base di partenza, è un modello equilibrato e affidabile, utilizzabile per la maggior parte delle richieste. I costi sono calcolati per milione di token in input e in output. RunAI Core è quindi il modello più conveniente per le applicazioni che richiedono un buon equilibrio tra prestazioni e costo. È disponibile sia sulla Chat che sulla piattaforma API.
RunAI Insight
È il modello specializzato per spiegazioni chiare, approfondite e ben strutturate. È ideale per chi necessita di comprendere a fondo i meccanismi dietro le risposte generate da unAI o per ottenere analisi dettagliate su un determinato argomento. Anche RunAI Insight è disponibile sia sulla Chat che sulla piattaforma API. Costo calcolato per milione di token di input e di output.
RunAI Vision
È il nostro modello multimodale, comprende sia il testo che le immagini. È in grado di generare descrizioni dettagliate delle immagini, rispondere a domande su contenuti visivi e interpretare documenti con funzionalità di OCR e riconoscimento di layout. È disponibile sia sulla Chat che nella piattaforma API. Costo calcolato per milione di token di input e di output.
RunAI Swift
È un modello velocissimo, leggero e molto fluido: perfetto per risposte immediate in Chatbot, applicazioni real-time o interfacce interattive che richiedono alta velocità di risposta. È disponibile sia sulla Chat che sulla piattaforma API. Costo calcolato per milione di token di input e di output.
RunAI Codex
È il modello specializzato nella generazione e comprensione del codice. Può generare codice in diversi linguaggi, tradurre codice da un linguaggio all'altro e persino spiegare come funziona un determinato scope del tuo codice. È disponibile sia sulla Chat che sulla piattaforma API. Costo calcolato per milione di token di input e di output.
RunAI Nano
È il modello più leggero. Ottimizzato per operazioni semplici a bassissimo costo. Ideale per applicazioni che richiedono un utilizzo efficiente delle risorse, come ad esempio chatbot basati su testo o sistemi di supporto automatizzato. È disponibile solo sulla piattaforma API. Il costo è calcolato per milione di token di input e di output.
RunAI Vector Engine
È il motore semantico che calcola i vettori di rappresentazione per testo, immagini e altri tipi di dati (di base sempre convertiti in testo ad esempio base64). Può essere utilizzato per applicazioni come la ricerca semantica, l'analisi del sentiment e la creazione di sistemi di raccomandazione. È disponibile su piattaforma API. Il costo in questo caso viene calcolato per secondi di elaborazione.
Altre funzionalità di RunAI
Nel portale RunAI sono disponibili altre chicche interessanti. Ad esempio TTS e STT (Text-to-Speech & Speech-to-Text). La cosa importante da sottolineare è che per fornire questi due servizi, RunAI non effettua chiamate a servizi cloud esterni, ma utilizza le Web Speech API di Google Chrome in locale. Questo permette anche in questo caso di garantire un'elevata velocità e sicurezza dei dati.
Tutta la cronologia di Chat ha persistenza solo sul dispositivo dell'utente, tutte le conversazioni e le chat possono essere cancellate in locale. L'utente può perfino cancellare i singoli messaggi come farebbe in una qualsiasi chat di WhatsApp e può eliminare in un colpo solo tutte le conversazioni.
Modalità di pagamento e gestione credito
RunAI funziona tramite credito a consumo. Non abbiamo voluto inserire piani in abbonamento dove l'utente è costretto a pagare un canone mensile anche se non utilizza il servizio. In RunAI l'utente effettua una ricarica, come se fosse una ricarica telefonica ed ha libero accesso a tutti i modelli sia in chat che su piattaforma API. Ogni chiamata viene conteggiata con logica di costo per milione di token in input e in output e tempo di inferenza per il Vector Engine.
Questo sistema permette un controllo totale del proprio budget. L'utente può scegliere quanto spendere ed è sempre consapevole dei costi sostenuti. Il credito residuo viene aggiornato automaticamente dopo ogni singola chiamata. Non ci sono sorprese inattese, una volta esaurito il credito RunAI si ferma automaticamente e non rischi addebiti imprevisti. Il sistema invia delle mail per notificare scarso credito al raggiungimento di 10euro residui e una seconda email al raggiungimento di 5 euro residui di budget.
L'utente potrà ricaricare il credito in totale autonomia dalla sua area riservata tramite PayPal o Stripe.
Invito all'iscrizione e omaggio
Visita il sito runai.it, iscriviti e riceverai in omaggio 5 euro di credito per iniziare a utilizzare la piattaforma.