Domande frequenti
Tutto quello che serve sapere prima di iniziare
Raccogliamo le domande che i clienti fanno più spesso prima di avviare un progetto di riconoscimento immagini o vocale. Le risposte sono dirette, senza semplificazioni eccessive.
Risposte alle domande tecniche
-
Il sistema elabora immagini in formato JPEG, PNG, WebP e TIFF con risoluzione fino a 4K. Riconosce oggetti, volti, testi stampati e scritti a mano, scene e contesti ambientali. Le prestazioni variano in base alla qualità dell'input: immagini con buona illuminazione e messa a fuoco producono risultati più precisi rispetto a scatti mossi o sottoesposti.
-
Sì. Il riconoscimento vocale opera con latenza inferiore a 200ms su flussi audio compressi a 16kHz mono. Il riconoscimento immagini in modalità batch elabora fino a 300 frame al minuto in condizioni standard di rete. Per flussi video live la frequenza dipende dalla larghezza di banda disponibile e dal carico del server al momento della richiesta.
-
Tutti i dati viaggiano su canale cifrato TLS 1.3. Nessun contenuto viene conservato sui server dopo l'elaborazione, salvo esplicita richiesta del cliente per scopi di audit. Gli accordi di riservatezza sono disponibili prima dell'avvio di qualsiasi progetto e vengono personalizzati in base alla sensibilità dei dati trattati.
-
Il modulo supporta italiano, inglese, tedesco, francese e spagnolo. Per l'italiano sono disponibili modelli ottimizzati per accenti regionali del nord Italia, incluse le varianti lombarde. L'aggiunta di nuove lingue dipende dalla disponibilità di dati di addestramento sufficienti per la varietà dialettale richiesta.
-
L'integrazione avviene tramite API REST con documentazione OpenAPI 3.0. Sono disponibili librerie client per Python, Node.js e Java. L'onboarding tecnico include sessioni di configurazione dedicate. Per ambienti on-premise o con vincoli di connettività particolari, si valuta caso per caso la fattibilità di un deployment locale.
Prima e dopo l'integrazione
Un confronto diretto tra gestione manuale e sistema automatizzato su attività ricorrenti.
Classificazione documenti a mano
Un operatore esamina ogni documento, legge il contenuto, assegna una categoria e lo archivia. Su 400 documenti al giorno il tempo medio è di circa 6 ore lavorative, con un tasso di errore che cresce nelle ultime ore del turno.
Classificazione automatica in coda
Lo stesso volume di 400 documenti viene elaborato in batch notturno in meno di 12 minuti. L'operatore rivede solo i casi con confidenza inferiore alla soglia configurata, che in media rappresentano meno di 15 documenti al giorno.