La trascrizione automatica del parlato è facile con VoloSpeech

La piattaforma VoloSpeech di Volocom unisce le più moderne ed avanzate tecnologie di Speech to Text (STT), Automatic Speech Recognition (ASR) ed Information Retrieval (IR) per garantire ai propri clienti la trascrizione automatica, l’indicizzazione e la ricerca di qualunque contenuto di tipo multimediale.

L’utilizzo di Neural Networks (NN) ed algoritmi di Deep Learning (DL) permette alla piattaforma VoloSpeech di raggiungere elevati livelli di precisione (superiori al 95%) mantenendo tempi di trascrizione estremamente contenuti (realtime factor: < 0.3 su singolo core).

Trascrizione automatica audio e video

Trascrizione automatica audio e video

La tecnologia Speaker Independent permette inoltre di eliminare completamente la fase di addestramento sullo specifico parlatore.
Il motore di trascrizione alla base della piattaforma VoloSpeech può essere adattato per trascrivere qualsiasi lingua ed in contesti acustici diversi come ad esempio audio microfonico, audio telefonico, etc.

Le elevate competenze sviluppate negli anni da Volocom, sia nell’ambito delle tecnologie di trascrizione del parlato che nel settore del Knowledge Management, permettono di offrire ai propri clienti un servizio completo, basato sulle reali esigenze degli utenti finali, con soluzioni realizzate su misura che permettano di acquisire, trascrivere e gestire l’informazione in maniera ottimale.

La trascrizione automatica del parlato applicata agli ambiti di Business

La tecnologia di Speech to Text può essere efficacemente utilizzata in progetti per dare valore a servizi e soluzioni di business del cliente, quali ad esempio:
  • applicazioni di CRM, per la trascrizione delle conversazioni con i clienti (es: Contact Center)
  • trascrizione ed indicizzazione di WEB TV per migliorarne il posizionamento nei motori di ricerca (SEO – Search Engine Optimization) consentendo la ricercabilità del testo trascritto
  • trascrizione ed indicizzazione di contenuti multimediali in ambito interno e/o esterno all’azienda per migliorarne la fruibilità ad utenti non udenti
  • applicazioni di e-learning, per facilitare il reperimento di contenuti pertinenti e per la creazione automatica della documentazione. Scarica la presentazione VoloSpeech per il settore E-Learning
  • pannelli informativi con sottotitolazione dei video per la trasmissione anche in ambienti rumorosi o nei quali dove non è consentita la trasmissione audio
  • valorizzazione di archivi multimediali permettendo la ricerca dei contenuti non solo nei metadati ma nel contenuto dei file
     
    Le competenze Volocom nell’ambito del trattamento dell’informazione permettono di adattare la soluzione alle necessità ed al dominio di conoscenza del cliente. Questo processo avviene tramite la personalizzazione di:
  • modello acustico del trascrittore: è il modello che descrive le relazioni tra suoni del linguaggio parlato e relativi fonemi
    lessico e modello linguistico del trascrittore: è il modello di linguaggio tipico del dominio di applicazione, ad esempio in ambito giornalistico, legale, sanitario, tecnologico, etc.
  • modello di indicizzazione ed estrazione della conoscenza: è il modello attraverso il quale dall’informazione trascritta viene estratta la conoscenza vera e propria, ad esempio: Named Entities, Co-occurrences, Noun Phrases, etc

L’ottimizzazione del modello nello specifico ambito avviene tramite apposito modulo di addestramento (set di addestramento).

Per ricevere maggiori informazioni scrivi a info@volocom.it.