La trascrizione automatica del parlato è facile con VoloSpeech

La piattaforma VoloSpeech consente di caricare e archiviare file audio-video e di ottenere la trascrizione automatica, sincronizzata col parlato, scaricabile nei formati Xml e Word.

VoloSpeech è un software di trascrizione automatica sviluppata in house che unisce le più moderne ed avanzate tecnologie di Speech to Text (STT), Automatic Speech Recognition (ASR) ed Information Retrieval (IR) per garantire ai propri clienti la trascrizione automatica, l’indicizzazione e la ricerca di qualunque contenuto di tipo multimediale.

Il servizio di speech-to-text utilizza moderni algoritmi di Deep-Learning e DNN (Deep Neural Network) per garantire livelli di precisione con picchi del 98% nel riconoscimento del parlato Speaker-Independent in trasmissioni informative. Tali algoritmi consentono anche di ottimizzare l’uso delle risorse HW necessarie permettendo di ottenere trascrizioni in tempi di circa 1:0,25.

La tecnologia di trascrizione alla base della piattaforma VoloSpeech può essere adattata per trascrivere qualsiasi lingua e la tecnologia Speaker Independent permette di ottenere risultati di alta precisione con qualsiasi parlator

Le soluzioni basate sulla piattaforma VoloSpeech sono implementate tramite apposito modulo di addestramento (set di addestramento) e in particolare attraverso la personalizzazione di:

  • modello acustico: è il modello che descrive le relazioni tra parole e suoni del linguaggio parlato (fonemi). Dipende da molti fattori, tra cui: Tipologia di audio e Rumorosità
  • modello del linguaggio: è il modello del linguaggio tipico del dominio di applicazione, ad esempio in
    ambito giornalistico, legale, sanitario, tecnologico, etc.
La trascrizione automatica del parlato applicata agli ambiti di Business

La tecnologia di trascrizione automatica può essere efficacemente utilizzata in progetti per dare valore a servizi e soluzioni di business del cliente, quali ad esempio:

  • applicazioni di CRM, per la trascrizione delle conversazioni con i clienti (es: Contact Center);
  • trascrizione ed indicizzazione di WEB TV per migliorarne il posizionamento nei motori di ricerca (SEO – Search Engine Optimization) consentendo la ricercabilità del testo trascritto;
  • trascrizione ed indicizzazione di contenuti multimediali in ambito interno e/o esterno all’azienda per migliorarne la fruibilità ad utenti non udenti;
  • applicazioni di e-learning, per facilitare il reperimento di contenuti pertinenti e per la creazione automatica della documentazione. Scarica la presentazione VoloSpeech per il settore E-Learning;
  • pannelli informativi con sottotitolazione dei video per la trasmissione anche in ambienti rumorosi o nei quali dove non è consentita la trasmissione audio;
  • valorizzazione di archivi multimediali permettendo la ricerca dei contenuti non solo nei metadati ma nel contenuto dei file;
     

    Inoltre, le competenze Volocom nell’ambito del trattamento dell’informazione permettono di adattare la soluzione alle necessità ed al dominio di conoscenza del cliente. Questo processo avviene tramite la personalizzazione di:

  • modello acustico del trascrittore: è il modello che descrive le relazioni tra suoni del linguaggio parlato e relativi fonemi lessico e modello linguistico del trascrittore: è il modello di linguaggio tipico del dominio di applicazione, ad esempio in ambito giornalistico, legale, sanitario, tecnologico, etc.;
  • modello di indicizzazione ed estrazione della conoscenza: è il modello attraverso il quale dall’informazione trascritta viene estratta la conoscenza vera e propria, ad esempio: Named Entities, Co-occurrences, Noun Phrases, etc.

L’ottimizzazione del modello nello specifico ambito avviene tramite apposito modulo di addestramento (set di addestramento).

Per ricevere maggiori informazioni sul servizio di trascrizione automatica scrivi a info@volocom.it.