Transcriere automata dupa fisiere audio. Limba romana

Salutare. Serviciile de recunoastere vocala si transcriere au luat avant. Google si apoi alte companii exploreaza si vin frecvent cu noi aplicatii pe piata. Este timpul pentru explorarea acestor noi tehnologii.

API-uri de transcriere voice-to-text (sau speech-to-text)

Exista companii care pun la dispozitie api-uri de obtinere programatica de transcrieri text dupa fisiere audio. Se pot trimite zeci de ore de vorbire sub forma de fisiere audio in orice format si se obtin traduceri cu fidelitate peste 95%.

Pentru cuvinte care se stalcesc la transcriere se pot livra dictionare care in dreapta transcrierea automata.

Se pot identifica mai multi vorbitori (speakeri) si in fisierul transcris se marcheaza trecerea de la un speaker la altul.

Fisierele audio multicanal sunt procesate astfel incat transcrierea reflecta fiecare canal.

API-urile puse la dispozitie permit trimiterea fisierului audio, initiindu-se job-ul de transcriere. Se pate intoarce un ID al job-ului de transcriere. Pe baza lui se poate interoga API-ul respectiv pentru a afla starea transcrierii.

Cand aceasta stare este „finalizat” se poate solicita fisierul transcris. formatul acestuia poate fi text sau json. Fisierul json marcheaza timpul efectiv la care este pronuntat fiecare cuvant.

La initierea transcrierii se poate configura api-ul sa efectueze o notificare catre serverul client la care sa intoarca fie starea transcrierii, fie sa apeleze un script callback pe serevrul client. Acestui script i se livreaza fisierul transcrierii si scriptul il poate salva pe serveru client si poate trimite eentual un email catre utilizator in care sa se anunte finalizarea transcrierii si disponibilitatea acesteia.

Apelurile catre API se pot face prin curl (in fereastra de comanda), prin PHP sau Python ori Node.js

Aplicabilitatea serviciilor de transcriere vocala

  • Transcrierea interviurilor
  • Subtitrarea filmelor
  • transcrierea sedintelor de judecata
  • transcrierea contractelor verbale
  • transcrierea jurnalelor vorbite
  • transcrierea cursurilor universitare, a conferintelor, etc
  • transcrierea live (a fisierelor stream)
  • traducerea transcrierilor prin alte api-uri carora se trimit fisierele text transcrise
  • etc
 

Leave a Reply

Adresa ta de email nu va fi publicată.

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.