O Speech to CSV é uma aplicação de processamento de dados para Windows desenvolvida em C#, utilizando o .NET framework. A partir de arquivos locais contendo áudio (como MP3, MP4, WAV, WMV ou AVI), o software permite o corte de múltiplos trechos da faixa de áudio e a rápida descrição desses trechos.

O projeto surgiu como uma solução para a escassez de dados para o treinamento de redes neurais especializadas em reconhecimento de voz, mesmo com a quantidade enorme de faixas de áudio de boa qualidade em vídeos, podcasts ou mensagens de voz.

O código fonte do Speech to CSV será disponibilizado em breve, em conjunto com uma nova versão chamada "Detect&Write Speech", que permitirá o download automático de vídeos a partir de listas de URL e contará com detecção automática de voz.

Software de tratamento de arquivos de áudio e vídeo para um formato adequado ao treinamento de inteligências artificiais.

Concluído

MAIS INFORMAÇÕES

Voltar