Category: Speech Recognition

#MicrosoftGarage – #Dictate, Speech recognition for Office for simple users !

#MicrosoftGarage – #Dictate, Speech recognition for Office for simple users !

Hi! I’ve been trying to use Windows Speech Recognition features for dictation since Windows Vista, but I never get good results. Let me explain this, the technology to convert audio to text works very good, and for me, is much more faster / comfortable than typing.  However the way that we need to use the […]

>>Read more

#MicrosoftGarage – #Dictate, Reconocimiento de voz para Office para usuarios normales!

#MicrosoftGarage – #Dictate, Reconocimiento de voz para Office para usuarios normales!

Hola! Desde Windows Vista yo he intentado utilizar el Speech Recognition Engine en Windows, nunca he obtenido buenos resultados. La capacidad de hablar frente a escribir en el teclado es algo que es mucho más natural y además que nos permite más velocidad. El proceso de reconocimiento de voz funciona muy bien, sin embargo, lo […]

>>Read more

#CognitiveServices – How to create audio files for Custom Speech Service (#CRIS)

#CognitiveServices – How to create audio files for Custom Speech Service (#CRIS)

Hello! A few days ago I was asked about an easy way to create audio files to be used as datasets in Custom Speech Service (CRIS). As I mentioned in a previous post, the audio files must have special features, so it is important to create them correctly. Note: the files are WAVs files, mono and […]

>>Read more

#CognitiveServices – Cómo crear archivos de Audio para utilizar en Custom Speech Service (#CRIS)

#CognitiveServices – Cómo crear archivos de Audio para utilizar en Custom Speech Service (#CRIS)

Hola ! Hace unos días me preguntaron sobre una forma fácil de crear archivos de audio para usar como DataSets en Custom Speech Service (CRIS). Como ya comenté en un post anterior, los archivos de audio que se utilizan deben tener unas características especiales, con lo que es importante crearlos de forma correcta. Nota: Que sean […]

>>Read more

#CognitiveServices – Sample Console App to perform audio analysis using Custom Speech Service (#CRIS)

#CognitiveServices – Sample Console App to perform audio analysis using Custom Speech Service (#CRIS)

Hi ! Yesterday I wrote a post on how to create and publish an Acoustinc Model in Custom Speech Service to perform a text-to-speech process (TTS). The next step is to add some C# code in an App to use this service. For this sample I will use a sample wav file with single sentencente. […]

>>Read more

#CognitiveServices – Console App de ejemplo para analizar audios con Custom Speech Service (#CRIS)

#CognitiveServices – Console App de ejemplo para analizar audios con Custom Speech Service (#CRIS)

  Hola ! Ayer publiqué un paso a paso sobre como crear un modelo de reconocimiento de audio a texto con Custom Speech Service. El siguiente paso es un ejemplo de código sobre cómo utilizar el mismo. Para este ejemplo utilizo un archivo wav con un simple párrafo. Desde la consola de prueba de CRIS […]

>>Read more

#CognitiveServices – Tutorial to create and publish a complete model in Custom Speech Service (#CRIS)

#CognitiveServices – Tutorial to create and publish a complete model in Custom Speech Service (#CRIS)

Hi ! This is my 3rd or 4th time on this, so I better write about this so I won’t forget next time. So, let´s start from the beggining, Custom Speech Service definition (we used to know this as CRIS). The Custom Speech Service lets you create custom speech-to-text models, tailored to your application’s environment, […]

>>Read more

#CognitiveServices – Los N pasos que debes seguir para crear tu modelo en Custom Speech Service (#CRIS)

#CognitiveServices – Los N pasos que debes seguir para crear tu modelo en Custom Speech Service (#CRIS)

Hola ! Es la 3ra o 4ta vez que hago esto y voy a usar este post como reminder de los pasos que debo seguir. Empecemos por explicar que es Custom Speech Service, antes conocido como CRIS. Custom Speech Service es un servicio parte de Microsoft Cognitive Services que permite crear modelos personalizados de voz […]

>>Read more