Category: Speech Recognition

#AI – Some news in Cognitive Services presented at #MSBuild 2018

#AI – Some news in Cognitive Services presented at #MSBuild 2018

Hi! Again, it’s time to write about some topics what has most caught my attention in the news presented during Microsoft Build 2018. In this case I will only comment on some news related to Vision and Speech. Vision Computer Vision, now supports Object Detection. We have the ability to detect objects in an image. … Continue reading #AI – Some news in Cognitive Services presented at #MSBuild 2018

>>Read more

#AI – Algunas novedades en Cognitive Services presentadas en #MSBuild 2018

#AI – Algunas novedades en Cognitive Services presentadas en #MSBuild 2018

Buenas! Otra vez apunto el post a lo que mas me ha llamado la atención en las novedades presentadas en Microsoft Build 2018. En este caso solo comentare algunas novedades relacionadas a Vision y Speech. Vision Computer Vision, ahora soporta Object Detection. Tenemos la capacidad de detectar objetos en una imagen. Tengo que ver mas … Continue reading #AI – Algunas novedades en Cognitive Services presentadas en #MSBuild 2018

>>Read more

#AI – Real-time audio translation using #CognitiveServices

#AI – Real-time audio translation using #CognitiveServices

Hi! I still have some work to do after the Azure Global Bootcamp. After showing the Audio Bot in live mode, one of the classic questions in Canada, is that what happens with French?, is this supported? Well, Cognitive Services offers us several services that can be useful to create multi cultural apps, mostly if … Continue reading #AI – Real-time audio translation using #CognitiveServices

>>Read more

#AI – Traducción en tiempo real de audio utilizando #CognitiveServices

#AI – Traducción en tiempo real de audio utilizando #CognitiveServices

Buenas! Sigo con los pendientes después del Azure Global Bootcamp. Después de mostrar el Audio Bot, una de las preguntas clásicas en Canada, ¿es que pasa con el Frances? Pues bien, Cognitive Services nos ofrece varios servicios que pueden sernos de utilidad. Independientemente de los servicios de CS que utilicemos, el proceso suele ser siempre … Continue reading #AI – Traducción en tiempo real de audio utilizando #CognitiveServices

>>Read more

#MicrosoftGarage – #Dictate, Speech recognition for Office for simple users !

#MicrosoftGarage – #Dictate, Speech recognition for Office for simple users !

Hi! I’ve been trying to use Windows Speech Recognition features for dictation since Windows Vista, but I never get good results. Let me explain this, the technology to convert audio to text works very good, and for me, is much more faster / comfortable than typing.  However the way that we need to use the […]

>>Read more

#MicrosoftGarage – #Dictate, Reconocimiento de voz para Office para usuarios normales!

#MicrosoftGarage – #Dictate, Reconocimiento de voz para Office para usuarios normales!

Hola! Desde Windows Vista yo he intentado utilizar el Speech Recognition Engine en Windows, nunca he obtenido buenos resultados. La capacidad de hablar frente a escribir en el teclado es algo que es mucho más natural y además que nos permite más velocidad. El proceso de reconocimiento de voz funciona muy bien, sin embargo, lo […]

>>Read more

#CognitiveServices – How to create audio files for Custom Speech Service (#CRIS)

#CognitiveServices – How to create audio files for Custom Speech Service (#CRIS)

Hello! A few days ago I was asked about an easy way to create audio files to be used as datasets in Custom Speech Service (CRIS). As I mentioned in a previous post, the audio files must have special features, so it is important to create them correctly. Note: the files are WAVs files, mono and […]

>>Read more

#CognitiveServices – Cómo crear archivos de Audio para utilizar en Custom Speech Service (#CRIS)

#CognitiveServices – Cómo crear archivos de Audio para utilizar en Custom Speech Service (#CRIS)

Hola ! Hace unos días me preguntaron sobre una forma fácil de crear archivos de audio para usar como DataSets en Custom Speech Service (CRIS). Como ya comenté en un post anterior, los archivos de audio que se utilizan deben tener unas características especiales, con lo que es importante crearlos de forma correcta. Nota: Que sean […]

>>Read more

#CognitiveServices – Sample Console App to perform audio analysis using Custom Speech Service (#CRIS)

#CognitiveServices – Sample Console App to perform audio analysis using Custom Speech Service (#CRIS)

Hi ! Yesterday I wrote a post on how to create and publish an Acoustinc Model in Custom Speech Service to perform a text-to-speech process (TTS). The next step is to add some C# code in an App to use this service. For this sample I will use a sample wav file with single sentencente. […]

>>Read more

#CognitiveServices – Console App de ejemplo para analizar audios con Custom Speech Service (#CRIS)

#CognitiveServices – Console App de ejemplo para analizar audios con Custom Speech Service (#CRIS)

  Hola ! Ayer publiqué un paso a paso sobre como crear un modelo de reconocimiento de audio a texto con Custom Speech Service. El siguiente paso es un ejemplo de código sobre cómo utilizar el mismo. Para este ejemplo utilizo un archivo wav con un simple párrafo. Desde la consola de prueba de CRIS […]

>>Read more