Cómo naturallyspeaking aprende a reconocer el habla

Las computadoras son muy inteligente cuando se trata de cosas cerebro-Esfuerzo como jugar al ajedrez y llenar las declaraciones de impuestos, por lo que pueden pensar que serían genios en las actividades de “simples” como el reconocimiento de rostros o la comprensión del habla.

Pero después de unos 50 años de tratar de hacer que las computadoras hacen estas cosas simples, los programadores han llegado a la conclusión de que una habilidad no es sencillo porque los humanos dominar fácilmente. De hecho, el cerebro y los ojos y los oídos están repletos de detección sofisticados equipos de procesamiento que aún se ejecuta anillos alrededor de cualquier cosa que podamos diseñar en el silicio y el metal.

Nosotros, los humanos pensamos que es fácil de entender el habla porque todo el muy duro trabajo se realiza antes de que nos volvemos conscientes de ello. Para nosotros, parece como si las palabras en inglés Basta con meter en la cabeza en cuanto la gente abren la boca. La naturaleza inconsciente (o preconsciente) del proceso hace que sea doblemente difícil para los programadores informáticos para imitar.

Video: Dragon NaturallySpeaking 13 Premium: Voice Commands

Para tener una idea de por qué los equipos tienen tantos problemas con el habla, piensa en algo que ellos son muy buenos en el reconocimiento y la comprensión: Números de teléfono de marcación por tonos. Esos baches y bloops en las líneas telefónicas son mucho más significativo para los ordenadores de lo que son para las personas. Varias características importantes hacen los tonos del teléfono un idioma fácil para los ordenadores, se enumeran a continuación. Inglés, por el contrario, es completamente diferente.

  • La marcación por tonos “vocabulario” tiene sólo 12 “palabras” en él. Después de conocer los tonos para los diez dígitos más * y #, que se encuentra. Inglés, por el contrario, tiene cientos de miles de palabras.

  • Ninguna de las palabras suenan igual. En el teléfono de marcación por tonos, el “1” tono es claramente diferente del tono “7”. Pero Inglés tiene homónimos, como nuevos y GNU, y cerca de homónimos, como más alegre y casarse con ella. A veces frases enteras suenan igual: “Los hijos plantean la carne” y “los rayos del sol se encuentran,” por ejemplo.

  • Todos los “altavoces” de la lengua dicen las palabras de la misma manera. Pulse el botón 5 en cualquier teléfono, y se obtiene exactamente el mismo tono. Pero un anciano y una niña de 10 años de edad, utilizan muy diferentes tonos cuando hablar-y la gente de Gran Bretaña, Canadá y los Estados Unidos pronuncian las mismas palabras en inglés de manera muy diferente.

  • Contexto no tiene sentido. Para el teléfono, un 1 es un 1 es un 1. ¿Cómo interpreta el tono no depende de la cantidad anterior o el siguiente número. Pero en Inglés escrito, el contexto es todo. Tiene sentido de “ir a Nueva York.” Pero tiene mucho menos sentido de “ir de dos Nueva York” o “ir demasiado Nueva York.”

Artículos Relacionados