Cómo NaturallySpeaking aprende a reconocer el habla

Las computadoras son muy inteligentes cuando se trata de cosas cerebro-colar como jugar al ajedrez y llenar las declaraciones de impuestos, por lo que pueden pensar que serían genios en " sencilla " actividades como el reconocimiento de rostros o entender el habla.

Pero después de unos 50 años de tratar de hacer que las computadoras hacen estas cosas simples, los programadores han llegado a la conclusión de que una habilidad no es sencillo porque los humanos dominar fácilmente. De hecho, el cerebro y los ojos y los oídos son repleto de sensores sofisticados y equipos de procesamiento que todavía corre anillos alrededor de cualquier cosa que podamos diseñar en el silicio y metal.

Nosotros los humanos pensamos que es fácil de entender el habla porque todo el trabajo realmente duro está hecho antes de que nos hacemos conscientes de ello. Para nosotros, parece como si las palabras en inglés acaba de estallar en nuestras cabezas, tan pronto como las personas abren la boca. La naturaleza inconsciente (o preconsciente) del proceso hace doblemente difícil para los programadores de computadoras para imitar.

Para tener una idea de por qué los equipos tienen tantos problemas con el habla, piensa en algo que son muy buenos en el reconocimiento y la comprensión: Números de teléfono de marcación por tonos. Esos repuntes y bloops en las líneas telefónicas son mucho más significativo para las computadoras de lo que son para la gente. Varias características importantes hacen que el teléfono tonos de un lenguaje fácil para ordenadores, que se enumeran a continuación. Inglés, por otra parte, es completamente diferente.

  • La marcación por tonos " vocabulario " sólo tiene 12 " palabras " en eso. Después de conocer los tonos para los diez dígitos más * y #, usted está en. Inglés, por su parte, cuenta con cientos de miles de palabras.

  • Ninguna de las palabras suenan igual. En el teléfono de marcación por tonos, el tono de "1" es claramente diferente del tono de "7". Pero Inglés tiene homónimos, como nuevas y GNU, y cerca de homónimos, como más alegre y casarse con ella. A veces frases enteras suenan igual: " Los hijos plantean carne " y " los rayos del sol se reúnen, " por ejemplo.

  • Todas " altavoces " de la lengua decir las palabras de la misma manera. Presione el botón 5 en cualquier teléfono, y se obtiene exactamente el mismo tono. Pero un hombre mayor y una niña de 10 años de edad usan tonos muy diferentes cuando altavoces y la gente de Gran Bretaña, Canadá y los Estados Unidos pronuncian las mismas palabras en inglés de maneras muy diferentes.

  • El contexto es de sentido. Para el teléfono, un 1 es un 1 es un 1. ¿Cómo interpreta usted el tono no dependerá del número anterior o el siguiente número. Pero en Inglés escrito, el contexto lo es todo. Tiene sentido " ir a Nueva York ". Pero tiene mucho menos sentido " ir de dos de Nueva York " o ". Ir demasiado Nueva York "




» » » » Cómo NaturallySpeaking aprende a reconocer el habla