Se puede hablar de manera natural con las máquinasSe puede hablar de manera natural con las máquinas

Quizás suene para algunos a película de ciencia ficción, quizás para otros les recuerde el dilema de Alan Turing para determinar si una máquina era realmente inteligente, de lo cual ya hablamos en un artículo anterior, otros quizás piensen en los asistentes virtuales como Siri, Cortana, Alexa o Google Now, pero finalmente, ya todos tenemos una ligera idea de lo que implica el poder hablar con una máquina, finalmente pensamos que implica resolver algunas instrucciones simples, poner música en el teléfono o en una bocina, cambiar de canal a la televisión o abrir alguna aplicación, pero, ¿eso es hablar de forma natural con una máquina como lo haríamos con otra persona?

La empresa Mozilla, responsable entre otras cosas del navegador Firefox, ahora se ha propuesto el poder comunicarnos de manera natural con las máquinas, esto a través del proyecto nombrado como “Common Voice”, en la cual se busca que todos los usuarios sea capaces de enseñarles a las máquinas cómo hablan las personas.

Dona tu voz. Grabar fragmentos de voz es una parte integral para construir nuestra base de datos abierta; algunos dirían también que es la parte divertida.
Dona tu voz. Grabar fragmentos de voz es una parte integral para construir nuestra base de datos abierta; algunos dirían también que es la parte divertida.

La realidad es que no se trata del primer proyecto de este tipo, sin embargo, si es el primero en el que se busca una participación activa y libre de toda la comunidad de usuarios, donde cualquier persona puede tanto ayudar brindando su voz, como ayudar escuchando y validando las voces de otros.

El objetivo que tiene Mozilla con este proyecto es “ayudar a hacer que el reconocimiento de voz sea abierto y accesible para todos”, esto ya que como acabo de mencionar, existen muchos otros proyectos de reconocimiento de voz, pero se tratan de proyectos de la industria privada, con una finalidad comercial (que no está mal, pero finalmente no sirve para todos), mientras que este proyecto, al igual que sus otros sistemas desarrollados por esta empresa, se encuentran enfocados en la democratización de los recursos tecnológicos, volviéndolos accesibles para cualquiera que desee utilizarlos.

Ayuda a validar voces. Validar fragmentos donados es igualmente importante para la misión de Common Voice. Escucha y ayúdanos a crear datos de voz abiertos y de calidad.
Ayuda a validar voces. Validar fragmentos donados es igualmente importante para la misión de Common Voice. Escucha y ayúdanos a crear datos de voz abiertos y de calidad.

Lo que sabemos hasta este momento es que el proyecto Common Voice no se trata de un sistema que reconozca voz por sí mismo, es decir, no es un motor de reconocimiento de voz como lo podría ser “Deep Speech” (también de Mozilla), sino que se trata de una base de datos que enlaza un texto con un sonido, haciendo que motores de reconocimiento de voz sepan cómo interpretar las palabras que escucha, tal y como lo haría una persona, brindando con ello múltiples posibilidades de comunicación entre humanos y máquinas.

Mozilla actualmente busca conseguir un total de 10 mil horas validadas, las cuales, como menciona la empresa es “el número de horas que se necesitan para formar un sistema de producción de voz a texto”, de las cuales, al momento de estar escribiendo este artículo, llevan la mitad aproximadamente.

Horas grabadas y horas validadas
Horas grabadas y horas validadas

El proyecto Common Voice tiene actualmente los siguientes números:

  • 54 idiomas lanzados.
  • 68 idiomas en proceso.
  • Más de 6,700 horas grabadas.
  • Más de 5,000 horas validadas.
  • 335 voces en línea.
  • 40 idiomas descargables.
  • 4,257 horas grabadas descargables.
  • 3,401 horas validadas descargables.
  • En español:
    • 17,338 hablantes.
    • 294 horas validadas.
Progreso del idioma Español
Progreso del idioma Español

Algo que es muy importante es saber que, aunque el proyecto aún se encuentra en desarrollo y limitado por los desafíos del mismo proyecto, es posible descargar los archivos de la base de datos para comenzar a realizar las pruebas que sean necesarias para comenzar a realizar diferentes proyectos de software que puedan ser alimentados por la información de Common Voice. En cuanto al idioma español, podemos encontrar hasta este momento un archivo descargable con las siguientes características:

  • 5 Gb de peso.
  • 167 horas validadas.
  • 221 horas grabadas.
  • 8,252 voces de las cuales se dividen en:
    • Acento:
      • 14% Norte de España.
      • 13% Sur de España.
    • Edad:
      • 19% de 19 a 29 años.
      • 13% 60 a 69 años.
    • Género:
      • 55% hombres.
      • 10% mujeres.
Lo que hay hasta este momento en la Base de Datos de Common Voice
Lo que hay hasta este momento en la Base de Datos de Common Voice

Hasta el momento en el que estoy escribiendo esto, el proyecto todavía sigue necesitando ayuda de todos aquellos que deseen aportar su granito de arena, para ello pueden visitar las siguientes direcciones:

Por Ryubluedragon

Emprendedor y empresario, editor y periodista, enfocado en la difusión de temas de tecnología, arte, historia y entretenimiento. Fundador y gerente general de KiGaRi CyD S. De R. L. de C. V., se ha especializado en la consultoría de tecnologías de la información, especialmente en seguridad informática para pequeñas y medianas empresas. Sus habilidades van desde el análisis e investigación periodística, tanto documental como de campo, desarrollo web y de software, coordinación de equipos de trabajo, edición y producción multimedia, fotografía de arquitectura, naturaleza y publicitaria, así como composición musical.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.