Digital Skills Institute
< Artículos seleccionados

Al habla con la IA: el reto de lograr voces más diversas e inclusivas

Common Voice de Mozilla busca reflejar la diversidad lingüística global al recopilar voces en 180 idiomas, enfrentando retos de desigualdad en datos y promoviendo la inclusión en tecnologías de voz. Resumen del artículo publicado en technologyreview.es y recomendado por Digital Skills Institute el 19 de mayo de 2025.

La inteligencia artificial ha avanzado significativamente en el reconocimiento de voz, aunque aún enfrenta un gran reto: representar la diversidad lingüística del mundo. Actualmente, muchos asistentes de voz están diseñados principalmente en inglés, específicamente con acentos de Estados Unidos y, en menor medida, del Reino Unido. Este enfoque no solo excluye a hablantes de otros idiomas, sino que también amenaza la riqueza cultural inherente a los distintos dialectos y acentos que existen.

Para contrarrestar esta limitación, Mozilla ha lanzado el proyecto Common Voice, que busca crear una base de datos de voces que refleje esta diversidad global. Con la participación de miles de voluntarios, el proyecto ha logrado reunir más de 31,000 horas de grabaciones en 180 idiomas. Desde 2020, el número de voluntarios ha aumentado de 500,000 a más de 900,000 en 2024, lo que demuestra un creciente deseo de desarrollar tecnologías de voz más inclusivas. Este esfuerzo no solo facilita una creación tecnológica más equitativa, sino que también promueve un acceso democrático a datos de voz.

Una característica importante de Common Voice es su enfoque de código abierto, que permite a cualquier persona acceder y utilizar la información generada. Esto ha fomentado la colaboración entre investigadores y empresas; no obstante, también ha planteado preocupaciones sobre la compensación adecuada para los voluntarios, quienes pueden no recibir retribución a pesar de que las empresas pueden beneficiarse económicamente de su contribución.

A pesar de estos logros, la representación de idiomas sigue siendo desigual, con una predominancia del inglés sobre lenguas menos habladas. Mozilla busca empoderar a comunidades subrepresentadas, alentándolas a participar en la creación de datos que reflejen sus necesidades específicas. Iniciativas como Mabel AI están comenzando a utilizar estos datos para crear herramientas que aborden desafíos sociales, especialmente en el ámbito de la salud, subrayando la importancia de la recolección de datos diversos para construir un futuro tecnológico más justo e inclusivo.

Leer en technologyreview.es
¡Participa en la conversación!

Otros artículos relacionados

También te puede interesar...