Common Voice de Mozilla busca reflejar la diversidad lingüística global al recopilar voces en 180 idiomas, enfrentando retos de desigualdad en datos y promoviendo la inclusión en tecnologías de voz. Artículo publicado en technologyreview.es y recomendado por Digital Skills Institute el 19 de mayo de 2025.
La inteligencia artificial (IA) es uno de los avances tecnológicos más significativos de nuestro tiempo, y su aplicación en el ámbito de la voz está experimentando un notable crecimiento. Sin embargo, a pesar de los impresionantes desarrollos en asistentes de voz por parte de gigantes tecnológicos, existe una considerable brecha en la representación de la diversidad lingüística global. Esta falta de diversidad ha sido evidente en las voces que se generan, que tienden a predominar en inglés y reflejan acentos de regiones angloparlantes como Estados Unidos y, en menor medida, el Reino Unido. Esto no solo limita la experiencia de los usuarios que no hablan inglés, sino que también amenaza con empobrecer la selva de dialectos y acentos que caracterizan la riqueza lingüística mundial.
En respuesta a esta situación, Mozilla ha puesto en marcha la iniciativa Common Voice. Este ambicioso proyecto tiene como objetivo recopilar una base de datos de voces que refleje mejor la realidad multilingüe del planeta. A lo largo de los años, Common Voice ha reunido más de 31,000 horas de grabaciones en 180 idiomas, gracias a la colaboración de una creciente comunidad de voluntarios, que ha pasado de 500,000 participantes en 2020 a más de 900,000 en 2024. Esta base de datos no solo se ha convertido en una herramienta vital para el desarrollo de tecnologías de voz más inclusivas, sino que también simboliza un empuje significativo hacia la democratización del acceso a la IA.
Una de las características más destacadas de Common Voice es su transparencia. A diferencia de otros conjuntos de datos utilizados por las grandes empresas de tecnología, Common Voice es de código abierto y está disponible para cualquier persona que desee utilizarlo. Esto significa que investigadores y empresas puedan acceder libremente a la información y colaborar en la creación de tecnologías más inclusivas. Sin embargo, el proyecto también enfrenta críticas debido a que esta apertura puede implicar que los voluntarios estén contribuyendo de manera gratuita a las empresas que se beneficiarán económicamente de sus esfuerzos.
La desigualdad en la representación de idiomas en la base de datos de Common Voice es un desafío existente. Mientras que algunos idiomas, como el inglés, cuentan con miles de horas de grabaciones, otros como el finés o el coreano están considerablemente subrepresentados. El esfuerzo de Mozilla es dar herramientas a las comunidades hablantes de estos idiomas para que puedan participar activamente en la creación de los conjuntos de datos necesarios para su representación. Este enfoque busca empoderar a las comunidades lingüísticas que a menudo son desatendidas por los avances tecnológicos.
Empresas como Mabel AI han comenzado a aprovechar la base de datos de Common Voice para desarrollar herramientas específicas, como aplicaciones de traducción para servicios sanitarios suecos orientadas a facilitar la comunicación de refugiados ucranianos. Este ejemplo resalta cómo el acceso abierto a los datos ofrecidos por Common Voice puede impulsar innovaciones significativas en sectores sociales críticos. Sin embargo, también se pone de manifiesto un problema común: la mayoría de los datos de voz siguen siendo de hombres jóvenes, lo cual no refleja la diversidad de usuarias y usuarios reales.
Rebecca Ryakitimbo, autora del plan de acción de género de Common Voice, argumenta que pedir a los participantes que detallen su género y acento ayuda a crear modelos de lenguaje más inclusivos y representativos. La recolección de datos en contextos diversos, como en Tanzania y otros países africanos, es fundamental para lograr una representación justa de las voces femeninas y de las personas que viven en áreas rurales. Esta diversidad no solo enriquece los modelos de IA, sino que también combate los estereotipos inherentes en sistemas entrenados con datos homogéneos y limitados.
En definitiva, la iniciativa Common Voice representa un emocionante paso hacia un futuro donde la inteligencia artificial sea un reflejo más auténtico de la diversidad humana. A medida que se suman más voces, dialectos y acentos al proyecto, avanza la misión de desarrollar tecnologías que no solo hablen nuestro idioma sino que también comprendan la riqueza cultural que cada uno trasmite. Esto es crucial para asegurar que el progreso tecnológico no erradique la multiplicidad de lenguas y culturas que existen en nuestro mundo, sino que las celebre y las preserve.