Los chatbots o asistentes virtuales tipo Siri o el Asistente de Google están en auge (otros conocidos son Bixby de Samsung y Alexa de Amazon), y cada vez más empresas apuestan por este tipo de comunicación para mejorar la interacción con sus usuarios.
En el consultorio de hoy trato precisamente cómo traducir este tipo de contenidos. ¡Una pregunta muy original, desde luego! Espero que te guste mi respuesta. 🙂
Felicitaciones, Pablo, por este video nuevo cuyo tema me sorprendió gratamente.
No tuve ninguna experiencia traduciendo este tipo de contenido, de modo que esta vez no te daré la lata con anécdotas de aficionado que se la da de serio 🙂
Como bien dices, en este tipo de software es preciso alejarse del lenguaje estándar y ése es, en mi opinión, el mayor problema. No lo digo por la labor de transcreación que se requiere, pues parto de la base de un traductor competente que, como tal, con mayor o menor sensibilidad artística, tiene el andamiaje —filológico y literario—
necesario para inventar esa equivalencia que en principio no existe o, en su defecto, sabe —gracias a sus contactos profesionales— a quién pedir consejo.
Más bien me refiero a que en la práctica hay mil maneras de decir cualquier cosa y, sacando la imposibilidad de registrar de buenas a primeras todas porque luego podrán lanzarse actualizaciones, hay que ver qué impacto tiene la adición de tantos sinónimos en el uso de recursos. Tal adición creo que podría complicarse si, en el idioma original, se han previsto notablemente menos cadenas que las factibles coloquialmente en español y al traductor no se le brinda un mecanismo eficaz para agregar otras según necesite. Y es que pese a todo, si queremos que el asistente parezca una persona, es algo que en toda traducción de estas tiene que abordarse. Hasta en las aventuras conversacionales (supongo que como localizador de videojuegos sabes qué son y, de no ser así, te animo a echar un vistazo a aquello porque, sea con retro o actuales e incluso en nuestro idioma, quedarás maravillado) amateur hoy echa para atrás el «síndrome de la palabra exacta» y por eso se suele cuidar el aspecto de los sinónimos.
El otro gran problema, para mí la mayor causa que obstaculiza la adopción de asistentes personales, es que en español sólo suelan adaptarse específicamente para España y México. Común a cualquier otra latitud la menor precisión —sobre todo para dictar texto— que ello acarrea producto de tantos acentos regionales, en Argentina a ésta se suma que el pronombre de segunda persona del singular que se emplea en todo el país no es «tú» sino «vos». Nos hemos acostumbrado a que sucesivamente los mensajeros instantáneos, las redes sociales, los celulares y ahora cada vez más otros productos de electrónica consumeril tuteen, mas nunca perdemos de vista que se trata de máquinas. Pero bien aludiste en este video a que eso es distinto con los asistentes virtuales, cuanto que han de entendernos y contestarnos como si fueran personas; eso no pasa en Argentina: que el software tutee nos recuerda —por muy buen trabajo de desrobotización que se aprecie en el TTS que estemos usando— a cada momento que estamos hablando a una máquina y, lo más importante, hablar de tú a un dispositivo nos hace sentir que al resto damos la impresión de ser tecnófilos de aquellos estereotípicamente asociados con ineptitud para las relaciones sociales; dicho más coloquialmente, uno piensa: «Parezco un pelotudo». La otra posibilidad es recurrir al infinitivo que, como convendrás, tampoco aleja precisamente la sensación de estar hablando a un programa informático.
Sin duda Google es la que de cara al usuario parece más encaminada a resolver este inconveniente, pues para español admite más variantes regionales que los principales de la competencia. En lo que respecta a Argentina no vosea y a veces —por influjo del diccionario— se le escapan imperativos tuteando aun cuando no habíamos pronunciado el acento, pero que pueda configurarse para entender nuestra tonada disminuye mucho la necesidad de enseñarle con correcciones manuales, que al dictar se suelen reducir a cambiar algún tuteo por voseo. Que estas inexactitudes tan elementales ocurran incluso cuando uno está conectado a Internet no deja de extrañarme, pues, con la información que por defecto transmiten tanto el asistente como el teclado, Google no es una empresa a la que le falten datos.
Y nada, por ahora eso. Una vez más te felicito por el video y abordar un tema que por lo novedoso me sorprendió favorablemente.
¡Un saludo y buena semana!
¡Hola, Fernando!
Disculpa que no haya podido contestar hasta ahora. Es un comentario extenso y he estado bastante ocupado, así que quería poder leerlo con calma. 🙂
En efecto, este tipo de asistentes no son proyectos de localización normales ni muchísimo menos, y ya te digo que hay un increíble trabajo de ingeniería detrás como jamás había visto. Es increíble la de variables que puede haber, de verdad. Por supuesto, un aspecto clave es que hay fragmentos que no tienen ninguna relevancia para el público de destino con respecto al original, por lo que directamente se pueden omitir porque ni siquiera con adaptación tendrían sentido; asimismo, también existe la posibilidad de añadir distintas cosas que no existen en el original. Perdona por no ser demasiado preciso, pero tampoco quiero dar demasiados detalles dado el secretismo de estos proyectos, pero espero que te hagas una idea de lo que quiero decir. 🙂
Con respecto a las variantes del español y el TTS, por supuesto, tienes toda la razón. A lo mejor un asistente virtual “normalito” no puede cubrir tantas variantes, pero cuando se trata de empresas grandes, sin duda hay esperanza.
¡Muchas gracias de nuevo por el debate!
Pablo
¡Hola de nuevo, Pablo!
Nada que objetarte: el trabajo es el trabajo y, en cuanto a la confidencialidad de ciertos proyectos, desde luego que un contrato es un contrato y en cuanto a éstos uno ha de actuar de buena fe.
Ya lo creo que estos proyectos tienen muchísimo trabajo de ingeniería detrás, incluso de localización. Me llama la atención lo que dices de que se agregan u omiten fragmentos porque, en esos casos, ¿cómo miden los gestores de proyecto encargados de organizar la localización el nivel de compleción en cada idioma? Habitualmente se trata de un porcentaje de fragmentos traducidos respecto de la cantidad total de fragmentos originales, pero es evidente que dicha aproximación deviene ineficaz si el propio total de fragmentos en cada idioma es necesariamente distinto. Por supuesto que no es ni mucho menos el único indicador para examinar la calidad de una traducción, pero no deja de ser útil saber el espectro de funcionalidades que en un idioma dado está, con mayor o menor fortuna, cubierto.
¡Un saludo y buena semana!
¡Hola de nuevo, Fernando!
Por mi experiencia, los gestores se basan sobre los contenidos originales (en inglés en este caso), ya que están diseñados de tal forma que, mediante una serie de códigos, se pueden añadir más alternativas directamente en el segmento traducido (un salto de línea y un carácter especial pueden ser suficientes). Del mismo modo, se pueden usar códigos para anular el segmento de origen. Eso es para una primera fase; luego sí que se pueden añadir manualmente segmentos que ni siquiera están en el original (por ejemplo, para ofrecer servicios disponibles en un único país). Por supuesto, esto último que te cuento no depende del equipo de localización, así que en realidad los gestores pueden hacerse una idea con los segmentos originales; lo único es que unos segmentos llevan más tiempo que otros, pero al menos se compensa con eso de que se puedan anular segmentos también.
Todo esto es así un poco por encima para tampoco dar más información de la que puedo dar. 🙂
Pablo
¡Hola de nuevo, Pablo!
Son interesantes las cosas que comentas sobre la administración de fragmentos. Por lo que veo no son tanto técnicas nuevas, sino que ciertas técnicas se emplearían con más frecuencia que en otros casos.
Justamente hace poco me topé, aunque no en un asistente personal, con un caso de fragmento con código para anularlo.
Resulta que aparte de la ayuda el lector de pantalla JAWS tiene, desde hace bastante tiempo, una suerte de tutoriales que combinan audio y texto, tanto de explicaciones como —en el caso del audio— ejemplos de qué se oiría al hacer lo que se explica. Puesto que este material sólo está disponible en inglés, desde siempre en las versiones en español se ha optado por eliminar del menú Ayuda la opción que lleva a los mismos, para lo cual simplemente quitaban de la DLL de recursos en español el menuitem correspondiente, cosa comprobable con cualquier editor de recursos.
Para gran parte del software —entre las que se incluyeron los ejecutables— en la versión 17 pasaron de DLL adicionales con recursos traducidos a emplear catálogos Gettext. En las versiones nuevas tampoco aparece la opción que lleva a los audiotutoriales y, lógicamente, me moría por saber cómo habían hecho.
Como también se pasó a usar Gettext para cierto tipo de archivos que al tener que ver con el desarrollo de scripts cualquiera podía consultar y modificar sin infringir la licencia pues se incluían también sus fuentes con comentarios y todo, la empresa necesariamente tuvo que ofrecer también el .po descompilado aparte del .mo, de modo que es allí donde fui a mirar. Para que la cadena en cuestión no aparezca, el texto de la traducción resultó ser algo tan simple como «.EMPTY.».
Te mando un saludo y, como siempre, te agradezco por todo el conocimiento que tienes a bien compartirnos.
¡Hola, Fernando!
Me ha parecido fascinante lo que has comentado de las DLL. Qué tiempos cuando eso era lo habitual para localizar programas. 🙂
Me ha parecido muy curioso lo que comentas de las cadenas con “EMPTY” en el archivo .po. Entiendo que el programa debe estar preparado para saber que no se debe mostrar algo si aparece “EMPTY”, ¿no? Hasta donde sé, si la cadena de texto está vacía en un archivo .po, se muestra la cadena original, o al menos eso es lo que me he pasado cuando he lidiado con archivos .po. ¿Tienes alguna idea sobre esto? No he logrado encontrar nada fiable en Internet.
¡Gracias a ti de nuevo por los enriquecedores debates!
Pablo
¡Hola de nuevo, Pablo!
Sí, me da que este programa debe prever que si una cadena está traducida como «.EMTY.» debe anularla porque, como dices, en otros programas con catálogos Gettext con que tuve que lidiar, a falta de traducción, se muestra la cadena original y, de hecho, los programas de edición de estos catálogos como Poedit contabilizan las cadenas en blanco como pendientes de traducción. Más todavía me inclina a pensar esto que la DLL para localización (no una DLL con recursos, sino una que administra la admisión de localización mediante Gettext en este software), no es de código abierto sino de la propia Freedom Scientific, aparte de que en la pantalla de créditos dentro de «Acerca de» no figuran licencias de terceros al respecto.
Tendría que ver —más a la noche, cuando no esté en el trabajo— el manual de Gettext (de la FSF no sobre un editor de catálogos específico, sino en general para desarrolladores) a ver si dice algo al respecto, aunque supongo que donde primero has buscado habrá sido allí. De todas formas, piensa que internamente los catálogos Gettext se construyen mediante referencias a archivos fuente específicos, de modo que en realidad primero se cargan en memoria los archivos compilados originales y luego si es posible las librerías de Gettext hacen los reemplazos, de modo que para aquello no disponible en el catálogo o que está estrictamente vacío se usa, desde el archivo original pertinente, lo que ya se había cargado en memoria antes de procesar el catálogo. Sin duda es una de las ventajas de traducir de este modo frente a usar DLL o cambiar directamente los recursos del ejecutable.
Sí, ¡qué tiempos aquellos en que la traducción mediante DLL de recursos era lo habitual! Honestamente prefiero esa metodología ya que, aunque es cierto que puede haber riesgo de que inadvertidamente el traductor modifique algo de tal modo que estropee el programa, lo cierto es que para diálogos y menús (las tablas de cadenas y mensajes son otro cantar), a falta de comentarios el traductor tenía más contexto por los controles u otros elementos circundantes y ello redundaba en traducciones de mejor calidad. Este contexto intrínseco suele estar aún hoy en los programas que se traducen con archivos XML, pero hay muchísimos cuyos módulos de idioma son archivos de texto plano sin comentarios y, encima, a menudo sin otro orden que aquel en que se agregaron las cadenas al software, o sea, sin un orden semántico que a falta de comentarios permita dilucidar el contexto de fragmentos ambiguos.
¡Un saludo y gracias a ti por el debate!
Genial, ¡gracias de nuevo por tus observaciones y que vaya todo bien, Fernando! 🙂