Algo más que traducir
Blog sobre traducción profesional, localización de videojuegos, software, aplicaciones móviles, sitios web y tecnologías de la traducción por Pablo MuñozTraductor inglés-español especializado en localización

Cómo optimizar el uso del corrector ortográfico cuando hay etiquetas

CorrectorUna de las premisas de todo traductor profesional que se precie es pasar el corrector ortográfico a un texto antes de entregarlo. Y no porque hayamos cometido una falta de ortografía por desconocimiento (que también pasa), sino porque todos cometemos erratas al escribir rápido durante mucho tiempo seguido. Yo normalmente paso el corrector al acabar de traducir un archivo y otra vez después de haberlo revisado. Además, siempre que sea posible es recomendable copiar el texto a Microsoft Word, ya que el corrector es más eficaz que el de Excel o SDLX por poner ejemplos. Aunque resulta algo pesado, es la mejor elección si se dispone de tiempo.

El caso es que esta tarea puede ser muy tediosa si trabajamos con archivos en los que abundan etiquetas, ya que el corrector se para en ellas cada vez que lo pasamos y tenemos que darle a omitir esa palabra. Esto no es realmente un problema si solo trabajamos con un archivo, pero si son varios, la cosa se complica un poco. Veamos cómo podemos solucionar este escollo gracias a la potente función de Microsoft Word llamada Buscar y reemplazar.

Normalmente, las etiquetas aparecen entre comillas angulares (<>), aunque también pueden estar entre corchetes ([]) o llaves ({}). Así pues, una forma fácil de eliminar todas las etiquetas de un documento sería buscar todo lo que aparezca entre los caracteres correspondientes y reemplazarlo por nada (es decir, dejar el campo de “Reemplazar con” vacío). ¿Cómo podemos hacer esto con Microsoft Word? Fácil, activando el uso de caracteres comodín (wildcards) y poniendo en el campo de búsqueda lo siguiente: \<*\>

De este modo, si tenéis una frase como “Esto es un <colour=red>ejemplo<\colour> de etiqueta en una frase” y hacéis clic en “Reemplazar todo”, las etiquetas desaparecerán por arte de magia de un golpe, por lo que el corrector detectará menos falsos positivos. A continuación explicaré lo que significa cada carácter de esta extraña combinación:

  • \: la barra invertida permite introducir caracteres reservados para una función especial. Tal y como podemos comprobar si hacemos clic en el botón “Especial” de la función Buscar y reemplazar, ‘<‘ indica buscar al principio de una palabra y ‘>’ al final. Dado que tenemos que buscar precisamente esos caracteres, tendremos que poner una barra invertida antes de ellos.
  • <: el principio de cada etiqueta. Como hemos dicho antes, puede variar.
  • *: el asterisco indica que se deberá buscar cualquier carácter o caracteres. Por ejemplo, me* buscará todas las palabras que empiecen por “me”, como “mesa”, “meta”, “mequetrefe”, etc. En este caso, buscará cualquier combinación de caracteres cuyo principio sea ‘<‘ y cuyo fin sea ‘>’.
  • >: el final de cada etiqueta. Como hemos dicho antes, puede variar.

Sin embargo, puede que necesitemos que alguna etiqueta en concreto se reemplace por otra para que el corrector no note que falta un verbo o sujeto en una oración. Este es el caso típico de etiquetas como <Item>, <Hero> o <Partner>. En este supuesto, antes de proceder a usar la función Buscar y reemplazar con la combinación de caracteres que hemos aprendido, deberemos buscar y reemplazar esas etiquetas por palabras que tengan sentido en la frase, como pueden ser <Objeto>, <Pablo> y <Pedro>, respectivamente.

Bien, aunque hemos aprendido algo que nos va a hacer la vida un poco más fácil, no deja de ser una tarea repetitiva, especialmente si trabajamos con muchos archivos. ¿Qué hacer entonces? Nada tan sencillo como crear una macro. No tenemos más que ir a Herramientas > Macro > Grabar nueva macro, asignar una combinación de teclas o botón para la macro, y realizar todos las operaciones repetitivas que necesitemos.

Como un video vale más que mil palabras, he preparado una breve demostración en forma de vídeo improvisado (¡atención, que esta vez sí que tiene voz con sonido claro!):

Como habréis podido ver, al final también he seleccionado todo el documento para configurar todo el texto con el idioma español. Esto es bastante útil para copiar texto de otra fuente, ya que al menos a mí siempre me aparece en inglés.

En fin, espero que, si trabajáis alguna vez con etiquetas, esta información os ayude a que pasarle el corrector sea una tarea amena. También os recomiendo que, si hay algún fragmento grande en otro idioma en el texto, lo eliminéis antes de pasarle el corrector para agilizar el proceso.

¡Comparte esta entrada! 🙂
Share on Facebook0Tweet about this on TwitterShare on Google+1Share on LinkedIn6
Pablo Muñoz Sánchez

Pablo Muñoz Sánchez

English > Spanish Game Translator
Soy traductor inglés > español con más de 8 años de experiencia especializado en localización de videojuegos y software. He traducido juegos como Metroid y Fire Emblem y ahora trabajo, entre otras cosas, como revisor para un gigante tecnológico. También soy cofundador de Traduversia, una plataforma de cursos online para traductores. Más sobre mí | Mis cursos | Mi web
Pablo Muñoz Sánchez
Pablo Muñoz Sánchez

¡Suscríbete al blog!

¿Te ha gustado lo que has leído?
Recibe nuevas entradas en tu correo e información exclusiva para suscriptores.

¡Apúntate gratis al curso online «Herramientas para la localización y la traducción audiovisual» de Traduversia!

Herramientas para la localización y la traducción audiovisual

Esto es lo que obtendrás si te apuntas:

  • Acceso gratuito e inmediato al curso online de Traduversia
  • 5 minicursos gratuitos por correo sobre localización, productividad, etc.
  • Cupones de descuento para matricularte en cursos de Traduversia a precio reducido

 

Y además, aprovecha este cupón exclusivo para lectores de Algo más que traducir. ;)

Cupón Algo más que traducir

21 comentarios

  1. Hola Pablo:

    ¡Ya te echábamos de menos por aquí! :D. Otra forma que se me acaba de ocurrir para evitar este problema es hacer clic en Agregar, en el cuadro de diálogo del corrector ortográfico. Es una forma menos elegante que la tuya. Eso sí, si el número de etiquetas no es muy elevado, pasados unos cuatro o cinco clics, el corrector ortográfico no nos volverá a molestar ^^

  2. Pablo Muñoz Sánchez dice:

    Uf, es que entre el trabajo, el máster y otras cosillas la verdad es que me da pereza ponerme con el blog… Aunque me lo pasé bien grabando el vídeo. Creo que tendré que hacerlo más a menudo xD

    Sí, si hay pocas etiquetas no pasa nada, aunque puede ser muy pesado si le pasamos el corrector a 100 archivos y las etiquetas varían de unas a otras. Lo bueno de esta solución es que funciona prácticamente para cualquier texto 😉

  3. Muy interesante, Pablo… como siempre.
    Saludos

  4. Hola Pablo:

    En primer lugar, muchísimas gracias por tus consejos. Leo tu blog desde hace unos meses. Me licencié en Traducción hace 5 años y desde entonces no he parado de dar vueltas y más vueltas, sin saber realmente hacia dónde me dirijo. Me he especializado en Traducción Técnica, aunque tengo mucho interés en Localización. ¿Me podrías recomendar algún máster?, ¿crees que vale la pena?

    Un saludo.

    P.D: También me gustaría saber por qué usas el término “optimizar”, y no “mejorar”. ¿Me he vuelto demasiado conservadora? 😀

  5. Pablo Muñoz Sánchez dice:

    Hola Adela:

    Pues no sabría qué decirte si ya tienes 5 años de experiencia (eso he creído entender), porque ya tienes más que yo 😛 En tu caso, quizás sea interesante hacer algún curso de localización para adquirir conocimientos sobre la materia y no un máster entero. Si te es posible (a mí no :(), te recomiendo este curso de verano que organiza la Universidad de Alicante sobre localización. Sobre el máster, bueno, pues ya depende de las ganas: te recomiendo que le eches un vistazo este artículo de Olli 😉

    Respecto a lo de optimizar… Pues no sé, me salió solo 😛 Supongo que es porque eso de la optimización está muy extendido en el mundo del software 🙂

  6. Gracias Pablo por el artículo, como siempre muy informativo y trabajado. Siempre van bien estos “truquitos” para ahorrar tiempo y optimizar nuestra productividad.
    No obstante, no entiendo cómo todavía las herramientas CAT no incorporan buenos correctores ortográficos que contemplen todos estos problemas…
    Es como si en un programa específico de contabilidad tuvieras que recurrir a Excel para comprobar que los cálculos están bien…

  7. Anónimo dice:

    Hola, tocayo:

    el problema de las etiquetas es un tema recurrente en el ámbito de la traducción. Utilizar las opciones de búsqueda especiales de MS-Word es una solución. Pero, no me parece una “solución ideal”. Por ejemplo:

    ¿Qué haces cuando es necesario conservar las etiquetas?

    Lo cierto es que “soluciones ideales” NO existen, sino que existen soluciones más o menos idóneas para cada caso. Una de las soluciones que utilizo, aunque también tiene sus inconvenientes, son las macros de MS-Word creadas por Rob Laumen ), que os copio aquí a efectos divulgativos:

    Sub Hide_Between_Brackets()

    ‘ Rob Laumen
    ‘ To hide text between (), [], {}, or
    ‘ Text can be reverted using macro
    ‘ unhide_between_brackets()

    Dim a$
    Dim b$
    a$ = WordBasic.[InputBox$](“Start character(s):”)
    b$ = WordBasic.[InputBox$](“Stop character(s):”)
    WordBasic.StartOfDocument
    WordBasic.EditFind Find:=a$
    While WordBasic.EditFindFound()
    WordBasic.ExtendSelection
    WordBasic.EditFind Find:=b$
    WordBasic.Cancel
    WordBasic.FormatFont Hidden:=1
    WordBasic.CharRight
    WordBasic.EditFind Find:=a$
    Wend
    End Sub

    Sub Unhide_Between_Brackets()

    ‘ Rob Laumen
    ‘ To show text between (), [], {}, or
    ‘ that was previously hidden using
    ‘ macro Hide_between_brackets().

    Dim a$
    Dim b$
    a$ = WordBasic.[InputBox$](“Start character(s):”)
    b$ = WordBasic.[InputBox$](“Stop character(s):”)
    WordBasic.StartOfDocument
    WordBasic.EditFind Find:=a$
    While WordBasic.EditFindFound()
    WordBasic.ExtendSelection
    WordBasic.EditFind Find:=b$
    WordBasic.Cancel
    WordBasic.FormatFont Hidden:=0
    WordBasic.CharRight
    WordBasic.EditFind Find:=a$
    Wend
    End Sub

    Lo que, en teoría, deberían hacer respectivamente estas dos macro es ocultar y visualizar el texto entre corchetes, paréntesis, etc. Pero, como ya he dicho, éstas tienen sus inconvenientes:

    1) La segunda macro, para volver a visualizar el texto, a un servidor nunca le ha funcionado.
    Y la solución a este problema pasa por ir en MS-Word al menú Herramientas -> Opciones -> Ver y marcar la casilla “Ver texto oculto”.

    2) El segundo problema es, si tienes textos etiquetados con varios tipos de etiquetas (echarle un vistazo al código fuente de la, a primera vista, simple página del buscador google). Por tanto, se tendrá que repetir el proceso de ocultación de etiquetas y nueva visualización para cada tipo de etiqueta, ya que las macros no disponen de para recordar qué tipo de etiqueta se ha etiquetado y cual no.

    En fin, si a alguién se le ocure una idea para hacer funcional la segunda macro (un servidor lo ha intentado sin éxito…), le prestaría un gran servicio a la comunidad de traductores 😉

  8. Pablo Bouvier dice:

    Perdonad el formato del texto anterior. Se me escaparon unas etiquetas, que no venían a cuento. Con tanto hablar de etiquetas… 😉

  9. Pablo Muñoz Sánchez dice:

    Hola Pablo (qué raro se me hace escribir mi nombre):

    Excelente comentario, ¡muchas gracias! La verdad es que ni se me había ocurrido lo que planteas. De esta manera, si trabajas directamente en Word, te aseguras de que puedes seguir trabajando con el mismo documento.

    Tal y como está escrita la macro, parece que tiene ya mucho tiempo. Vamos, no estoy 100% seguro, pero “WordBasic” es lo que se usaba en versiones bastante antiguas de Word.

    Le echaré un vistazo en cuanto pueda a ver si logro averiguar qué falla en la segunda opción 😉

  10. Pablo Muñoz Sánchez dice:

    Hola de nuevo, Pablo:

    Efectivamente, el código me parece que está ya algo obsoleto. Pero bueno, cambiando alguna cosa (como el $ de la variable), la macro va bien.

    Lo único que tienes que hacer para que funcione bien la macro es poner esto después de “Dim b$”:

    ActiveDocument.ActiveWindow.View.ShowHiddenText = True

    Como se puede intuir, hace que Word muestre el texto oculto antes de ponerse a buscar.

    Basta con que al final pongas:

    ActiveDocument.ActiveWindow.View.ShowHiddenText = False

    para estar como antes.

    Espero haberte ayudado 🙂

  11. Pablo Bouvier dice:

    Hola, Pablo(a mi también se me hace raro poner mi nombre y los lectores se van a liar más la pata que un camello 😉

    Respecto a la macro, sin duda que es antigua(al igual que un servidor, que pertenece a la raza de los “traductosaurios”). Pero, si funciona, soy partidario de dejar las cosas como están…

    He probado lo que dices y, fectivamente, “funciona”.
    Tal como afirmas, sóloes necesario colocar la instrucción “ActiveDocument.ActiveWindow.View.ShowHiddenText = False” depués de la instrucción “wend2 y antes de la instrucción “end sub”.

    Muchas gracias y espero que este truquillo sea útil para los colegas que siguen tú blog 😉

  12. www.cincolinks.com dice:

    Ehorabuena por tu blog, si quieres puedes apuntarte al directorio web/blog http://www.cincolinks.com podrás promocionar tu web, con tu ficha y tus votaciones y valoraciones, con un método de intercambio de visitas que harán que tu blog se de a conocer por toda la red. Pasate 😉

    Creo que no hay muchos blogs de las características y temática del tuyo en este directorio, me gustaría mucho que participaras.

    Saludos, espero verte por http://www.cincolinks.com.

  13. Yo en lugar de eliminar el texto de las etiquetas u ocultarlo, lo que hacía era marcarlo con estilo tw4winexternal, que incluye entre sus características el que no se revisa ortografía y gramática.

    El proceso, más o menos, es:

    Buscar (con caracteres comodín activados): (\)
    Reemplazar:\1 formato > estilo > twinexternal

    \1 indica que la cadena se sustituye por sí misma, pero con el formato especificado.

    Lo ideal, de todas formas, es ir abandonando la interfaz de Word. Wordfast ya lo ha hecho con Worfast Pro. Es mucho mejor a la larga, no sólo por la cuestión del corrector, sino también para evitar dañar las etiquetas.

  14. franco dice:

    pablo, soy un integrante de la revista “La Huella”, una revista que hacemos algunos alumnos de la carrera de profesorado y traductorado de ingles de la Universidad Nacional del Comahue (Rio Negro, Argentina), y queriamos poner 2 artículos de tu blog que me resultaron interesantes.Antes, obviamente, queriamos pedirte autorización para publicar dichos artículo e invitarte a escribir artículos para la revista.
    desde ya, muchas gracias,
    espero tu respuesta

    saluda atte

    Franco Silvio Cucchetti

  15. ¡Hola Pablo!

    El problema que en esta entrada planteas lo he sufrido más de una vez como aficionado, y me extraña que aun los traductores profesionales deban recurrir a “workarounds” como este. ¿No existen programas de CAT/TAO/TAC compatibles con Common Speller API (CSAPI) de forma que puedan emplear las herramientas de corrección del Office instalado en el sistema?

    Ante la falta de estandarización en las etiquetas de videojuegos ya imagino que el incordio de esta situación se multiplica mucho, aunque para formatos comunes como HTML me sirve mucho Balabolka: En principio es un programa para conversión TTS que hasta permite guardar el texto en archivos de audio, pero como al abrir archivos en él los pasa a texto plano, copiar el texto a Word es más que fácil pues no contiene etiquetas y, si quisiera, este programa es compatible con CSAPI (lástima que sólo con Office 2003 o anteriores) y con varios correctores ortográficos de código abierto como Hunspell, GNU Aspell e International Ispell.
    Para el caso de HTML Word los puede abrir interpretando y ocultando las etiquetas, pero personalmente sólo reviso y veo los cambios propuestos. Los usuarios no tendrían menos compatibilidad si guardare con Word los HTML, pero lo cierto es que las etiquetas específicas de Word aumentan el tamaño del archivo considerable e innecesariamente, sumado ello al menor rendimiento y que si no se configura adecuadamente se codifican los archivos en Ascii —los caracteres internacionales han de parsearse pues no están directamente—.

    Cuando lo que hay que traducir es documentación en texto plano o formatos de Word (también literatura, pero es harina de otro costal), lo que hago para evitar las molestias de que se ponga el texto en inglés según comentabas y aparte de seleccionar todo y marcarlo como español, es desactivar «Detectar idioma automáticamente» y activar «No revisar la ortografía ni la gramática», con lo que además de evitar que se cambie el idioma evito que a cada rato me esté marcando como error algo que hasta que lo traduzco continúa en inglés mas marcado en español. Aparte de la revisión final con F7, acostumbro mientras traduzco a seleccionar alguna frase en la que dudo de la escritura de alguna palabra para revisar sólo esa parte, lo cual me permite obtener la funcionalidad del botón derecho pero sin las hondulaciones rojas por dokier. Sé que también podría ser más específico en la Categoría Revisión dentro de Opciones que hay sendas casillas para ocultar errores ortográficos o gramaticales en este documento, pero prefiero la alternativa anterior cuya configuración se guarda en el archivo en sí y no en la PC con que estoy trabajando, aparte de que si quisiera permite aplicarla sólo a secciones específicas y va de la mano con el otro gran aspecto de la detección automática del idioma —en el mismo diálogo—.

    Desde que en Office 2007 todo lo que ataña a herramientas de corrección es común a todos los programas de Office, el corrector de Excel no es que sea malo, sino que obedece a la naturaleza distinta de los procesadores de texto que caracteriza a las planillas de cálculo: no revisa gramática porque las celdas no están concebidas para oraciones completas y, lo que sí estoy de acuerdo en que es mejorable, sólo revisa en un idioma a la vez sin que sea posible marcar celdas individuales en otro.

    Para ir terminando, me gusta la idea de TXT2Tags, cuyo editor oficial se abstrae de las etiquetas a la hora de pasar el corrector. ¿Es común su uso en proyectos en que te ha tocado trabajar?
    ¡Un saludo y ojalá algún día los programas especializados para traducir den respuesta contra este problema tan común y antiguo!

  16. Marta dice:

    Gracias por el post, es muy útil, pero tengo una duda: una vez has aplicado la macro y pasado el corrector, ¿cómo recuperas las etiquetas que has borrado? Igual es muy obvio (de hecho nadie ha sacado el tema en este hilo), pero no lo veo claro… Gracias de antemano por la respuesta.

    • Hola Marta.

      De los macros no sé a ciencia cierta pues nunca empleé macros, aunque capaz también pueda deshacerse. El caso es que tras aplicar los reemplazos tal evento se almacena en el historial para deshacer, de modo que es posible pulsar CTRL+Z si es lo último o, si luego se han hecho más cambios como pueden ser corregir la ortografía, recurrir a la lista Deshacer que (de forma predeterminada), dependiendo de si el Word es 2007 o superior o 2003 o anterior, estará en la Barra de herramientas de acceso rápido o en la barra de herramientas Estándar.

      Ya para completar mi comentario, faltaría que alguien nos confirme si el comando Deshacer también funciona para las acciones efectuadas a través de macros.

    • Hola, Marta y Fernando:

      La idea es hacer este proceso con textos provenientes de otras herramientas, como SDL Trados Studio o memoQ. Como los cambios se implementan después en estas herramientas, no es importante perder las etiquetas en el archivo de Word. 🙂

      Un saludo,

      Pablo

Deja un comentario