Asociación de Técnicos de Informática.Grupos de TrabajoNoticias de ATIServicio ATInetPublicaciones de ATIFormación: Catálogo y NovedadesBolsa de Trabajo Ayuda

 
I Jornada sobre Lengua e Informática
 

Coloquio 

(transcripción)

Nota: El coloquio fue recogido en una grabadora de mano, por lo que algunos pasajes se han perdido o han sido imposibles de reproducir. De estos, algunos han sido rehechos amablemente por sus autores, pero en otros casos ha sido imposible reconstruirlos. Normalmente, estos pasaje aparecen marcados con [...]; en el caso de dudas en la transcripción estas se muestran mediante el signo (?).

Primera parte

  1. El tratamiento de la voz
  2. La traducción automática


Asistente 1 (A1): ¿Cómo se arreglan para introducir en las máquinas el concepto de puntuación: punto y aparte, punto y seguido, coma, interrogación... ¿Cómo aparece esto como orden en la informática...?

Carmen Ugarte (CU): Yo te puedo contestar a eso por lo poco que conozco de un producto de IBM, el Via Voice, me parece que se llama ahora. [Dicho producto] tiene una orden, que cuando tú le dictas a la máquina, por ejemplo «abrir comillas» ella te las abre, te las escribe; «cierra comillas»... Creo que hay órdenes, hay mandatos que si los dices exactamente, igual que cuando los tecleas,  se te traducen en algo... No sé si Luis y María José podrán  añadir algo...

Luis Fernández (LF): Es que no me he enterado muy bien...

A1:  [...] que cómo se traduce para que la máquina entienda que hay punto y aparte, paréntesis... ¿Hay que darle la orden expresa de que hay esta puntuación o la máquina lo conjetura...?

LF:  Yo es que de reconocimiento de voz  no sé... Sé que, tradicionalmente, hay lo que ha dicho Carmen, esos mandatos ya prefijados..., bueno también el problema es si dices «punto» y te estás refiriendo a la palabra 'punto'. Hay una fase de aprendizaje...

CU: Normalmente la fase en la que están estos productos, por ejemplo el producto este del que hablo porque lo conozco un poco, y por eso hablo de él, no porque lo esté recomendando como bueno, es que no conozco otros,  reconocen bastante bien, incluso  desde las primeras releases, cuando un 'punto' está en el texto y cuando es un mandato. Sí que lo distinguen bastante bien, independientemente de que todos estos productos tienen una fiabilidad del x por ciento y luego tienes que corregir a mano... siempre hay un grado de error que ese lo tienes que corregir tú.

Natividad Álvarez (NA): El problema es que en este momento el grado de error es superior al que tú haces tecleando, o sea, que si tú tecleas con dos dedos tardas... — yo lo digo en mi caso ¿no?— tardo mucho más en corregir los errores que hace el intérprete ese de voz que los errores que hago yo tecleando. O sea, tardo menos tecleando con dos dedos y luego palabra a palabra ir quitando los errores que los del reconocimiento de voz, porque el problema es que no distingue los verbos... y cosas de esas, no distingue lo que es un verbo de lo que es un sustantivo y te mete errores que hacen totalmente incomprensible... Yo veo que es un problema tecnológico...

Juan Zabala (JZ): Es mera fonética lo que hace la traducción esta, que lo que hace es traducir sonido a signo y un intérprete no sabe cuándo acaba la frase ni...

CU: No, pero sí, sí que hacen un análisis semántico y en contexto, sí, no solo fonético. Te meten ahí unos algoritmos estadísticos... se basan mucho en las probabilidades de que una palabra aparezca en un determinado contexto... El grado de fiabilidad ahora mismo —lo digo por las demostraciones que he visto—  es alto. A mí porque me gusta teclear y por eso he dicho que de momento paso del chisme ese, pero evidentemente hay a quien le resulta muy útil...

Julián Marcelo (JM): Tres puntualizaciones: Yo he utilizado, curiosamente, para traducir Via Voice el producto de reconocimiento de voz de IBM . Creo que la única manera en este momento  realmente decente para alguien que
conozca lo suficiente las dos lenguas (origen y destino de la traducción) es ir leyendo en una e ir contando en la otra, como se hace cuando se traduce en voz alta. Con esto se evita todo el problema de pragmatismo y lo que haya alrededor que no sea la mera traducción... y funciona aceptablemente bien.
Mi segunda cuestión se refiere a lo que se ha comentado sobre la «sombra».  Por intuición, a mis alumnos de proyecto fin de carrera, que en general escriben mal, les digo:  «Conviene que esta memoria se la des a leer a alguien antes de traerla aquí, a alguien que tenga una mínima cultura, claro está, para ver si entiende las cuestiones que planteas».
Por último y como curiosidad aporto aquí el caso de un proyecto europeo, que está ahora presentando la empresa donde trabajo. Este proyecto, algo extraño,  plantea el problema de la comunicación y la decisión en lo que se llama ahora «gobierno en directo», uno de los programas de la Unión Europea. Hemos visto inmediatamente que hay que meter  lingüistas, porque uno de los problemas a resolver es el de las ambigüedades que sistemáticamente comporta este tipo de comunicación.

Rafael Fernández Calvo (RFC): Unas consideraciones muy sencillas sobre el tema de la traducción automática, que sirven también para interpretación más que para  la traducción. Decía un intérprete de Stalin que para traducir entre jefes de estado se necesitaban tres cosas: la primera no acongojarse ante la presencia de altos dignatarios [Audiencia (Au): difícil de aceptar, ¡je!, ¡je!]; la segunda: saber de política, pero la ponía como segunda; y la tercera: dominar ambos idiomas, pero la ponía solamente como tercera condición. Es decir, en cualquier caso la traducción automática los dos primeros no los puede resolver: el de no acongojarse... [Au: ese sí, ¿no?... Ese sí, ese sí..., ¡ja!, ¡ja!] y en cualquier caso era la tercera la que, realmente, le podía haber valido. El problema que yo veo, principalmente, en la traducción automática es que yo la veo como un objetivo a muy largo plazo. Yo hace cinco o seis años que pensé dedicarme un tiempo a traducir por encargo de una editorial... entonces me compré uno que se llamaba... —¿Profesional Translator, puede ser?— y en mi vida me he llevado una decepción mayor... me gasté veintiséis mil pesetas de la época..., [Au: para probar se consigue uno una copia pirata], que para que los de la BSA no me persiguiesen, no me enviasen el agente judicial a mi casa yo me compré el producto, y realmente no sé cómo ha avanzado este tema..., bueno sí sé cómo ha avanzado. Sé, por ejemplo, los traductores automáticos que hay en los webs... [Au:El Altavista, por ejemplo]... realmente, sabes que  te van a largar en vez de una traducción una lista de palabras... Yo expreso mi absoluto escepticismo, la tecnología todavía no está madura para este tipo de cuestiones.

LF: Sobre el proyecto europeo este en el que habrá que incluir lingüistas... Es lo que yo decía antes, que muchas veces los informáticos,  acostumbrados a hacer de analista, etcétera, etcétera, intentamos  cocinarnos nosotros solos como podemos las cosas... y es curioso porque lo he visto en casos de gente que quería hacer sistemas expertos de no sé qué... Al final tendremos que contratar a un economista porque es probable que empleando los libros no lo vamos a resolver. El problema al que volvemos a llegar es que tenemos las formaciones tan separadas, que los de ciencias no quieren saber nada de los de letras, los de letras nada de los de ciencias, los de no sé qué,  pues aunque no encuentren una salida no ven que a lo mejor el futuro está en acudir a otros campos y ese tipo de cosas; pero me temo que la mayoría de los proyectos van por ahí: no hay más remedio que unir a gente y por ahí vamos a tener que tirar.

Antonio Vaquero (AV): Yo quisiera completar un poco el panorama de la traducción por máquinas... Cuando se llamaba automatic translation en los tiempos Mac Kinley, yo creo que fue el propio Mac Kinley que, en el año 62, dice que el camino recorrido era especialmente duro y no va a llegar a ningún sitio y por tanto él se retira y,  sin embargo,  es considerado el padre de la traducción por máquina. Y es verdad que hubo muchos años en los que se abandonó el campo. No es secreto que el lenguaje es el fenómeno más complicado que hay detrás de la humanidad. La diferencia, claro, entre los lenguajes de programación y los lenguajes naturales es muy clara: las reglas por las que se hacen los lenguajes de programación son reglas que están establecidas a priori; en cambio, en el lenguaje natural es todo lo contrario, lo inventan socialmente comunidades y después los lingüistas tratan de encontrar alguna regla por la cual se hayan creado  esas reglas y se hayan acordado en esas comunidades y alguna se encuentran. Chomsky ha formulado algunas bastante bien, luego otras no se encuentran, el propio Chomsky tiene ahora un programa minimalista para tratar de encontrar las cosas comunes de las lenguas. En fin, es un tema complicadísimo, por tanto esperar que en el año 62 las máquinas fueran a traducir entre lenguas no fue más que la ilusión de unos pioneros que veían que las máquinas eran capaces de hacer muchas cosas pero no todas. Pero bien es verdad que, en los años 80 y como representación del conocimiento hay muchísimos grupos, importantísimos grupos, numerosísimos grupos que inician el desarrollo en  procesamiento del lenguaje natural y por ejemplo están los [...] por ejemplo un artículo de El País, era traducido sin intervención humana completamente, era un a página,  al inglés. Y este era un proyecto pagado por el Departamento de Defensa (?). Es decir que sí hay bastante potencia, para cumplir los objetivos de esa traducción que no son los de traducir a Cervantes, a Shakespeare, García Márquez, eso es absolutamente impensable, pero cuando uno, como todas las cosas de la informática no es especialmente ambicioso  en el dominio del tratamiento de las máquinas y tiene unos objetivos cortos pues se van cumpliendo esos objetivos, por ejemplo artículos técnicos traducidos del japonés al chino, del turco... Y hay numerosísimos que están trabajando en esto y se está notando  y ya no se tiene la impresión de pesimismo, sino que se tiene la impresión de estar avanzando en la dirección correcta y se va recorriendo un camino que poco a poco va ayudar muchísimo a la traducción por máquina. Esto quería dejarlo un poco claro: que no tengamos la impresión de que, claro, como las máquinas no pueden traducir a Shakespeare o a García Márquez, las máquinas no pueden traducir. No es eso. Con objetivos concretos sí es posible,  y sin disminuir ni una lengua u otra, pero sí disminuyendo el dominio y los objetivos de esa traducción. Por ahora me parece suficiente mi intervención.

Juan Manuel de la Fuente (JMF): Quería haber contestado a Rafael Fernández Calvo y me alegro de la intervención de Vaquero, porque también va un poco en esa línea. En efecto, dentro de la idea general de la presentación estaba eso: dónde estamos, adónde vamos,... Pero esa es, precisamente, la cuestión, el estado actual es que la traducción automática tiene utilidad dentro de un contexto, dentro de lo que hemos mencionado que se llaman sublengua o submundo, que es como lo llaman en un proyecto de la Comunidad Europea (Eurotra) , ya funcionando, mediante el cual se traducen todos los documentos oficiales, generados en cualquier idioma de la Comunidad a todos los idiomas de la Comunidad, lo cual lleva once por doce módulos de transferencia de idiomas, y eso se está haciendo. Claro, que están traduciendo determinados productos, documentos... por una parte documentos, por ejemplo,  de tipo legal, con un lenguaje muy conceptualizado y revisado, para eso sirve.
El otro mundillo de la traducción automática que está generando mucho dinero y creo que va a generar más, hay gente por ahí poniendo negocios, es lo que se llama las traducciones de urgencia, o sea, el ejecutivo que recibe una nota en inglés y quiere enterarse de lo que dice... —en inglés o en lo que sea—, y quiere enterarse de lo que dice allí lo antes posible y no hace falta que se lo pongan muy elegante, simplemente enterarse de lo que pone allí. Y para eso ya hay muchas empresas que se dedican a eso, como lo hacen, por ejemplo, el web de Altavista, que antes no sé si lo has mencionado o he sido yo, pero lo hemos aludido de alguna manera, que te ofrece una traducción, rápida e  inmediata de una cosa. El otro día lo visité por curiosidad y me encontré con unas preguntas frecuentes, en la sección esta de preguntas frecuentes,  y hay una que es realmente esclarecedora. Una que pregunta: «¿Por qué no puedo traducir un documento largo», bueno da ciertas explicaciones, pero es que luego viene la difícil: «¿por qué no puedo entender la traducción?». [(Au): ¡ja, ja ja!]. Y le contesta que «traducir entre idiomas es una tarea muy compleja». [(Au): ¡ja, ja ja!]. Bueno, luego lo elabora más y no me quiero extender, si queréis aquí está y si no accedéis al Altavista, que lo obtenéis rápidamente. O sea, da una serie de razones, en realidad explicando lo que yo he explicado: tenemos un sistema de traducción que no se entiende, que no sé qué y no sé cuántos, pero ahí está, podéis acceder cuando queráis...
Y el otro es más cuidado que es el de las traducciones hechas por humanos pero con asistencia de ordenador, que es un mercado que ese sí que está —me refiero al de la informática — generando productos muy interesantes: lo que llaman «la memoria de traducción», que son sistemas, sencillamente, que cogen una, digamos, para empezar una traducción nueva y según la vas traduciendo si se encuentra alguna frase  repetida dentro de unos límites de porcentaje, que sin duda existen, te da una oferta de traducción para que tú la completes. Y eso pasa con una parte de «la memoria de traducción». Cuando ese proceso se repite muchas veces, sobre todo cuando se hace en proyectos largos, con muchísimos documentos, lo que ocurre es que has generado una memoria de traducción: muchas traducciones exactas o aproximadas de frases que ya están. Eso al traductor le viene muy bien. Primero, porque le da más trabajo, y segundo porque es más productivo. Y ¿por qué digo que  le da más trabajo?; porque esto ayuda en la traducción de grandes proyectos al problema de la consistencia; es decir, que todo el mundo use la pasiva, que todo el mundo use la activa o que todo el mundo use tal término para tal cosa en vez de otro alternativo que no es que sea malo pero cuando vas leyendo y ves aquí  una cosa y más adelante otra: el interfaz y la interfaz, claro, vamos a ver, que venga la Academia a solucionarlo, pero de hecho, en los documentos sale distinto, ¿no?
Esa es un poco la historia, no los programas de traducción automática en sí, sino la asistencia al traductor, los de traducción rápida de urgencia como el Systran de Altavista, que es uno de los más extendidos y luego ya los grande proyectos como el Eurotra de la Comunidad Europea...

JM: Yo también pienso que el problema de la traducción no es un problema informático. Es realmente un problema de estructura de las lenguas. Si las lenguas son cercanas será bastante sencillo hacer una buena transposición. No entiendo mucho, pero pienso que como nos empeñemos en crear un traductor automático de castellano a vasco y de vasco a castellano tendremos muchos problemas. Es muy sencillo pasar al castellano un texto digitalizado en francés ¿Por qué?, porque las estructuras de las frases se van pareciendo bastante. La traducción puede funcionar bastante bien dentro de esas limitaciones, y en todo caso no es un problema informático...
Quiero aportar una referencia curiosa: Umberto Eco en un libro que responde a una petición de la Comunidad Europea a grandes escritores para que opinen sobre los grandes problemas europeos (las lenguas es uno de ellos, evidentemente). Repasando desde los textos antiguos...[AU: ¿La Semiología?] No, no, es La búsqueda de la lengua perfecta (editorial Crítica). Decía, que repasando desde los textos antiguos, como el propio Génesis, hasta las tendencias de las lenguas universales, Eco cita el aymará, una lengua de América del Sur con una estructura intermedia curiosísima que le haría
muy apta para traducciones no directas. Me impresionó esta mención, que ya había oído hace quince años en mi época de funcionario internacional en Roma, como mecanismo de una traducción semiuniversal entre lenguas no afines por su estructura.

JMF: La interlengua es una de las estrategias de la traducción automática. Hay un proyecto en Holanda, que mediante la interlengua que es el esperanto, están haciendo traducción de algo a esperanto y de esperanto a otras.

JM: También parece que se ha inventado recientemente una especie de esperanto europeo que va cogiendo raíces de las lenguas oficiales, con cierta proporción a su extensión, y las articula en frases estreucturadas de forma directa ...

RFC: Que es la lengua que dicen que se habla en el pelotón del Tour ... Sí, sí, se dicen que se habla una lengua que es una mezcla de francés, italiano y español.. los países anglosajones a la bicicleta de competición no son tan aficionados. Entonces, el pelotón del Tour habla el idioma ciclista que es una mezcla de francés, italiano y español...

Moderadora: Pues habrá que buscarle un nombre al idioma del pelotón y nos quedan cuatro minutos, cinco, para hablar del espanglis.

..........

 

 
 
 

I Jornada sobre Lengua e Informática

 
 
Última actualización: 30 de noviembre de 1999 
Sugerencias, comentarios, noticias, advertencias, ...info@ati.es
Mejor con cualquier visualizadorHTML 3.2


Sitio Web creado en 1994 por ATI (Asociación de Técnicos de Informática)
Este es el más antiguo de los webs asociativos de España