// estás leyendo...

Informática

Sobre Apertium en Linux Gazette


traduce este post

Linux Gazette

Jimmy O’Regan ha publicado en Linux Gazette un artículo sobre Apertium. En él describe de forma general esta plataforma de traducción automática (TA) y explica brevemente los distintos tipos TA que podemos encontrar (basada en ejemplos, basada en reglas y TA estadística). En la publicación también hace una referencia a TinyLex, al que precisamente dediqué la última entrada. A partir de ahora intentaré estar atento a las referencias a este programa que se puedan hacer.

En una parte del artículo se hace alguna comparación entre traducción automática estadística y TA basada en reglas. Sobre la primera comenta algunos de los inconvenientes de este tipo de sistemas, como es la necesidad de contar con una gran cantidad de texto en ambos idiomas, algo que no esta disponible en la mayoría de pares de lenguas. Otra de las desventajas es que los diccionarios generados contienen todas las posibles combinaciones de palabras para ambas lenguas lo cual supone un gran consumo de memoria y requiere más tiempo de proceso que el tipo de diccionarios usados en sistemas basados en reglas que además tienen la ventaja de poder ser leídos directamente por personas. En este punto es donde hace mención a TinyLex, que basa su información lingüística en diccionarios bilingües desarrollados en Apertium para ser consultados en dispositivos móviles.

Este es el párrafo original en el artículo:

SMT is the current focus of most serious research in MT, but rule-based systems still have a number of advantages. First and foremost, SMT systems require the availability of a large amount of text in both languages, which for most language pairs is not available. Secondly, the generated dictionaries contain all likely word combinations for both languages, which both consume a lot of memory and take much more processing time than do the kind of dictionaries used in rule-based systems (which also have the advantage of being useful as human-readable dictionaries - TinyLex is a Java ME program for bilingual dictionaries that uses Apertium data).

O’Regan (Irlanda) ha promovido y desarrollado el par de lenguas inglés-polaco (también Irlandés) para Apertium.

Compártelo
  • Facebook
  • del.icio.us
  • E-mail this story to a friend!
  • Google
  • Bitacoras.com
  • Ping.fm
  • Live
  • Netvibes
  • Tumblr
  • LinkedIn
  • Meneame
  • Print this article!

Entradas relacionadas

Comentarios

No hay comentarios en “Sobre Apertium en Linux Gazette”

Escribe un comentario

CommentLuv Enabled

Comentarios extra recopilados por BackType

Entradas recientes

Mi aportación a la blogosfera educativa
Mi aportación a la blogosfera educativa
11 de marzo de 2010
La wiki personal
La wiki personal
6 de marzo de 2010
Organización personal: cambios en 2010
Organización personal: cambios en 2010
3 de enero de 2010
Felices Fiestas
Felices Fiestas
24 de diciembre de 2009
Vodafone Mobile Connect en Linux
Vodafone Mobile Connect en Linux
12 de octubre de 2009

Miniblog

Her Morning Elegance / Oren Lavie
6 de marzo de 2010
The Fun Theory
13 de octubre de 2009
Titulares de prensa con historia
9 de octubre de 2009

Imágenes y fotos

apertium-android-text
apertium-android-apps
apertium-android-components
apertium-android-text

Hace un momento...

Nube de temas

Mis enlaces más recientes

Suscripción RSS

Suscripción por e-mail

Introduce tu correo electrónico:

Archivo

...y también