Diccionarios para humanos

Existen varios diccionarios consultables en línea [1] y hay varias interfaces de consulta disponibles. Nos vamos a centrar en varios de los que pueden ser descargados libremente. [2]

El tesauro de ORCA

El objetivo de este glosario[3] no es explicar el significado de los términos de informática usados en inglés, sino dar una lista de sugerencias para su traducción al español, para quien ya tenga suficientes conocimientos de informática en inglés.

La principal fuente para este glosario ha sido la comunidad hispano-parlante que desarrolla y usa software libre, participando directamente en la edición del glosario a través de su interfaz web http://quark.fe.up.pt/orca , o indirectamente a través de sus discusiones en las listas de correo sobre el tema. Distingue entre «colaboradores» y «editor»: un colaborador no puede borrar lo que ya ha sido escrito por otro, pero puede escribir comentarios; el editor después va a leer esos comentarios, y altera la definición respectivamente. Los números de versiones terminados en .0 quieren decir que el glosario acaba de ser revisado por el editor; si el último número no es cero, indica el número de contribuciones que han sido introducidas desde la última revisión.

Para muestra, un botón; consultamos «driver» en la versión 2.0.178, de 16 de marzo de 2002. Esta es la salida:

	  
	    driver
	    controlador, manejador, gestor, driver video
	  
	

En la salida de dict tenemos otro ejemplo de consulta a ORCA, con un comentario de un colaborador.

Glosario de la ATI

Se trata del «glosario» de la Asociación de Técnicos de Informática. [4]

Veamos por ejemplo la entrada «FSF» en la versión HTML 4.0 (julio 2001) de la cuarta edición (mayo 2001):

	
	   FSF Ver: "Free Software Foundation"
        
      

Seguimos el enlace

	
	  Free Software Foundation — FSF (Fundación para 
	  el Software Libre)
	  Fundación norteamericana creada en 1996 por Richard 
	  M. Stallman cuyo objetivo es promover el desarrollo 
	  y el uso de software libre en todas las áreas de la 
	  Informática. Ver también: "Free Software".
	  [Fuente: RFCALVO].
	
      

Me recuerda Jaime Villate que esta entrada tiene un error manifiesto; la FSF no fue creada en el '96 sino en 1985.

El protocolo DICT

El Grupo de Desarrollo de DICT pretende dar solución a un problema: ¿cómo estandarizar el acceso a los múltiples diccionarios disponibles?

RFC 2229 describe el protocolo DICT como un protocolo de consulta/respuesta sobre TCP que permite a un cliente acceder a un diccionario de definiciones utilizando un conjunto de bases de datos de diccionarios de lenguajes naturales.

El grupo de desarrollo tiene su página en http://www.dict.org. Los servidores y clientes son libres (licencia GPL). Existen diccionarios y tesauros que pueden instalarse localmente. La distribución que utilizo, GNU Debian Woody, incluye los siguientes diccionarios de interés en nuestro campo:

dict-gcide

the GNU version of the Collaborative International Dictionary of English, which is based on the Webster's Revised Unabridged Dictionary (G & C. Merriam Co., 1913, edited by Noah Porter), supplemented by many definitions from WordNet, the Century Dictionary, 1906, and by numerous definitions contributed by volunteers.

dict-wn

WordNet 1.7, A Lexical Database for English from the Cognitive Science Laboratory at Princeton University. WordNet defines only nouns, verbs, adjectives and adverbs. Other parts of speech, such as pronouns and articles, are omitted. Definitions in this dictionary are more concise that in the 1913 Webster. This is a 2001 edition, so it fills in many of the gaps left by the latter.

dict-foldoc, dict-jargon

the Free On-line Dictionary of Computing, and the Hacker's Jargon file. There is a great deal of overlap between the Jargon file and the FOLDOC. Although the FOLDOC is much larger than the Jargon file, there are numerous entries in the Jargon file that are not found in FOLDOC.

dict-vera

a dictionary of acronyms used in the computer field.

i2e

diccionario inglés-español de Alfredo Casademunt, a su vez basado en el trabajo de José Luis Triviño.

Además, he añadido

El Glosario de Orca

en su versión .dict

eng-spa, spa-eng

descargados de http://www.freedict.d

Un ejemplo nos mostrará su uso:

	[Mi_maquina]$ dict font
      

da la siguiente salida

	
	  8 definitions found

	  From WordNet (r) 1.7 [wn]:

	  font
	  n 1: a specific size and style of type within a type 
	    family [syn: {fount}, {typeface}, {face}]
	  2: bowl for baptismal water 
    	    [syn: {baptismal font}, {baptistry}, 
	    {baptistery}]

	  From The Collaborative International Dictionary of English 
	  [gcide]:

	  Font \Font\, n. [F. fonte, fr. fondre to melt or cast. See
	     {Found} to cast, and cf. {Fount} a font.] (Print.)
	     A complete assortment of printing type of one size, 
	     including a due proportion of all the letters in the 
	     alphabet, large and small, points, accents, and whatever 
	     else is necessary for printing with that variety of types; 
	     a fount.
	     [1913 Webster]

	  From The Collaborative International Dictionary of English 
	  [gcide]:

	  Font \Font\, n. [AS. font, fant, fr. L. fons, fontis, spring,
	     fountain; cf. OF. font, funt, F. fonts, fonts baptismaux, 
	     pl. See {Fount}.]
	     1. A fountain; a spring; a source.
	     [1913 Webster]
  
	     Bathing forever in the font of bliss. --Young.
	     [1913 Webster]
  
	  2. A basin or stone vessel in which water is contained for
	     baptizing.
	     [1913 Webster]
  
	     That name was given me at the font.   --Shak.
	     [1913 Webster]

	  From The Free On-line Dictionary of Computing (09 FEB 02) 
	  [foldoc]:

	  font
  
	     A set of {glyphs} ({images}) representing the
	     {characters} from some particular {character set} in a
	     particular size and {typeface}.  The image of each character
	     may be encoded either as a {bitmap} (in a {bitmap font}) or 
	     by a higher-level description in terms of lines and areas 
	     (an {outline font}).
  
	     There are several different computer representations for
	     fonts, the most widely known are {Adobe Systems, Inc.}'s
	     {PostScript} font definitions and {Apple}'s {TrueType}.
	     {Window systems} can display different fonts on the screen 
	     and print them.
  
	     [Other types of font?]
  
	     (2001-04-27)

	  From i2e [i2e]:

	     font : tipo (de letra)

	  From i2e [i2e]:

	     font : fuente

	  From ORCA - Glosario de Informática Inglés-Español 
	  [glosario]:

	  font
	     fuente, tipo de letra, (TIPO DE LETRA, fuente, en español, 
	     tiene que ver con agua, no con tipografía)

	
	

[1] Hay bastantes más que los que vamos a examinar, de interés especializado: pydict de inglés y chino; skk y edict de japonés, mueller para inglés-alemán…

[2] Es bastante discutible que el Glosario de la ATI sea libre. Según las «normas»

1. © 1994—2002 Rafael Fernández Calvo

2. El autor autoriza la reproducción y difusión de este documento, por cualquier medio, sea en su totalidad o parcialmente, si es realizado sin ánimo de lucro por organizaciones sin ánimo de lucro. Estas organizaciones pueden también enlazar este glosario desde sus sitios web, si bien se agradece a los enlazantes que lo comuniquen al autor.

3. Si las actividades citadas en 2. las realizan organizaciones con ánimo de lucro, o si las realizan con ánimo de lucro organizaciones sin ánimo de lucro, se requiere siempre el permiso previo por escrito del autor.

4. En todos los casos es obligatoria la mención completa de la fuente.

Según Javier Fernández-Sanguino Peña, uno de los desarrolladores principales del equipo español de Debian, en mensaje a de 24 de mayo de 2002 en respuesta a una consulta mía

No se llegó a un acuerdo con el autor con respecto a las condiciones/licencia de distribución (…) No sé si las condiciones han variado.

En el mismo hilo y mismo día Jaime Villate confirma

El glosario de Rafael Fernández Calvo no ha sido convertido a formato .dict y no se puede crear un paquete Debian con él, por no ser un glosario libre. Mi plan actual es dejar que ORCA se convierta en glosario, en vez de tesauro, y ya comienzan a aparecer algunas explicaciones.

[3] Proyecto ORCA — Herramientas de ayuda para los traductores y productores de software libre en español (programas y documentación), http://quark.fe.up.pt/orca/index.es.html ; proyecto responsabilidad de Jaime E. Villate bajo los términos de la Licencia GNU Para Documentación Libre. Realmente es un tesauro, como reconoce el propio Villate en correo a la lista de fecha 29 de marzo de 2000: un «glosario» explica con detalle los términos, mientras que un «tesauro» sugiere simplemente sinónimos. Recordemos también que la intención del coordinador es convertirlo en un verdadero glosario.

[4] http://www.ati.es/novatica/glointv2.txt ó http://www.ati.es/PUBLICACIONES/novatica/glointv2.html , coordinado por Rafael Fernández Calvo. Hay que recordar las objeciones que desde el mundo del software libre se ponen a su licencia.