Intro | Índice | Introducción | Lenguaje Marcado | SGML | Bibliografía | Conclusión | Contácta | Suscríbete |
SGML (Standard Generalized Mark-up Language), es un lenguaje generalizado estándar para el formato de documentos. Es un estándar internacional que permite definir lenguajes para dar formato a documentos.
SGML fue diseñado para permitir el intercambio de información entre distintas plataformas, soportes físicos, lógicos y diferentes sistemas de almacenamiento y presentación, independientemente de su grado de complejidad.
Así, los archivos SGML deben utilizarse cuando existe alguna de las siguientes condiciones:
SGML tiene diversas funciones, entre ellas, nos encontramos con la función del etiquetado, la cual consiste en aportar información que refleje la estructura jerárquica de un documento, de forma que ayude al lector u ordenador a procesar su contenido. Existen dos tipos de etiquetado:
El lenguaje de etiquetado SGML permite distinguir entre el contenido (datos) y el etiquetado.
Es necesario un etiquetado o código genérico para lograr un sistema de códigos universal e independiente de la aplicación. Así, mediante la codificación genérica se evita la codificación interna, es decir, el que cada programa utilice un sistema propio. Se pretende lograr un conjunto de etiquetas válidas para un elevado número de documentos, algo que implica una gran dificultad debido a la gran diversidad de documentos y elementos que contienen.
SGML utiliza un conjunto de caracteres basado en el estándar ASCII (American Standard Coding for the Interchange of Information).
En SGML todo el etiquetado es lógico, es decir, en lugar de utilizar códigos crípticos, se utilizan nombres de elementos, delimitados por marcas que indican el comienzo y final de los objetos lógicos.
SGML no se quedó como un simple conjunto de códigos normalizados, sino que se convirtió en un lenguaje con el que se podía crear una definición del tipo de documento ( DTD ), mediante la que se definen con precisión aquellos elementos que son necesarios en la elaboración de un documento o un grupo de documentos estructurados de manera similar.
Las definiciones de los elementos, denominadas declaraciones de elementos, tienen dos funciones:
Nos encontramos ante distintos tipos de componentes de SGML, entre los cuales están:
La declaración SGML dice al usuario qué puede y qué no puede estar contenido en el documento SGML, qué caracteres serán usados, qué características específicas de SGML serán implementadas, y qué sintaxis se utilizará en el documento. Se trata de un diagrama formal y normalizado que le indica al sistema receptor el conjunto de caracteres, los delimitadores y las características opcionales de SGML que se están utilizando. La declaración SGML y la DTD trabajan de forma conjunta. Si la declaración SGML dice que una función en particular no podrá ser usada, la DTD debe respetarlo, de otra manera existirán errores en el documento.
En la DTD (Document Type Definition) o Definición del Tipo de Documento se identifica la estructura del documento, es decir, aquellos elementos que son necesarios en la elaboración de un documento o un grupo de documentos estructurados de manera similar. Contiene las reglas de dichos elementos: el nombre, su significado, dónde pueden ser utilizados y qué pueden contener. Si la DTD se almacena en un archivo separado (con la extensión .dtd), éste se puede referenciar sin residir dentro del documento SGML. Sin la DTD ( o una referencia a él), el documento SGML no será validado apropiadamente por el parser. El parser es una herramienta que asegura la adecuada conformación de SGML dentro de las múltiples especificaciones que un documento SGML puede tener. Un documento no será validado por el parser si no cumple con las especificaciones de la DTD , por ejemplo, si carece de título, ya que éste es un elemento obligatorio.
En la definición del tipo de documento o DTD (Document Type Definition) se utilizan los comandos:
Otro concepto importante dentro del SGML y del DTD es el de secciones marcadas. Éstas son usadas para aislar ciertos trozos de texto como específicos de una arquitectura, y se inician con los caracteres: "". Las claves para la especificación de las secciones marcadas son INCLUDE, IGNORE, CDATA, RCDATA o TEMP. Con ello, podemos decir que, otros comandos importantes son:
Así, pues para escribir la DTD hay que analizar los documentos y tener en cuenta los posibles cambios (revisiones, borrado,...) Además, las etiquetas definidas en la DTD servirán para que editores, motores de búsqueda y visualizadores interpreten los documentos SGML. Hay que analizar y definir bien la estructura de los documentos para poder jerarquizar y seccionar adecuadamente las partes que contendrá la DTD .
En la siguiente tabla se muestra un ejemplo de cómo funciona el DTD :
Nombres de la etiqueta | CHAPTER es el nombre de la etiqueta que indica el comienzo y final de un capítulo |
Contenido del elemento | Los capítulos pueden contener un párrafo introductorio, y deben contenter una o más secciones |
Las relaciones entre elementos | El elemento del cuerpo contiene una serie de capítulos |
La muestra del documento contiene el marcado o etiquetado y el contenido del texto, es decir, contiene el documento en sí que incluye tanto el texto como el marcado.
El contenido del documento tiene objetos SGML que siguen la estructura del árbol definido en la D DTD . Los objetos SGML son fundamentalmente dos: