Intro | Índice | Introducción | Lenguaje Marcado | SGML | Bibliografía | Conclusión | Contácta | Suscríbete |
Cuando tenemos un documento en soporte físico y lo convertimos en información digital, sobre lo que es su contenido añadimos una capa de metainformación comprensible para las máquinas que van a procesar ese contenido
En un principio esos metadatos consistían en "códigos de control" o macros que especificaban el formato de ese contenido para una apliacación concreta, por lo que se conocían también por código específico. Para permitir la interoperabilidad de los documentos era necesario un "código genérico", que no dependiese de la aplicación, al menos en teoría
De aquí surgió el concepto de lenguaje marcado , un método de añadir por medio de etiquetas genéricas información al contenido de un documento. Uno de los padres de este conceptom Charles Goldfarb, inventó en 1969 el primer lenguaje marcado junto a sus compañeros Edward Mosher y Raymond Lorie. GML significa Generalized Markup Language (lenguaje de marcado generalizado) . Además de la idea de marcar textos con etiquetas , añadía dos conceptos importantes: la definición formal del tipo de documento y la estructura de elementos anidados.
Posteriormente, en 1978, el ANSi creó un comité de Lenguajes de Ordenador para Procesado de Textos, para desarrollar como un estándar de GML , en 1980 publicaron un borrador de SGML (Standard Generalized Markup Language) y en 1986 se aprobó como ISO 8879.
Así, SGML se convertía en un lenguaje para marcar textos en medio electrónicos, y que podía restringirse para generar lenguajes específicos para fines específicos. Algunas de sus aplicaciones más conocidas con PostScript, RTF o HTML.
El HTML no es más que una aplicación del SGML, un sistema para definir tipos de documentos estructurados y lenguajes de marcas para representar esos mismos documentos. El término HTML se suele referir a ambas cosas, tanto al tipo de documento como al lenguaje de marcas.
HTML (Hyper Text Markup Language) es el lenguaje de marcas de texto utilizado normalmente en la www (World Wide Web). Fue creado en 1986 por el físico nuclear Tim Berners-Lee, el cual tomo dos herramientas preexistentes:
HTML no es propiamente un lenguaje de programación como C++ o VisualBasic, sino un sistema de etiquetas . No presenta ningún compilador, por lo tanto si se presenta algún error de sintaxis éste no lo detectará y lo visualizará como lo entienda.
El entorno para trabajar HTML es un procesador de texto, como el que ofrecen los sistemas operativos Windows (Bloc de Notas), UNIX o MS Office (Word). El conjunto de etiquetas que se creen se deben guardar con la extensión .html o .htm y serán mostrados con los visores de páginas Web en Internet (Netscape, Mosaic, Opera, Internet Explorer, Safari o Mozilla Firefox).
XML es descendiente directo del propio SGML, creada por Jon Bosak, Tim Bray, C.M. Sperber-McQueens y James Clark entre otros. Pretendía ser como éste un lenguaje marcado general, pero liberado de aquellas características redundantes, difíciles de implementar, confusas o inútiles, comprobadas después de veinte años desde su aplicación. Su desarrollo comenzó en 1996 y actualmente existen dos versiones:
La sintaxis de XML es mucho más estricta que la de SGML, y al igual que éste, puede especificarse en un esquema o un DTD para convertirlo en una aplicación XML. Y eso es justo lo que nos lleva al último punto de esta introducción, la reformulación de HTML como una aplicación XML.
Primero se ha de establecer que XHTML es una reformulación de HTML 4.0 y XML 1.0. Fué concebido como un lenguaje para el intercambio de documentos científicos y técnicos. Siendo que HTML es una aplicación SGMLm se valió de un reducido grupo de etiquetas para la formulación de documentos relativamente simples.
HTML se popularizó rápidamente y superó las expectativas que motivaron su creación. La flexibilidad de HTML y la constante invención de nuevos elementos para ser usados con este lenguaje ha creado el desorden y la falta de compatibilidad con algunos navegadores, cosa que con su reformulación en el XHTML se pretende corregir.
Por un lado, XML es un simple y muy flexible formato de texto derivado de SGML, diseñado especialmente para documentos web. Permite a los desarrolladores crear sus propias etiquetas .
A diferencias del HTML, XML es muy estricto en su estructura, más que en el formato. En HTML es posible visualizar documentos mal estructurados, etiquetas mal anidadas o inconclusas, en XML si se abre una etiqueta , debe cerrarse.
XML es ampliamente usado para estructurar datos (inventarios, catálogos, etc.). Una de sus ventajas es la capacidad que provee al permitir la transferencia estructurada de información que puede ser utilizada por otras aplicaciones.
Así que XHTML reune la capacidad de formato de HTML y ésta se consolida con la formalidad del XML (y sus reglas) a la hora de estructurar documentos para la portación de datos. Esto le permite a la vez ser manejado y validado por cualquier herramienta estándar.
Esta reformulación nos permite -a la vez- desarrollar sitios que podrán ser "vistos" por personas discapacitadas, ya que existen agentes de usuario que pasan la información a formatos como Braile.