Rafael Barzanallana. Universidad de Murcia    Informática, Ciencia, Escepticismo

Artículos.   Informática. Lenguajes

¿Qué son los lenguajes de marcado o de marcas?

En el año 1989, el físico nuclear Tim Berners-Lee del CERN (Centro europeo para la investigación nuclear) trabajaba en un sistema que permitiera acceder a archivos en línea sobre el protocolo de comunicaciones TCP/IP. En este año existían dos métodos para enlazar documentos electrónicos entre sí. Por una parte los enlaces o hipervínculos y por otra parte un lenguaje denominado SGML (Standard Generalize Markup Language, "Lenguaje de marcas generalizado"), que consiste en un sistema para la organización y etiquetado de documentos. La ISO normalizó el lenguaje en el año 1986. Sirve para especificar las reglas de etiquetado y no impone ningún conjunto de etiquetas especial, teniendo en cuenta estos métodos Tim Berners-Lee a principios de 1990 definió el lenguaje HTML (Hypertext Markup Language, “Lenguaje de marcas hipertextuales”) como un subconjunto de SGML y creó algo más el World Wide Web (también conocido como la Web, es un sistema de documentos de hipertexto y/o hipermedios enlazados entre si y accesibles desde interne). En 1991 creó el primer navegador de HTML que funcionaba en modo texto y para el sistema UNIX.

¿Qué son las abreviaturas con "ML"?

Casi todas las siglas en la web que tiene un "ML" en éllas, se trata de un "lenguaje de marcado o de marcas." Los lenguajes de marcado son los lenguajes que conforman la web.

Hay muchos lenguajes de marcas diferentes. Este artículo se centra en HTML y XML, pero hay un montón de otros lenguajes de marcado. Tres son los que se deben tener en cuenta si estás haciendo el diseño de una página web o desarrollo: HTML, XML y XHTML.

¿Qué es un lenguaje de marcas?

Un lenguaje de marcas es un lenguaje que anota el texto de modo que el ordenador puede manipularlo. La mayoría de los lenguajes de marcas son legibles debido a que las anotaciones están escritas de forma tal que se puedan distinguir de los textos. Por ejemplo, con HTML, XML y XHTML, las etiquetas de formato son ‹ y ›. El texto que aparece dentro de uno de esos delimitadores se considera parte del lenguaje de marcado y no parte del texto anotado. Por ejemplo

‹ p › este es un párrafo de texto escrito en HTML ‹ /p ›

Al dar formato al texto que se desea imprimir (o visualizar en un ordenador o TV), es necesario distinguir entre el texto en sí y las instrucciones para imprimir el texto. Las marcas son las instrucciones para mostrar o imprimir el texto.

El marcado no tiene que ser legible por ordenador. Las anotaciones hechas en un texto en papel o en un libro son también marcas. Por ejemplo, muchos estudiantes para poner de relieve algunas frases de sus libros de texto. Esto indica que el texto en negrita es más importante que el texto que lo rodea. El color más destacado es el marcado.

El marcado se convierte en un lenguaje cuando las reglas están codificadas en torno a cómo escribir y usar el marcado. Ese mismo alumno puede tener su propio "lenguaje de marcado al tomar notas" si las reglas codificadas son como por ejemplo "marcador morado es para las definiciones, resaltador amarillo es para los detalles del examen, y notas a lápiz en los márgenes para recursos adicionales." Pero la mayoría de los lenguajes de marcas se definen por una autoridad externa para permitir su uso por muchas personas diferentes.

HTML HyperText Markup Language

HTML o HyperText Markup Language es el lenguaje de la web. Casi todas las páginas web están escritas en HTML. HTML define la forma en que las imágenes, multimedia y texto se muestran en los navegadores web. Incluye elementos para conectar los documentos (hipertexto) y hacer que los documentos web sean interactivos.

HTML es un lenguaje de marcado definido como estándar. Esta norma fue desarrollada por el World Wide Web Consortium (W3C). Se basa en SGML (Standard Generalized Markup Language). Es un lenguaje que utiliza etiquetas para definir la estructura de un texto. Elementos y etiquetas son definidas por los caracteres ‹ y ›.

Pero HTML no es el único estándar para el desarrollo web. Cuando HTML fue desarrollándose se puso más y más complicado y las etiquetas de estilo y contenido se combinaron en un solo lenguaje. Finalmente, el W3C decidió que no había necesidad de una separación entre el estilo de una página web y el contenido. Una etiqueta que define el contenido por sí solo, como H1, se mantendría en HTML, las etiquetas que definen el estilo, como la fuente, han quedado obsoletas a partir de HTML 4.01 a favor de las hojas de estilo.

La nueva versión de HTML es HTML5. HTML5 añade más funciones en HTML y elimina parte de la rigidez que le fue impuesta por XHTML. Sin embargo, HTML5 aún es un lenguaje de marcas.

XML-eXtensible Markup Language

El eXtensible Markup Language es el lenguaje en que se basan otras versiones de HTML. Al igual que HTML, XML está fuera de SGML. Es menos estricto que SGML y más estricto que el HTML plano, y proporciona la capacidad de ampliación para crear varios lenguajes diferentes.

XML es un lenguaje para escribir lenguajes de marcas. Por ejemplo, si se está trabajando en la genealogía, se pueden crear etiquetas usando XML para definir el padre, madre, hija, e hijo en el XML como este: ‹ padre › ‹ madre › ‹ hija › ‹ hijo ›. También hay varios lenguajes estandarizados ya creados con XML: MathML para la definición de las matemáticas, SMIL para trabajar con multimedia, XHTML, y muchos otros.

XHTML-eXtended HyperText Markup Language

XHTML 1.0 es HTML 4.0 redefinido para cumplir con el estándar XML. No hay muchas diferencias importantes entre HTML y XHTML:

XHTML está escrito en minúsculas. Mientras que las etiquetas HTML se puede escribir en MAYÚSCULAS, mezcladas o en minúsculas, para ser correctos, las etiquetas XHTML deben estar todas en minúscula.

Todos los elementos XHTML deben tener una etiqueta final. Los elementos con sólo una etiqueta, como HR y IMG necesita una barra de cierre (/) en el extremo de la etiqueta:

‹ /hr ›

‹ img ›

Todos los atributos deben ser citados en XHTML. Algunas personas eliminan las comillas alrededor de los atributos para ahorrar espacio, pero son necesarias para un XHTML correcto.

XHTML requiere que las etiquetas se aniden correctamente. Si se abre una negrita ‹ b › y luego un elemento de cursiva ‹ i › se debe cerrar el elemento cursiva (‹ i ›) antes que la negrita (‹ b ›).

Los atributos XHTML deben tener un nombre y un valor. Los atributos que son independientes en HTML deben ser declarados con valores, así, por ejemplo, el atributo de noshade de recursos humanos se habrían de escribir noshade = "noshade".

Buscar en mis sitios

Google Plus asignatura DAWeb

Google Plus asignatura IAT II


Website Translation Widget