XML: Qué es, ventajas y características

PHP, HTML, Java, JS… Existen una gran cantidad de lenguajes que se pueden utilizar a la hora de programar una página web. Cada uno tiene sus pros y sus contras, en muchos casos incluso se combinan varios de ellos para poder obtener un mejor resultado o para lograr objetivos concretos.

El mundo de la programación es tan basto que es imposible conocer y aprender todos los lenguajes existentes, así como los que están por venir, pero es importante conocer los esenciales para poder entender el funcionamiento y seguir una curva de aprendizaje bien definida que ayuda a trabajar en los demás lenguajes.

Qué es XML

Muchas personas confunden XML con HTML, aunque son dos cosas diferentes. XML es el acrónimo de eXtensible Mark-up Lenguage, o Lenguaje de Marcado Extensible. A pesar de lo que pueda hacer creer su nombre, XML no es un lenguaje de marcado sino un meta-lenguaje que permite definir etiquetas personalizadas para describir y organizar los datos de un documento.

Que es XML

XML ha sido desarrollado por el Wolrd Wide Web Consortium (W3C) con el objetivo de poder estructurar el contenido de los datos otorgando al desarrollador la capacidad de crear sus propias etiquetas.

Este lenguaje no está destinado a la programación de páginas web sino a la estructuración de los datos, sin embargo es común encontrar a XML en el código de los sitios web de todo el mundo.

Al igual que HTML, XML trabaja con texto plano y es un subconjunto de SGML (Standard Generalised Mark-up Lengauge), sin embargo XML puede definir las etiquetas en función del tipo de dato con el que trabaja el desarrollador.

Características de XML

Al ser este lenguaje un subconjunto de SGML hace uso de las tres características más importantes del Estándar de Lenguaje de Marcado Generalizado, las cuales son:

  • Extensibilidad
  • Estructura
  • Validación

XML no está pensado para utilizarlo en forma de presentación sino que se enfoca únicamente en el contenido, por lo tanto no se utilizan etiquetas para poder dar formato al contenido de un documento XML.

Las etiquetas que se utilizan en XML no tienen un significado preestablecido. Éstas se utilizan para definir los documentos con el significado que el desarrollador desee otorgarles.

Si bien muchas personas lo confunden con HTML otras creen que XML puede sustituir al lenguaje de marcado de híper-texto, pero no es así. Dichos lenguajes pueden complementarse pero XML no es capaz de sustituir a HTML a la hora de desarrollar páginas web.

XML

Ventajas de XML

Utilizar XML para estructurar el contenido tiene muchas ventajas. Una de las más grandes es que es uno de los lenguajes que más fácilmente se procesa puesto que hace uso de texto plano, facilitando el envío de información a través de internet.

Este lenguaje separa completamente el contenido del formato de presentación, haciendo uso únicamente del contenido y dejando la presentación para otro lenguaje.

Otra de las grandes ventajas de utilizar XML a la hora de programar es que está diseñado para poder trabajar con cualquier lenguaje y alfabeto, por lo que ningún desarrollador tendrá problema para hacer uso de él combinándolo con el lenguaje con el que quiera o deba trabajar.

Qué compone un documento XML

Los documentos XML pueden disponer de estos componentes:

  • Comentarios: Al igual que en otros lenguajes de programación, los comentarios se utilizan para añadir notas al documento sin que formen parte del contenido del mismo. Estos comentarios comienzan por <!– y terminan por –>.
  • Declaraciones de tipo: <!DOCTYPE>, esta etiqueta especifica la información sobre el documento.
  • Elementos: Las piezas lógicas que se utilizan en el marcado, se representa haciendo uso de una cadena de texto que se encierra entre etiquetas. Los elementos pueden contener atributos o incluso estar vacíos (con la etiqueta <br/>).
  • Instrucciones: Son las órdenes especiales que se indican en el documento para que lleve a cabo la aplicación que procesa el archivo XML.
  • Instrucciones XML: Todas las instrucciones dentro del documento XML comienzan con <? Y terminan con ?>
  • Secciones CDATA: Las secciones CDATA se refieren al conjunto de caracteres que el procesador no debe interpretar como parte de una etiqueta. De esta forma se utiliza para añadir caracteres como <, &, > y demás. Se aplican de la siguiente forma <!CDATA[ < ]>.

Documento XML

Sintaxis de XML

La sintaxis del lenguaje XML son las normas que se deben seguir para poder construir un documento XML. Estas reglas son dictadas por el World Wide Web Consortium (W3C) y se pueden consultar en http://www.w3.org/XML. Entre las reglas que marca el consorcio destacan:

  • Es un lenguaje sensible a las mayúsculas (case-sensitive).
  • Todos los elementos del documento han de tener su correspondiente etiqueta de inicio y de cierre.
  • Todo documento XML debe tener un elemento (raíz) que contenga a los demás elementos del contenido.
  • Todos los elementos dentro del documento XML han de estar anidados correctamente.
  • Todos los valores de los atributos deben estar entrecomillados.

Estas son las normas de sintaxis de XML más destacables, aunque existen otras tantas que también hay que tener en cuenta a la hora de desarrollar un documento haciendo uso del esquema que propone XML para poder ordenar el contenido.