Lo primero, xml ¿qué es?
XML (eXtensible Markup Language) es un lenguaje desarrollado por W3C (World Wide Web Consortium) basado en SGML (Standard Generalized Markup Language, Lenguaje de Marcado Generalizado Estándar).
XML se utiliza para almacenar e intercambiar datos estructurados entre distintas plataformas. Hay que tener cuidado con su nombre, pues nos puede llevar a la confusión, y pensar que es un lenguaje de marcado cuando no lo es.
XML es un metalenguaje, es decir, nos permite definir otros lenguajes adecuados a usos determinados.
También debemos saber que no es una versión mejorada de HTML, ya que esta, es una aplicación de SGML.
1 ¿Cuales son la características principales de XML?
Como se ha mencionado anteriormente, xml es un subconjunto de SGML, por lo tanto, incorpora las tres características más importantes de este; extensibilidad, estructura y validación.
También, y no menos importante es que está basado en texto (que lo hace más fácil de entender para quien no tenga conocimientos informáticos) y orientado al contenido y no a la presentación. Además, se definen etiquetas para crear los documentos. Un ejemplo de una etiqueta puede ser el siguiente:
<etiqueta> valor </etiqueta>
Siendo “valor” el dato a mencionar entre “<etiqueta>” y “</etiqueta>”.
Por último decir también que no existe un visor genérico de XML, por lo tanto, podemos utilizar cualquier programa para visualizarlo, tales como “xml copy editor” o incluso un documento “.txt” como es el bloc de notas.
2 Ventajas del xml
Las ventajas más interesantes que ofrece xml son:
- Es extensible: después de haberlo diseñado y puesto en funcionamiento, se pueden hacer cambios en él, de modo que podamos seguir usandolo y no nos dé ningún problema.
- No pertenece a ninguna compañía, por lo que no nos tenemos que preocupar de derechos de copyright ni nada por el estilo.
- Separa el contenido por un lado y la presentación por otro, esto es, una cosa es cómo se redacte un documento xml en un visor predeterminado y otra, como se visualice después. Un ejemplo claro de ello es, el que se muestra en las siguiente dos imágenes.
Por un lado tenemos un documento xml escrito en un bloc de notas.
Y por otro, como se visualiza por ejemplo, en google chrome.
Como vemos en la segunda imágen,, los espacios en blanco no se respetan respecto a la primera imagen.
- Otra de sus ventajas es que está diseñado para para cualquier lenguaje y alfabeto (encoding), y además, como se ha dicho anteriormente, si un tercero decide usar un documento xml creado previamente, podrá hacerlo sin problemas, ya que su estructura es de fácil comprensión.
- Permite una utilización efectiva en internet para sus diferentes terminales.
3 Estructura de un documento XML
Un documento xml está formado por un encabezado y un cuerpo. Además, aunque no es obligatorio que aparezcan, se pueden incluir, una declaración xml (siempre y cuando se incluya, se haga en la primera línea del documento y su primer carácter sea el signo “<”) y una instrucción de procesamiento (o proceso), que sirve para indicar cierta información al programa que procese el documento.
Aparte de una declaración xml e instrucción de procesamiento, un documento xml lo pueden formar los siguientes componentes.
- Elementos: se representa con una cadena de texto encerrada entre etiquetas. Pueden existir elementos vacíos (<vacio/>)
<vacio/>
</elementos_vacios>.
- Instrucciones: sirve para indicar cierta información al programa que procese el documento. Comienzan con la cadena “<?” y terminan con “?>”.
<?xml-stylesheet type=“text/css” href=“estilo-recetas.css”>
- Comentarios: no son obligatorios e indican información que no forma parte del documento. Se escriben con la cadena “<!--” al comienzo y “-->” al final.
- Referencias a entidades: Son caracteres especiales por su significado y para utilizarlos se debe utilizar la referencia a entidad que se muestra en la siguiente tabla.
- Referencias de caracteres: utilizado para representar un carácter Unicode en su valor decimal o hexadecimal correspondiente precedido de los símbolos “&#”.
- Secciones CDATA: utilizado para escribir texto que no queramos que el programa analice.
- Espacios en blanco: (explicado anteriormente con un ejemplo)
- Espacio de nombres: utilizado para diferenciar los nombres de algunos elementos (ya que pueden coincidir al poderse combinar varios documentos xml entre sí).
4 Tecnologías relacionadas con XML
Entre las tecnologías existentes, podemos destacar:
XLS: (Lenguaje Extensible de Hojas de Estilo"). Describe cómo debe ser transformada la información contenida en un documento xml para su presentación en un medio.
XPath: (Lenguaje de Rutas XML). Lenguaje para acceder a las partes de un documento xml.
XLink: (Lenguaje de Enlace XML). Permite insertar elementos en documentos xml para crear enlaces entre recursos, es decir, entre un link y otro.
XQL: (Lenguaje de Consulta XML). Facilita la extracción de datos entre documentos xml.
Fuentes de información:
- Abrirllave
- MundoLinux
- W3C
- Wikipedia