domingo, 5 de septiembre de 2010

DIRECCIONES URL

Las siglas URL corresponden a las palabras inglesas Universal Resource Locator, que en español viene a significar algo así como "Localizador Universal de Recursos". La URL es el modo que tiene la Web de identificar cualquier tipo de archivo o recurso en cualquier parte del mundo.
El formato de una URL básica (concretamente, de la URL de esta misma página) es el siguiente:
http://www.psicobyte.com/html/taller/url.html
Que, dividido en sus partes elementales, es más o menos esto:
http://www.psicobytecomhtmltallerurl.html
protocolohostdominiodominio de primer niveldirectoriosubdirectoriorecurso
Veamoslo parte a parte:
--- Protocolo
Es donde le indicamos a la máquina qué protocolo vamos a usar. Un protocolo es, básicamente, un lenguaje que utilizan las máquinas conectadas para comunicarse entre ellas. Con esto le indicamos a la máquina a la que nos conectamos el protocolo que debe usar. Dependiendo de este, probablemente tengamos que usar un programa distinto. Cada protocolo utiliza un puerto (una especie de "entrada" a la máquina) por defecto, y es a ese al que, en principio nos conectará al indicarle ese protocolo en la URL.
Los protocolos más importantes son los siguientes:
http://El protocolo HTTP (Hiper Text Transfer Protocol) es el que usa la Web, su puerto por defecto es el 80.
ftp:// (File Transfer Protocol) Se usa para transferir archivos. Su puerto por defecto es el 21.
gopher://El antiguo (y ya casi extiguido) sistema gopher se usaba, antes de que existiera la Web, para localizar documentos en Internet. Tiene reservado el puerto 70.
telnet:Abre una sesión de Telnet. Telnet es un protocolo mediante el cual se puede trabajar en una máquina remota como si estuvieras en ella. Su puerto por defecto es el 23.
mailto:Se usa para indicar una dirección de correo electrónico
news:Indica que se refiere a la dirección de un servidor o grupo de News.




Toda la parte de la URL que hace referencia a la máquina, desde lo que he llamado host hata lo que he denominado como dominio deprimer nivel, es completamente indiferente a si lo escribes en mayúsculas o en minúsculas. Es decir, que no importa si escribes el nombre www.misite.com, www.MiSite.com o WWW.MISITE.COM. Todos son el mismo nombre.
Pero, por otro lado, todo lo que corresponde a la ruta de directorios y nombre de archivo dentro de un ordenador, depende del sistema operativo en el que trabaje ese ordenador, y la mayorí de ellos distingue entre mayúsculas y minúsculas. De modo que host.com/directorio/, host.com/Directorio/ y host.com/DIRECTORIO/ son, normalmente, nombres totalmente distintos.
Algunas veces, puedes encontrarte que no existe ningún nombre de dominio, y que este aparece sustituido por una cadena de números. Por ejemplo http://64.224.173.51/html/taller/url.html hace referencia a esta misma página. Esto es lo que se llama dirección IP (de Internet Protocol), y es la dirección que realmente usan las máquinas para localizar a otra en Internet. Lo que ocurre cuando tu indicas una URL en tu navegador es que tu ordenador hace una solicitud DNS (Domain Name System) a un ordenador especialmente habilitado para ello, y este le retorna la IP (esto puede ser un poco más complejo: Si ese ordenador no conoce la dirección que le solicitas, se la pedirá a otro, etc.). Es, en realidad, es la IP lo que usa tu ordenador para localizar esa máquina en Internet.
Como registrar un nombre de dominio cuesta dinero, hay personas que prefieren indicar directamente la IP de sus máquinas, y así ahorrarse ese gasto.
Todos los ordenadores de Internet tienen una IP. Pero algunos no tienen nombre de dominio. Lo que no puede ocurrir es el caso contrario, que tenga nombre de dominio pero no tenga IP. Ese ordenador sería inalcanzable.
A veces puedes encontrarte con que, detrás del nombre del recurso, te encuentres una cadena con signos &= intercalados (algo parecido a host.com/recurso.html&nombre=dato). Eso es debido a que la dirección a la que te diriges no es realmente una página web, si no que se trata del resultado de la ejecución de un programa al que se le pasan esos parámetros. Puedes consultar algo más a este respecto en los capítulos 10 (Formularios, primeros pasos) y 11 (Más formularios) del curso de HTML. y
También puedes encontrarte algo parecido a lo anterior, pero usando el signo almohadilla # (Por ejemplo, algo así como host.com/recurso.html#nombre). Estp es un indicador que señala a un punto concreto dentro de una página web. Puedes ver esto más detalladamente en el capítulo 3 (Linkando con el Cosmos) del curso de HTML.
Antes hemos visto que cada protocolo tiene un puerto asignado por defecto, y que es ahí donde tu navegador irá a buscar el recurso solicitado. Pero, a veces, ese protocolo usa otro puerto distinto. ¿Cómo indicamos en la URL qué puerto debe usar? Pues poniendo, justo detrás del dominio (antes de indicar el directorio, evidentemente), el signo : seguido del número de puerto del sigueinte modo: http://host.com:1250/directorio/archivo (con este ejemplo, le estaríamos diciendo al programa que el protocolo HTTP, en lugar de correr en el puerto 80 como suele hacer, se encuentra en el puerto 1250).
Algunos protocolos, como el FTP, necesitan usualmente un nombre y una clave para ser usados. En estos casos, se anteponen a la URL separados el uno del otro por el símbolo : (dos puntos), y separados de la URL por el signo @ (arroba) de este modo: http://nombre:clave@host.com/recurso.html

No hay comentarios:

Publicar un comentario