Las páginas web son documentos de texto que integran el contenido mediante etiquetas que forman un flujo de datos. El lenguaje utilizado en su composición se llama HTML (Hyper Text Markup Language, lenguaje de etiquetado de hipertexto). Utiliza un grupo relativamente reducido de etiquetas (o tags) que definen cada uno de los elementos que conforman el documento HTML.
La estructura de cualquier documento HTML se compone de dos partes principales: el encabezado (o head) y el cuerpo (o body). Ambos componentes se engloban entre el par de etiquetas <html> </html>.
El encabezado contiene metadatos que le indican al navegador con qué versión de HTML está diseñada la página, su título y las palabras claves que indexarán los motores de búsqueda, entre otros atributos. Este es el lugar donde se pueden integrar los archivos CSS que definen el diseño de la página y otros archivos que complementan al HTML brindando mayor interactividad.
En el cuerpo se alojan todos los contenidos visibles de la página. Cada elemento se integra abarcado por un par de etiquetas de apertura y de cierre. Por ejemplo, este párrafo en el documento HTML se lee así:
<p>Por ejemplo este párrafo en el documento HTML se lee así:</p>
Las etiquetas <p> y </p> indican que el contenido es un párrafo de texto y delimitan su comienzo y final.
Este es el código de una página web vacía:
<!DOCTYPE HTML>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>Documento sin título</title>
</head>
<body>
</body>
</html>
Algunas de las etiquetas usadas más frecuentemente son:
<a> Hipervínculos </a>
<img> Imágenes (algunos elementos no usan etiquetas de cierre)
<div > Capas </div>
<table> Tablas </table>
<h1> Título principal </h1>
<form> Formularios </form>