# Relación entre tablas y manejo avanzado de los datos mediante algunas cláusulas SQL avanzadas

## INTRODUCCIÓN

Poco a poco nos acercamos al final de los temas del módulo de base de datos. Este módulo tiene como finalidad, terminar de abordar las temáticas que el lector debe saber manejar de manera optima para la manipulación de datos mediante SQL.   &#x20;

Entre los propósitos de este módulo, tenemos la unificación o composición de tablas que presentan relación entre ellas. En este punto, se hará uso de las claves foráneas que han ayudado a que se presenten dichas relaciones entre las entidades de las bases de datos y de este modo se logre extraer información en las consultas de manera más concisas, que permita tener un panorama mas amplio de los datos que se están proyectado y permitan al lector tomar decisiones sobre dicha información.

Al final del módulo se abordarán algunas sentencias avanzadas SQL que permiten realizar manipulación sobre los datos, tales como la ordenación, agrupación y el manejo de los filtros en la información que le permita al lector realizar operaciones altamente complejas sobre los datos, que se encuentran presenten en las bases de datos que tienen como propósito dar solución a problemas de la vida real.

Este módulo también se apoyará en la base de datos vista en el módulo 6 (se anexa el link para su respectiva consulta <https://github.com/devoscarmesa/base_datos_semana_7/blob/main/script_colegio_la_trinidad.sql>)

## Índices

Observemos y pensemos en la siguiente consulta:

```sql
SELECT * FROM estudiante WHERE apellido="zapata"
```

Sin ningún orden en nuestros datos, MySQL debe leer todos los registros de la tabla "estudiante" y efectuar una comparación entre el campo "apellido" y la cadena de caracteres "zapata" para encontrar alguna coincidencia (en la vida real habrá muchas coincidencias). A medida que esta base de datos sufra modificaciones, como un incremento en el número de registros, dicha consulta irá requiriendo un mayor el esfuerzo de la CPU y el uso de memoria necesaria para ejecutarse.

Si tuviéramos una guía telefónica a mano localizaríamos fácilmente a cualquiera con apellido "zapata", yendo al final de la guía, a la letra "Z". El método en sí está dado en función a como están ordenados los datos y en el conocimiento de los mismos. En otras palabras, localizamos rápidamente a "zapata" porque está ordenado por apellido y porque conocemos el abecedario.

Los índices de base de datos son muy similares. Al igual que el escritor decide crear un índice de términos y conceptos importantes de su libro, como administradores de una base de datos decidimos crear un índice respecto a una columna.

Técnicamente un **índice** se define como un **puntero** a una fila de una determinada tabla de nuestra base de datos. Un **puntero** en este contexto, no es más que una forma de referenciar que asocia el valor de una determinada columna o conjunto de columnas con las filas que contienen ese valor o valores en las columnas que componen el puntero.

Los índices mejoran el tiempo de recuperación de los datos en las consultas realizadas contra nuestra base de datos. Pero los índices no son todo ventajas, la creación de índices implica un aumento en el tiempo de ejecución sobre aquellas consultas de inserción, actualización y eliminación realizadas sobre los datos afectados por el índice (ya que tendrán que actualizarlo). Del mismo modo, los índices necesitan un espacio para almacenarse, por lo que también tienen un coste adicional en forma de espacio en disco.

La construcción de los índices es el primer paso para realizar optimizaciones en las consultas realizadas contra nuestra base de datos. Por ello, es importante conocer bien su funcionamiento y los efectos colaterales que pueden producir.

### **¿Qué tipos de índices hay en MySQL?**

En MySQL hay cinco tipos de índices:

* **PRIMARY KEY**: Este índice se ha creado para generar consultas especialmente rápidas, debe ser único y no se admite el almacenamiento de NULL.
* **KEY o INDEX**: Son usados indistintamente por MySQL, permite crear índices sobre una columna, sobre varias columnas o sobre partes de una columna.
* **UNIQUE**: Este tipo de índice no permite el almacenamiento de valores iguales.
* &#x20;**FULLTEXT**: Permiten realizar búsquedas de palabras. Sólo pueden usarse sobre columnas CHAR, VARCHAR o TEXT

### **Sintaxis** **para crear un índice MySQL**

Para crear un índice, se empleará la siguiente estructura:

```sql
«CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name ON table_name (index_col_name…) index_type;»
```

Donde:

* **index\_name**: es el nombre del índice.
* **table\_name**: es el nombre de la tabla donde se va a crear el índice.
* **index\_col\_name**: nombre de la columna (o columnas) que formarán el índice.
* **index\_type**: es el tipo del índice. Se emplea con USING \[BTREE | HASH].

Veamos el siguiente ejemplo:

```sql
CREATE UNIQUE INDEX mi_indice_unico ON mi_tabla (mi_columna) USING HASH;
```

### **Tipos de almacenamiento en los índices**

Una vez hemos visto los tipos de índices, vamos a ver los distintos tipos de estructuras que se pueden crear para almacenar los índices junto con las características de cada uno de ellas:

* **B-TREE**: este tipo de índice se usa para comparaciones del tipo =, >, <, >=, <=, BETWEEN y LIKE (siempre y cuando se utilice sobre constantes que no empiecen por %). Para realizar búsquedas empleando este tipo de índice, se empleará cualquier columna (o conjunto de columnas) que formen el prefijo del índice. Por ejemplo: si un índice está formado por las columnas \[A, B, C], se podrán realizar búsquedas sobre: \[A], \[A, B] o \[A, B, C].
* **HASH**: este tipo de índice sólo se usa para comparaciones del tipo = o <=>. Para este tipo de operaciones son muy rápidos en comparación a otro tipo de estructura. Para realizar búsquedas empleando este tipo de índice, se emplearán todas las columnas que componen el índice.

Un índice puede ser almacenado en cualquier tipo de estructura, pero, en función del uso que se le vaya a dar, puede interesar crear el índice en un tipo determinado de estructura o en otro. Por norma general, un índice siempre se creará con la estructura de B-TREE, ya que es la estructura más empleada por la mayoría de operaciones.

## Consultas multitabla

Las consultas multitabla llamadas así porque están basadas en más de una tabla de base de datos. Para este tema se tratará dos temas puntuales:

* Composición de tablas
* Unión de tablas

### **Composición de tablas**

La composición de tablas consiste en concatenar filas de una tabla con filas de otra. En este caso obtenemos una tabla con las columnas de la primera tabla unidas a las columnas de la segunda tabla, y las filas de la tabla resultante son concatenaciones de filas de la primera tabla con filas de la segunda tabla.

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB7zUXme4PAYmPfRlO%2Fimage.png?alt=media\&token=6a754369-20e5-4622-8890-c3fc13ca3a1d)

Por ejemplo, queremos listar los pedidos con el nombre del representante que ha hecho el pedido, pues los datos del pedido los tenemos en la tabla de pedidos, pero el nombre del representante está en la tabla de empleados y además queremos que aparezcan en la misma línea; en este caso necesitamos componer las dos tablas (Nota: en el ejemplo expuesto a continuación, hemos seleccionado las filas que nos interesan).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB83vT70OMkBg2s4JB%2Fimage.png?alt=media\&token=b7e1717d-fe93-499f-85de-f18dfb1435ea)

Los tipos de composición de tablas son:

* Producto cartesiano
* JOIN e INNER JOIN
* LEFT JOIN y LEFT OUTER JOIN
* RIGHT JOIN y RIGHT OUTER JOIN     &#x20;

#### **Producto cartesiano**

El producto cartesiano de dos tablas son todas las combinaciones de todas las filas de las dos tablas. Usando una sentencia **SELECT** se hace proyectando todos los atributos de ambas tablas. Los nombres de las tablas se indican en la cláusula FROM separados con comas, usemos las tablas **cliente** y **pagos** de la base de datos Empresa de Confecciones Limitada:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB8JVXJeiG0JYEtKCW%2Fimage.png?alt=media\&token=10f8d987-0510-42d6-8b4e-c789f2585791)

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB8Mfxp4Ao4th1tTJX%2Fimage.png?alt=media\&token=2349d13d-f07a-45dd-89d1-a50d6ff6bf2a)

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB8OVsawPnDGGcUzA-%2Fimage.png?alt=media\&token=8c8196cb-6efa-4ba4-b533-9f70d2271a13)

Como se ve, la salida consiste en todas las combinaciones de todas las tuplas de ambas tablas.

#### **JOIN e INNER JOIN**

El INNER JOIN es otro tipo de composición interna de tablas, permite emparejar filas de distintas tablas de forma más eficiente que con el producto cartesiano cuando una de las columnas de emparejamiento está indexada.

**INNER JOIN** selecciona todas las filas de las dos columnas siempre y cuando haya **una coincidencia entre las columnas en ambas tablas**. Es el tipo de JOIN más común.

El uso de JOIN y de INNER JOIN es el mismo, pero para algunas personas es mejor utilizar INNER JOIN, debido al uso de LEFT y RIGHT JOIN, aunque otros prefieren utilizar JOIN, ya que no necesitan agregar tanto código, ya se convierte en un aspecto de preferencias.

Veamos su sintaxis en SQL:

```sql
SELECT nombreColumna(s)
FROM tabla1
[INNER] JOIN tabla2
ON tabla1.nombreColumna=table2.nombreColumna;
```

Lo mas común es que después de las instrucciones **ON** valla una condición que indica cuales tuplas se proyectan, en caso de no colocar esta instrucción se muestra todo el producto cartesiano tal como se vio anteriormente. Es muy común que en este tipo de condiciones se coloque la llave primaria de una de las tablas y la llave foránea de la otra, aunque no es obligatorio que se haga de esta manera.

Veamos su representación con un gráfico de teoría de conjuntos:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB8xkxeEJs0glVcAQV%2Fimage.png?alt=media\&token=965eb395-d942-435e-970d-c796da7bdee1)

Realicemos un ejemplo con las tablas **cliente** y **pagos** de la base de datos Empresa de Confecciones Limitada:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB8znV1XP5HdWr3Wdl%2Fimage.png?alt=media\&token=2eace076-1bb0-430c-91a0-bcd7b502d967)

#### **LEFT JOIN**

Tipo de composición externa, que combina los valores de la primera tabla con los valores de la segunda tabla. Siempre devolverá las filas de la primera tabla, incluso aunque no cumplan la condición. A diferencia de un INNER JOIN, donde se busca una intersección respetada por ambas tablas, con LEFT JOIN damos prioridad a la tabla de la izquierda, y buscamos en la tabla derecha.

Si no existe ninguna coincidencia para alguna de las filas de la tabla de la izquierda, de igual forma todos los resultados de la primera tabla se muestran.

Veamos su representación con un gráfico de teoría de conjuntos:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB937WwrTF7O4x1mOo%2Fimage.png?alt=media\&token=b750af87-c10f-420c-8a65-50b46e4d35eb)

Veamos su sintaxis en SQL:

```sql
SELECT nombreColumna(s)
FROM tablaA
LEFT JOIN tablaB
ON tablaA.idColumna=tableB.idColumna;
```

Realicemos un ejemplo con las tablas **cliente** y **pagos** de la base de datos Empresa de Confecciones Limitada:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB9BqIDbPcUZSR3ZWc%2Fimage.png?alt=media\&token=8357ec7e-72da-4072-b0a9-52c0b1e04eae)

Note la diferencia, en el caso de INNER JOIN, la consulta retorno 273 filas, mientras con LEFT JOIN se obtuvieron 297 filas.

#### **RIGHT JOIN**

Tipo de composición externa. Es igual que LEFT JOIN pero al revés. Ahora se mantienen todas las filas de la tabla derecha (tablaB). Las filas de la tabla izquierda se mostrarán si hay una coincidencia con las de la derecha. Si existen valores en la tabla derecha pero no en la tabla izquierda, ésta se mostrará null.

Veamos su representación con un gráfico de teoría de conjuntos:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB9iLy8jIDpfA00gSI%2Fimage.png?alt=media\&token=1a46305d-efe7-4a94-8049-94674aaa82f1)

Veamos su sintaxis en SQL:

```sql
SELECT nombreColumna(s)
FROM tablaA
LEFT RIGHT tablaB
ON tablaA.idColumna=tableB.idColumna;
```

Realicemos un ejemplo con las tablas **cliente** y **pagos** de la base de datos Empresa de Confecciones Limitada:

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB9qF0yTZs_8K08ARS%2Fimage.png?alt=media\&token=5276f17e-13d5-470d-93a2-36cddded38e4)

También se puede encontrar otros tipos de JOIN, que es muy simple de implementar y entender mediante este grafico de conjuntos, que resume los ya explicados y otros que se pueden realizar en las diferentes consultas donde necesitemos usarlos para solucionar algún tipo de problemática con estas herramientas que nos ofrece el motor de base de datos.

![Gráfico tomado de https://www.dokry.com/1448. Tabla de Representación Visual de SQL Joins.](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMB9uUiFJU3k2fda5E4%2Fimage.png?alt=media\&token=87a08351-8420-451c-a754-3e4854e42af0)

### **Unión de tablas**

También es posible realizar la operación de álgebra relacional unión entre varias tablas o proyecciones de tablas.

Para hacerlo se usa la sentencia **UNION** que permite combinar varias sentencias **SELECT** para crear una única tabla de salida.

Las condiciones para que se pueda crear una unión son las mismas que vimos al estudiar el álgebra relacional: las relaciones a unir deben tener el mismo número de atributos, y además deben ser de dominios compatibles.

Veamos el siguiente ejemplo:

La Empresa de Confecciones Limitada maneja dos bodegas donde almacena productos para empresa que importan y exportan sus productos, en estas bodegas se maneja la siguiente información, que se describe en la siguiente tabla.

| **Bodega 1**                                                                                                                                                                                   | **Bodega 2**                                                                                                                                                                                          |
| ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| <p>- Identificador elemento almacenado</p><p>- Nombre de elemento almacenado</p><p>- Cantidad de elemento almacenado</p><p>- Nit Empresa que importa</p><p>- Correo de empresa importadora</p> | <p>- Identificador elemento almacenado</p><p>- Nombre de elemento almacenado</p><p>- Cantidad de elemento almacenado</p><p>- Nit Empresa exportadora</p><p>- Teléfono celular empresa exportadora</p> |

Veamos el script para darle solución a esta problemática de almacenamiento (el script se encuentra al final del script <https://github.com/devoscarmesa/base_datos_semana_7/blob/main/script_colegio_la_trinidad.sql>).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBA_rtzca7QLtnGd64%2Fimage.png?alt=media\&token=e874d922-5047-49f9-b303-a013f723695d)

De la información almacenada en las dos bodegas se requiere conocer los artículos almacenados en ambas bodegas, veamos esta consulta:

```sql
SELECT b1.IDBodega, b1.nombreArticulo, b1.fechaAlmacenamiento, b1.cantidad, 'B1' AS bodega FROM bodega_1 AS b1
UNION 
SELECT b2.IDBodega, b2.nombreArticulo, b2.fechaAlmacenamiento, b2.cantidad, 'B2' AS bodega FROM bodega_1 AS b2;
```

## Uso de la cláusula WHERE

Cuando usa la instrucción **SELECT** para consultar datos en una tabla y obtiene todas las filas de esa tabla, esto en muchas circunstancias es innecesario porque la aplicación solo puede procesar un conjunto de filas a la vez.

Para obtener las filas de la tabla que satisfacen una o más condiciones, use la cláusula **WHERE** de la siguiente manera:

```sql
SELECT
    campos_a_listar
FROM
    nombre_tabla
WHERE
    condicion_de_busqueda;
```

En la cláusula **WHERE**, especifica una condición de búsqueda para filtrar las filas devueltas por la cláusula **FROM**. La cláusula **WHERE** solo devuelve las filas que hacen que la condición de búsqueda se evalúe **TRUE**.

La condición de búsqueda es una expresión lógica o una combinación de múltiples expresiones lógicas. En SQL, una expresión lógica a menudo se denomina predicado.

Usemos la tabla **empleado** de la base de datos Empresa de Confecciones Limitada para ver algunos escenarios donde se puede ser usada la cláusula **WHERE**.

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBBM7fqZ3Lh7Moiz2Z%2Fimage.png?alt=media\&token=106179a2-aa77-48e5-8872-ad32d50d4330)

La tabla cuenta con 122 registros, veamos como el **WHERE** reduce el total de registros.

**A.**   Encontrar filas usando una igualdad simple

La siguiente declaración recupera todos los clientes con estado igual a **CA**:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido, 
    ciudad 
FROM 
    cliente
WHERE 
    estado = 'CA'
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBBWItYTAu8ErNATTQ%2Fimage.png?alt=media\&token=24f67f6d-ad67-4f6c-82e2-c383e4e97f99)

**B.**   Encontrar filas que cumplan dos condiciones

El siguiente ejemplo devuelve empleados que cumplen dos condiciones: la ciudad San Francisco y el empleado de ventas es el 1165. En este caso se debe emplear el operador lógico AND para combinar las dos condiciones, veamos:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    limiteDeCredito
FROM 
    cliente
WHERE 
    ciudad = 'San Francisco' AND numeroEmpleadoVentas = 1165
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBBfqoBiUnPJUc81Xk%2Fimage.png?alt=media\&token=4fc3d1a9-efaa-429d-87ab-8a301a57604b)

**C.**   Encontrar filas con el valor entre dos valores

La siguiente declaración devuelve los empleados que tiene el limite de crédito entre $100.000 y $300.000, veamos:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    ciudad,
    estado
FROM 
    cliente
WHERE 
    limiteDeCredito > 100000 AND limiteDeCredito < 300000
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBBordR_xI0MSAyGhf%2Fimage.png?alt=media\&token=4b234f95-7211-476b-a793-5e2d18e2733b)

**D.** Encontrar tuplas que cumplan con cualquiera de las dos condiciones

El siguiente ejemplo devuelve empleados que cumplen cualquiera de las dos condiciones: la ciudad San Francisco o el empleado de ventas es el 1165. En este caso se debe emplear el operador lógico OR, veamos:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    limiteDeCredito
FROM 
    cliente
WHERE 
    ciudad = 'San Francisco' OR numeroEmpleadoVentas = 1165
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MM99gsHZVE_Xe9xvPqP%2F-MMBBytOrovN2qK1kXrj%2Fimage.png?alt=media\&token=957f7d42-3f0f-4664-b346-f09150f6830d)

**E.**    Encontrar filas que tengan un valor en una lista de valores

El siguiente ejemplo utiliza el operador **IN** para buscar empleados cuyo país de residencia es: USA, Poland, Germany y France, veamos:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    limiteDeCredito,
    estado
FROM 
    cliente
WHERE 
    pais IN ('USA', 'Poland', 'Germany', 'France')
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBCiAcrLUwRCleEkbU%2Fimage.png?alt=media\&token=d5a20861-0c86-419f-82ab-f2477b08eea0)

**F.**    Encontrar filas cuyos valores contienen una cadena

El siguiente ejemplo utiliza el operador **LIKE** para buscar empleados cuyo nombre del cliente contiene la cadena Gifts:

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    limiteDeCredito,
    estado
FROM 
    cliente
WHERE 
    nombreCliente LIKE '%Gifts%'
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBCuIZ1ot-pf3oTypx%2Fimage.png?alt=media\&token=6a16420f-2bdb-47e7-800d-5c16f7caee61)

A continuación, se muestran algunos ejemplos que muestran diferentes operadores **LIKE** con comodines '**%**' y '**\_**':

| **Consulta con operador LIKE** | **Descripción**                                                                      |
| ------------------------------ | ------------------------------------------------------------------------------------ |
| **WHERE pais LIKE 'a%'**       | Encuentra cualquier valor que comience con "a"                                       |
| **WHERE pais LIKE '%a'**       | Encuentra cualquier valor que termine con "a"                                        |
| **WHERE pais LIKE '%or%'**     | Busca cualquier valor que tenga "o" en cualquier posición                            |
| **WHERE pais LIKE '\_r%'**     | Encuentra cualquier valor que tenga "r" en la segunda posición                       |
| **WHERE pais LIKE 'a\_%'**     | Busca cualquier valor que comience con "a" y tenga al menos 2 caracteres de longitud |
| **WHERE pais LIKE 'a\_\_%'**   | Busca cualquier valor que comience con "a" y tenga al menos 3 caracteres de longitud |
| **WHERE pais LIKE 'a%o'**      | Busca cualquier valor que comience con "a" y termine con "o"                         |

## Uso de la cláusula ORDER BY

Cuando usa la declaración **SELECT** para consultar datos de una tabla, no se garantiza el orden de las filas en el conjunto de resultados. Significa que MySQL puede devolver un conjunto de resultados con un orden de filas no especificado.

La única forma de garantizar que las filas del conjunto de resultados estén ordenadas es utilizar la cláusula **ORDER BY**. A continuación, se ilustra la sintaxis de la cláusula **ORDER BY**:

```sql
SELECT
    campos_a_seleccionar
FROM
    nombre_tabla
ORDER BY
    campo_de_ordenamiento [ASC | DESC]
```

Las columnas que aparecen en la cláusula **ORDER BY** deben corresponder a cualquiera de las columnas de la lista de seleccionada de la tabla especificada en la cláusula **FROM**.

En segundo lugar, utilice **ASC** o **DESC** para especificar si los valores de la columna especificada deben ordenarse en orden ascendente o descendente.

El **ASC** ordena el resultado del valor más bajo al valor más alto, mientras que con **DESC** se ordena del valor más alto al más bajo de acuerdo al tipo de dato.

De forma predeterminada, la cláusula **ORDER BY** utiliza **ASC** si no especifica explícitamente ninguna opción.

Por tanto, las siguientes cláusulas son equivalentes:

| ORDER BY columna1 ASC; | ORDER BY columna1; |
| ---------------------- | ------------------ |

Si desea ordenar el conjunto de resultados por varias columnas, especifique una lista de columnas separadas por comas en la cláusula **ORDER BY**, adicionalmente se le puede colocar el tipo de ordenamiento con **ASC** o **DESC**, veamos

```sql
ORDER BY
   columna1 DESC,
   columna2 ASC;
```

Tenga en cuenta que la cláusula **ORDER BY** siempre se evalúa después de la cláusula **FROM** y **SELECT**.

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBDOtyL5da1eKrPHTk%2Fimage.png?alt=media\&token=1a0eaaf2-4288-4d73-aa03-ac1f6288cb3a)

#### **Veamos algunos ejemplos**

* Ordenar la tabla de clientes por el límite de crédito, de modo ascendente.

```sql
SELECT 
    numeroCliente, 
    nombreCliente, 
    contactoApellido,
    limiteDeCredito,
    estado
FROM 
    cliente
ORDER BY limiteDeCredito 
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBDiBPUMMqB6GTyTui%2Fimage.png?alt=media\&token=4ea86c82-6643-4a82-bcff-32f22ac7973a)

* Ordenar la tabla de clientes por el límite de crédito, de modo descendente.

```sql
SELECT 
    *
FROM 
    cliente
ORDER BY limiteDeCredito DESC
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBDvlfF39ogawUtDEB%2Fimage.png?alt=media\&token=1c1857ab-0e90-4cb6-9a72-b5d05adf4d58)

* Ordenar la tabla de pedido por número de orden decentemente y luego por fecha límite de entrega ascendentemente.

```sql
SELECT 
    *
FROM 
    pedido
ORDER BY numOrden DESC, fechaLimitEntrega ASC;
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBE4JYrxe5ua2JGoJl%2Fimage.png?alt=media\&token=e957c989-6af0-4bb2-b078-512006a511db)

## Uso de la instrucción GROUP BY

La instrucción **GROUP BY** agrupa las filas que tienen los mismos valores en filas de resumen, como "encontrar el número de clientes en cada país".

La instrucción **GROUP BY** se usa a menudo con funciones agregadas (COUNT, MAX, MIN, SUM, AVG) para agrupar el conjunto de resultados por una o más columnas.

La cláusula **GROUP BY** es una cláusula opcional de la declaración **SELECT**. A continuación, se ilustra la sintaxis de la instrucción **GROUP BY**:

```sql
SELECT 
    campos_a_seleccionar
FROM
    nombre_table
WHERE
    condición
GROUP BY campo1 , campo2,...,campoN;
```

La cláusula **GROUP BY** debe aparecer después de las cláusulas **FROM** y **WHERE** y antes de las instrucciones **HAVING**, **ORDER BY** y **LIMIT**. A continuación de la instrucción **GROUP BY** hay una lista de columnas separadas por comas que desea utilizar como criterios de agrupación.

#### **Ejemplo**

Supongamos que desea agrupar los valores del **estado** de la tabla **pedido** en subgrupos, para tal fin se debe agrupar mediante dicha columna, veamos:

```sql
SELECT 
    * 
FROM 
    pedido 
GROUP BY 
    estado;
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBEUJOixwGLROgOE-y%2Fimage.png?alt=media\&token=9dd912ad-75a7-45d6-9020-da2f812f1141)

### **Funciones agregadas**

Una función agregada realiza un cálculo en varios valores y devuelve un solo valor.

Veamos las funciones agregadas de MySQL más usadas:

#### **AVG**

La función **AVG()** de MySQL es una función agregada que le permite calcular el valor promedio de un conjunto.

La función **AVG()** se usa a menudo junto con la cláusula **GROUP BY** para calcular el valor promedio para cada grupo de filas en una tabla.

Por ejemplo, para calcular el precio de compra promedio de productos para cada línea de productos, use la función **AVG()** con la cláusula **GROUP BY** con la siguiente consulta:

```sql
SELECT 
    lineaProducto, 
    AVG(precioDeCompra) AS 'Precio promedio' 
FROM 
    producto
GROUP BY 
    lineaProducto
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBEqRGzfRJzRtkhgFZ%2Fimage.png?alt=media\&token=a22d5921-626b-4d36-862e-a328a52eb297)

#### **COUNT**

La función **COUNT()** es una función agregada que devuelve el número de filas en una tabla. La función **COUNT()** le permite contar todas las filas o solo las filas que coinciden con una condición específica.

La función **COUNT(\*)** se usa a menudo con una cláusula **GROUP BY** para devolver el número de elementos en cada grupo.

Por ejemplo, esta declaración usa la función **COUNT()** con la cláusula **GROUP BY** para devolver el número de productos en cada línea de producto:

```sql
SELECT 
    lineaProducto, 
    COUNT(*) AS 'numero de Productos' 
FROM 
    producto
GROUP BY 
    lineaProducto
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBF-GgWDtuwSwtVpmr%2Fimage.png?alt=media\&token=addbca51-1625-4277-8338-db4a824209ad)

#### **SUM**

La función **SUM()** es una función agregada que le permite calcular la suma de valores en un conjunto.

La función **SUM()** se usa a menudo con la cláusula **GROUP BY** para calcular la suma de cada grupo.

Por ejemplo, puede calcular el monto total de cada pedido usando la función **SUM()** con la cláusula **GROUP BY** como se muestra en la siguiente consulta:

```sql
SELECT
    numOrden,
    SUM(cantidadOrden * precio) AS 'totalOrden'
FROM 
    detalle_pedido
GROUP BY
    numOrden
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBFBjBnTEeXD-A1PRs%2Fimage.png?alt=media\&token=90e0d7bb-514e-44ca-91b1-4edee141892a)

**MIN**

La función **MIN()** devuelve el valor mínimo en un conjunto de valores. La función **MIN()** es muy útil en algunos escenarios, como encontrar el número más pequeño, seleccionar el producto menos costoso u obtener el límite de crédito más bajo.

Como otras funciones agregadas, la función **MIN()** se usa a menudo con la cláusula **GROUP BY** para encontrar los valores mínimos para cada grupo.

Este ejemplo usa la función **MIN()** con una cláusula **GROUP BY** para obtener el producto con el precio de compra más bajo para cada línea de producto:

```sql
SELECT 
    lineaProducto,
    MIN(precioDeCompra)
FROM 
    producto
GROUP BY
    lineaProducto
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBFItS-5hJvAcTLKeJ%2Fimage.png?alt=media\&token=8f8b01e3-0d8a-4053-b6b3-e0e23f693d97)

#### **MAX**

La función **MAX()** de MySQL devuelve el valor máximo en un conjunto de valores. La función **MAX()** es útil en muchos casos, como encontrar el mayor número, el producto más caro y el mayor pago de los clientes.

Para encontrar el valor máximo para cada grupo, use la función **MAX** con la cláusula **GROUP BY**.

En el siguiente ejemplo se usa la función **MAX()** para obtener el pago más grande de cada cliente:

```sql
SELECT 
    numeroCliente,
    MAX(cantidad) AS 'pago_mas_grande_cliente'
FROM 
    pagos
GROUP BY 
    numeroCliente
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBF_rr62YKsjSL94vf%2Fimage.png?alt=media\&token=937edd22-1a36-49be-b312-3073bd4d95ae)

### **Uso de la instrucción HAVING**

La cláusula **HAVING** se usa en una declaración **SELECT** para especificar condiciones de filtro para un grupo de filas o agregados.

La cláusula **HAVING** se usa a menudo con la cláusula **GROUP BY** para filtrar grupos según una condición específica. Si **GROUP BY** se omite la cláusula **HAVING**, la cláusula se comporta como la cláusula **WHERE**.

A continuación, se ilustra la sintaxis de la cláusula **HAVING**:

```sql
SELECT 
    lista_de_campos
FROM 
    nombre_de_tabla
WHERE 
    condicion_de_busqueda
GROUP BY 
    expresion_para_agrupar
HAVING 
    condicion_de_agrupacion;
```

Veamos el siguiente ejemplo, el cual emplea la cláusula **GROUP BY** para obtener los números de pedido, el número de artículos vendidos por pedido y las ventas totales de cada uno presentes en la tabla **detalle\_pedido.** De esta consulta solo interesa los resultados donde el total de ventas sean mayor a 10000, veamos:

```sql
SELECT
    numOrden,
    SUM(cantidadOrden) AS 'cantidadItem',
    SUM(cantidadOrden * precio) AS 'total'
FROM 
    detalle_pedido
GROUP BY 
    numOrden
HAVING
    total > 10000;
```

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBC0Mxp3HLZT5GtO39%2F-MMBFoG-e6ccB7gZv9kU%2Fimage.png?alt=media\&token=7a41f2b1-d01e-43b8-8208-dd0575e4c9c4)

## **Quiero saber más …**

* <https://www.mysql.com/>
* <https://www.clever-cloud.com/en/>
* &#x20;<https://dev.mysql.com/doc/refman/8.0/en/select.html>
* <https://github.com/devoscarmesa/base_datos_semana_6>
* <https://dev.mysql.com/doc/refman/8.0/en/aggregate-functions.html>
* <https://dev.mysql.com/doc/refman/8.0/en/multiple-tables.html>
* <https://dev.mysql.com/doc/refman/8.0/en/join.html>

## Ejercicios

Para algunos de los ejercicios tenga en cuenta el siguiente modelo relacional <https://github.com/devoscarmesa/base_datos_semana_6/blob/master/Modelo_Relacional_Empresa_Confecciones_Limitada.PNG>

### Ejercicio 1

Defina tres índices para el proyecto PPI y explique cuál es la finalidad de aplicar dichos índices.

### Ejercicio 2

Haciendo uso de **INNER JOIN**, **RIGHT JOIN** y **LEFT JOIN** genere las consultas de la siguiente relación entre las tablas **empleado** y **oficina** (de dicha consulta solo se requiere conocer número del empleado, su nombre, correo, el telefono de la oficina, el código postal y la ciudad donde se encuentra la oficina). Adjunte cada consulta y explique el resultado obtenido.&#x20;

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBH6LTa0oXOwkShmE7%2Fimage.png?alt=media\&token=b990bf6a-3ec1-44b3-ae55-9418446ceedc)

### Ejercicio 3

De la tabla **detalle\_pedido** se requiere conocer la cantidad de elementos por cada orden, teniendo en cuenta, que solo interesa conocer las ordenes donde esta cantidad sea mayor a 60 (Anexe consulta y resultado).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBHD_kUB-QHZQL4r17%2Fimage.png?alt=media\&token=15424893-e83e-4d9e-a509-3ca78441f055)

### Ejercicio 4

Se requiere conocer todos los productos del pedido con número de orden 10101. De los productos solo se requiere conocer código del producto, nombre del producto, precio de compra y la cantidad que se solicitó de cada producto en el pedido (Anexe consulta y resultado).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBHLcy9Z5aeQsH0m1f%2Fimage.png?alt=media\&token=e3e2236e-ec22-49b9-b9b9-d82bc07f28f5)

### Ejercicio 5

Se requiere conocer todos los empleados que su título termine en **Rep** (Anexe consulta y resultado).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBHr7uDWPb-deUAxsy%2Fimage.png?alt=media\&token=e330a840-4787-40a9-b62c-d1fb1ca8df5d)

### Ejercicio 6

Se requiere conocer los pagos efectuados en todo el mes de abril del año 2005 (2005-04-01 y 2005-04-30). Adicionalmente se debe conocer el nombre completo (en una sola columna o campo) del cliente que efectuó dicho pago. (Anexe consulta y resultado).

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBHt_ilKVTXdu1rwax%2Fimage.png?alt=media\&token=948dffd2-c709-4d25-9bec-9ecd7a7a2e0a)

### Ejercicio 7

Se requiere consultar todas las oficinas que se encuentran almacenadas en la base de datos, ordenadas por país de manera ascendente; una vez ordenadas por país, se requiere ordenar las oficinas resultantes de cada país por ciudad de manera descendente.

![](https://1776937240-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-MKm7bZbn0YvvJUjUIMU%2F-MMBGBIruNwRFcmzUnwj%2F-MMBI7ywuZ4tTdwOG8G-%2Fimage.png?alt=media\&token=26753718-e07c-4738-a3a3-36f5eb7d80f9)