type
status
date
slug
summary
tags
category
icon
password
El histograma es un tipo de visualización que es demasiado útil para explorar nuestros datos, nos ayuda a tener una idea sobre cómo se distribuyen nuestras variables. Podemos imaginar 12 valores entre 0 y 6 y ponerlos en una línea numérica:
.png?table=block&id=2ae71603-898f-807f-ae84-f72e32c81f79&t=2ae71603-898f-807f-ae84-f72e32c81f79&width=707.9567260742188&cache=v2)
Para construir un histograma, podemos dividir la línea en bins (contenedores), lo ideal es separarlo de a 2 valores:
.png?table=block&id=2ae71603-898f-80e0-af14-f56f8f88e07a&t=2ae71603-898f-80e0-af14-f56f8f88e07a&width=707.90869140625&cache=v2)
Debemos contar cuántos data points hay en cada bin:
.png?table=block&id=2ae71603-898f-80b4-b49e-f87a40ad37ad&t=2ae71603-898f-80b4-b49e-f87a40ad37ad&width=707.9447021484375&cache=v2)
Y esto lo convertimos en barras que también nos ayudan a ver el número de data points que hay en cada bin, su tamaño es correspondiente:
.png?table=block&id=2ae71603-898f-807b-b548-cfec02b6a8fd&t=2ae71603-898f-807b-b548-cfec02b6a8fd&width=708.0048217773438&cache=v2)
Hacer histogramas manualmente para pequeños datos es útil, pero cuando trabajamos con grandes cantidades, es más difícil, lento e ineficiente. Para construir histogramas con matplotlib, empezamos importando matplotlib y el subpackage pyplot:
.png?table=block&id=2ae71603-898f-8037-a269-dcf55360ec0a&t=2ae71603-898f-8037-a269-dcf55360ec0a&width=470.96875&cache=v2)
Siempre que queramos saber qué argumentos podemos especificar, usar y modificar con los plots, podemos usar la función help():
.png?table=block&id=2ae71603-898f-80b1-a2fe-d0be3f9bfdc0&t=2ae71603-898f-80b1-a2fe-d0be3f9bfdc0&width=707.9807739257812&cache=v2)
Debemos tener la lista con los valores que vamos a graficar y luego, simplemente llamamos a plt.hist() y le pasamos la lista como un input:
.png?table=block&id=2ae71603-898f-8088-aa00-d0dcb113b276&t=2ae71603-898f-8088-aa00-d0dcb113b276&width=470.953125&cache=v2)
.png?table=block&id=2ae71603-898f-8020-884b-f506af8d66c1&t=2ae71603-898f-8020-884b-f506af8d66c1&width=470.984375&cache=v2)
Los histogramas cuentan con varias personalizaciones, las más comunes son:
- plt.title(): Añade un título al gráfico para describir los datos mostrados.
- plt.xlabel() y plt.ylabel(): Etiquetan los ejes X e Y respectivamente, explicando qué representan los datos.
- plt.grid(): Muestra cuadriculas en el eje que le pasemos.
ღ★ღ Distribución Edades de Perritos ღ★ღ
Tenemos una lista con distintas edades de unos perritos:
.png?table=block&id=2ae71603-898f-8081-9fa5-cce0e259d084&t=2ae71603-898f-8081-9fa5-cce0e259d084&width=470.953125&cache=v2)
Y creamos el histograma:
.png?table=block&id=2ae71603-898f-8075-a327-c083be016ea5&t=2ae71603-898f-8075-a327-c083be016ea5&width=470.984375&cache=v2)
Los histogramas pueden tener distintas personalizaciones, tal y como podemos observar al usar la función help(). Para este histograma usaremos:
- Bins: Divide los datos en 6 intervalos.
- Color: Es el color de relleno de las barras del histograma.
- Edgecolor: Es el color del borde.
- Grid: Muestra una cuadrícula en el eje que le indicamos, en este caso usará el eje Y.
- Linestyle: Son las líneas de la cuadricula y les da un estilo de guion discontinuo.
- Alpha: Ajusta la transparencia de las líneas de la cuadricula. Donde 0 es completamente transparente y 1 es completamente opaco.
.png?table=block&id=2ae71603-898f-8020-a47f-d59be4b0b3da&t=2ae71603-898f-8020-a47f-d59be4b0b3da&width=470.984375&cache=v2)
ღ★ღ Tamaño de Camadas de Gatitos ღ★ღ
Tenemos una lista que representa el número de gatitos por camada:
.png?table=block&id=2ae71603-898f-80af-b614-dabe1c7ef45f&t=2ae71603-898f-80af-b614-dabe1c7ef45f&width=470.953125&cache=v2)
Y creamos el histograma:
.png?table=block&id=2ae71603-898f-80fa-b010-f7ffbd0a0027&t=2ae71603-898f-80fa-b010-f7ffbd0a0027&width=707.9927978515625&cache=v2)
Este histograma cuenta con las personalizaciones:
- Bins: Divide los datos en 5 intervalos.
- Color: Usa el color morado para rellenar las barras.
- Alpha: Ajusta la opacidad de las barras en 0.8.
- Edgecolor: Usa bordes blancos para las barras.
.png?table=block&id=2ae71603-898f-8016-a3cf-f47af291c7fe&t=2ae71603-898f-8016-a3cf-f47af291c7fe&width=707.9927978515625&cache=v2)
ღ★ღ Duración de Vuelo de Mariposas ღ★ღ
Tenemos una lista que nos muestra los minutos que distintas mariposas pasan volando durante un día:
.png?table=block&id=2ae71603-898f-80b7-94f9-c851f3e5a366&t=2ae71603-898f-80b7-94f9-c851f3e5a366&width=707.9927978515625&cache=v2)
Y creamos el histograma:
.png?table=block&id=2ae71603-898f-80fd-b1ce-f4a8e6956788&t=2ae71603-898f-80fd-b1ce-f4a8e6956788&width=707.96875&cache=v2)
Este histograma cuenta con las personalizaciones:
- Bins: Divide los datos en 8 intervalos.
- Color: Usa el color naranja para rellenar las barras.
- Edgecolor: Usa bordes cafés para las barras.
- Linestyle: Cambia el estilo del borde de las barras a una línea discontinua.
- Linewidth: Hace que las líneas del borde sean más gruesas.
.png?table=block&id=2ae71603-898f-8048-a7b1-dbd02c98c8c2&t=2ae71603-898f-8048-a7b1-dbd02c98c8c2&width=707.9807739257812&cache=v2)
- Autor:ByIris
- URL:http://145.223.74.189:3000//article/Histograma
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!

