Analítica de Personas · Semestre otoño 2026 · Semana 10 · Prof. René Gempp
La primera distinción que necesitas dominar es que diversidad e inclusión no son sinónimos. La diversidad es una propiedad composicional del grupo: describe quiénes están. Es objetiva, medible con datos de RRHH. La inclusión es una propiedad experiencial del individuo: describe cómo se sienten quienes están. Es subjetiva, medible solo con encuestas. Una organización puede ser diversa sin ser inclusiva ("te contratamos pero no te escuchamos") o inclusiva sin ser diversa. Roberson (2006) documentó esta separación conceptual en un análisis de contenido de la literatura organizacional.
Este apunte cubre la parte objetiva: la medición de la diversidad. El Apunte 26 cubre la parte subjetiva: la medición de la inclusión.
El artículo de Harrison y Klein (2007) en Academy of Management Review es la referencia obligada. Su argumento: la investigación ha producido resultados contradictorios porque los investigadores usan la palabra "diversidad" para referirse a constructos distintos. Proponen tres tipos, cada uno con su propia lógica, sus propias medidas y sus propios efectos esperados:
| Tipo | Significado | Ejemplo | Distribución máxima | Índices | Efecto esperado |
|---|---|---|---|---|---|
| Separación | Diferencias laterales en posición u opinión | Actitudes hacia el cambio, satisfacción | Bimodal (mitad en cada extremo) | SD, MDE | Conflicto, baja cohesión |
| Variedad | Diferencias en categoría, tipo o conocimiento | Género, departamento, formación | Uniforme (cada uno en categoría distinta) | Blau, Teachman | Creatividad, mejores decisiones |
| Disparidad | Diferencias verticales en recursos/estatus | Ingreso, poder, nivel jerárquico | Hiperconcentrada (uno tiene todo) | CV, Gini | Competencia, resentimiento |
El índice de Blau es la medida más utilizada para cuantificar diversidad como variedad en ciencias sociales:
donde $p_i$ es la proporción del grupo en la categoría $i$ y $k$ es el número total de categorías.
# Función para calcular el índice de Blau
blau <- function(x) {
p <- table(x) / length(x)
1 - sum(p^2)
}
# Ejemplo: diversidad de género por departamento
activos |>
group_by(departamento) |>
summarise(blau_genero = blau(genero))
Un departamento con 60 hombres y 40 mujeres (k = 2):
$B = 1 - (0.60^2 + 0.40^2) = 1 - (0.36 + 0.16) = 1 - 0.52 = 0.48$
Muy cercano al máximo (0.50). Si fuera 90/10: $B = 1 - (0.81 + 0.01) = 0.18$. Mucho menos diverso.
# Función para calcular Teachman
teachman <- function(x) {
p <- table(x) / length(x)
p <- p[p > 0] # evitar log(0)
-sum(p * log(p))
}
# Normalizado (rango 0–1)
teachman_norm <- function(x) {
k <- length(unique(x))
if (k <= 1) return(0)
teachman(x) / log(k)
}
El índice de Blau depende del número de categorías: con 2 categorías, el máximo es 0,50; con 6, es 0,833. Comparar un Blau de género (máx 0,50) con un Blau de departamento (máx 0,833) sin normalizar es engañoso.
Ambos producen un rango de 0 a 1, donde 1 = distribución uniforme perfecta, independiente del número de categorías.
Es la desviación estándar dividida por la media: dispersión relativa, adimensional. Un CV de 0,45 en ingresos significa que la SD es el 45 % de la media. Permite comparar la disparidad entre variables con distintas escalas.
cv <- function(x) sd(x, na.rm = TRUE) / mean(x, na.rm = TRUE)
activos |>
group_by(nivel_jerarquico) |>
summarise(cv_ingreso = cv(ingreso_mensual))
El Gini mide la concentración de un recurso. Rango de 0 (igualdad perfecta) a 1 (concentración total). Se interpreta gráficamente con la curva de Lorenz: el Gini es la proporción del área entre la curva y la diagonal de igualdad.
library(DescTools)
# Gini de ingresos por nivel
activos |>
group_by(nivel_jerarquico) |>
summarise(gini = Gini(ingreso_mensual))
La desviación estándar ya la conoces. La novedad es su interpretación como índice de diversidad: una SD alta en satisfacción laboral dentro de un departamento no significa satisfacción baja, sino que hay posiciones polarizadas.
La media de distancias euclídeas (MDE) es más informativa cuando la distribución es multimodal:
mde <- function(x) {
x <- na.omit(x)
if (length(x) < 2) return(NA_real_)
mean(dist(x, method = "manhattan"))
}
| ¿Qué quiero medir? | Variable | Índice |
|---|---|---|
| ¿Cuántos tipos hay y cuán equilibrados? (variedad) | Categórica (género, departamento) | Blau o Teachman |
| ¿Cuán concentrados están los recursos? (disparidad) | Continua jerárquica (ingreso, estatus) | CV o Gini |
| ¿Cuán polarizado está el grupo? (separación) | Continua lateral (satisfacción) | SD o MDE |
waffleLos waffle charts son una alternativa visual al pie chart donde cada cuadro representa una persona o una unidad proporcional:
# install.packages("waffle", repos = "https://cinc.rud.is")
library(waffle)
waffle(
c("Hombre" = 78, "Mujer" = 22),
rows = 5,
colors = c("#1B2A4A", "#B85042"),
title = "Gerencia: composición de género"
)
# Combinar múltiples waffles con iron()
w1 <- waffle(c(H = 55, M = 45), rows = 5, title = "Operativo")
w2 <- waffle(c(H = 78, M = 22), rows = 5, title = "Gerencia")
iron(w1, w2)
waffle no está en CRAN principal. Si la instalación falla, puedes construir un waffle manualmente con geom_tile() en ggplot2: genera un data frame con coordenadas x/y en una grilla y usa fill para colorear.
La interseccionalidad (Crenshaw, 1989) sostiene que las categorías identitarias no operan de forma aditiva. Para analizar cruces múltiples:
# Tabla cruzada género × nivel × rango etario
activos |>
count(nivel_jerarquico, genero, rango_edad) |>
group_by(nivel_jerarquico, rango_edad) |>
mutate(pct = n / sum(n) * 100)
# Heatmap
ggplot(datos_mujer, aes(x = rango_edad, y = nivel, fill = pct)) +
geom_tile(color = "white") +
geom_text(aes(label = sprintf("%.0f%%", pct)))
La regla del 4/5 (EEOC, 1978), ya vista en la Clase 8 para reclutamiento, se aplica igual a promociones:
# Tasa de promoción por género
tasa <- datos |>
group_by(genero) |>
summarise(tasa = sum(promovido == "Sí") / n())
# Impact ratio
ir <- min(tasa$tasa) / max(tasa$tasa)
# Si IR < 0.80 → adverse impact
# Test complementario
prop.test(x = c(prom_h, prom_m), n = c(n_h, n_m))
| Error | Corrección |
|---|---|
| Usar Blau para medir disparidad salarial | El Blau mide variedad categórica. Para salarios usa CV o Gini |
| Comparar Blau de género (máx 0,50) con Blau de departamento (máx 0,83) | Normaliza antes de comparar |
| Interpretar Blau alto como "la organización es equitativa" | El Blau mide heterogeneidad, no justicia. Una composición 50/50 puede coexistir con discriminación |
| Reportar celdas interseccionales con n < 5 | Riesgo de re-identificación. Agrupa o no reportes |
| Olvidar que la SD mide separación, no nivel | Media 3,5 con SD 1,2 ≠ insatisfacción. Es polarización |