Apunte 25 — Diversidad organizacional: índices, representación e interseccionalidad

Analítica de Personas · Semestre otoño 2026 · Semana 10 · Prof. René Gempp

1. Diversidad ≠ inclusión

La primera distinción que necesitas dominar es que diversidad e inclusión no son sinónimos. La diversidad es una propiedad composicional del grupo: describe quiénes están. Es objetiva, medible con datos de RRHH. La inclusión es una propiedad experiencial del individuo: describe cómo se sienten quienes están. Es subjetiva, medible solo con encuestas. Una organización puede ser diversa sin ser inclusiva ("te contratamos pero no te escuchamos") o inclusiva sin ser diversa. Roberson (2006) documentó esta separación conceptual en un análisis de contenido de la literatura organizacional.

Este apunte cubre la parte objetiva: la medición de la diversidad. El Apunte 26 cubre la parte subjetiva: la medición de la inclusión.

2. Tres tipos de diversidad: Harrison y Klein (2007)

El artículo de Harrison y Klein (2007) en Academy of Management Review es la referencia obligada. Su argumento: la investigación ha producido resultados contradictorios porque los investigadores usan la palabra "diversidad" para referirse a constructos distintos. Proponen tres tipos, cada uno con su propia lógica, sus propias medidas y sus propios efectos esperados:

Tipo	Significado	Ejemplo	Distribución máxima	Índices	Efecto esperado
Separación	Diferencias laterales en posición u opinión	Actitudes hacia el cambio, satisfacción	Bimodal (mitad en cada extremo)	SD, MDE	Conflicto, baja cohesión
Variedad	Diferencias en categoría, tipo o conocimiento	Género, departamento, formación	Uniforme (cada uno en categoría distinta)	Blau, Teachman	Creatividad, mejores decisiones
Disparidad	Diferencias verticales en recursos/estatus	Ingreso, poder, nivel jerárquico	Hiperconcentrada (uno tiene todo)	CV, Gini	Competencia, resentimiento

La elección del índice no es neutral. Usar el índice equivocado para el tipo equivocado de diversidad produce conclusiones erróneas. El índice de Blau para medir disparidad salarial no tiene sentido (mide variedad de categorías, no concentración). El Gini para medir diversidad de género tampoco (mide concentración de un recurso, no variedad categórica). Antes de elegir un índice, decide qué tipo de diversidad te importa.

3. Variedad: el índice de Blau (1977)

El índice de Blau es la medida más utilizada para cuantificar diversidad como variedad en ciencias sociales:

$B = 1 - \sum_{i=1}^{k} p_i^2$

donde $p_i$ es la proporción del grupo en la categoría $i$ y $k$ es el número total de categorías.

Rango: de 0 (homogeneidad total) a $1 - 1/k$ (distribución uniforme).
Interpretación: probabilidad de que dos miembros seleccionados al azar pertenezcan a categorías distintas.
Para género (k = 2): máximo = 0,500 (paridad 50/50).
Equivalencia: Blau = 1 − Simpson (1949). Son el mismo índice con otro nombre.

Implementación en R

# Función para calcular el índice de Blau
blau <- function(x) {
  p <- table(x) / length(x)
  1 - sum(p^2)
}

# Ejemplo: diversidad de género por departamento
activos |>
  group_by(departamento) |>
  summarise(blau_genero = blau(genero))

Ejemplo numérico

Un departamento con 60 hombres y 40 mujeres (k = 2):

$B = 1 - (0.60^2 + 0.40^2) = 1 - (0.36 + 0.16) = 1 - 0.52 = 0.48$

Muy cercano al máximo (0.50). Si fuera 90/10: $B = 1 - (0.81 + 0.01) = 0.18$. Mucho menos diverso.

4. Variedad: el índice de entropía de Teachman (1980)

$H = -\sum_{i=1}^{k} p_i \ln(p_i)$

Rango: de 0 (homogeneidad) a $\ln(k)$ (distribución uniforme).
Diferencia con Blau: Teachman es más sensible a categorías con proporciones pequeñas. Si hay un grupo que representa el 2 % del total, Blau casi no lo detecta ($0.02^2 = 0.0004$) pero Teachman sí ($0.02 \times \ln(0.02) = -0.078$).

# Función para calcular Teachman
teachman <- function(x) {
  p <- table(x) / length(x)
  p <- p[p > 0]  # evitar log(0)
  -sum(p * log(p))
}

# Normalizado (rango 0–1)
teachman_norm <- function(x) {
  k <- length(unique(x))
  if (k <= 1) return(0)
  teachman(x) / log(k)
}

¿Cuándo usar Teachman en vez de Blau? Si te importa detectar la presencia de minorías pequeñas (e.g., un programa de inclusión que logró atraer al primer empleado de un grupo subrepresentado), Teachman es más sensible. Para reportes ejecutivos donde la audiencia es no técnica, Blau es más intuitivo.

5. Normalizar los índices de variedad

El índice de Blau depende del número de categorías: con 2 categorías, el máximo es 0,50; con 6, es 0,833. Comparar un Blau de género (máx 0,50) con un Blau de departamento (máx 0,833) sin normalizar es engañoso.

$B_{\text{norm}} = \frac{B}{1 - 1/k}$ $H_{\text{norm}} = \frac{H}{\ln(k)}$

Ambos producen un rango de 0 a 1, donde 1 = distribución uniforme perfecta, independiente del número de categorías.

6. Disparidad: el coeficiente de variación (CV)

$CV = \frac{SD}{\bar{x}}$

Es la desviación estándar dividida por la media: dispersión relativa, adimensional. Un CV de 0,45 en ingresos significa que la SD es el 45 % de la media. Permite comparar la disparidad entre variables con distintas escalas.

cv <- function(x) sd(x, na.rm = TRUE) / mean(x, na.rm = TRUE)

activos |>
  group_by(nivel_jerarquico) |>
  summarise(cv_ingreso = cv(ingreso_mensual))

7. Disparidad: el coeficiente de Gini (1912)

El Gini mide la concentración de un recurso. Rango de 0 (igualdad perfecta) a 1 (concentración total). Se interpreta gráficamente con la curva de Lorenz: el Gini es la proporción del área entre la curva y la diagonal de igualdad.

library(DescTools)

# Gini de ingresos por nivel
activos |>
  group_by(nivel_jerarquico) |>
  summarise(gini = Gini(ingreso_mensual))

Conexión con la Clase 5. En la auditoría salarial mediste la brecha entre grupos (hombres vs. mujeres). El Gini mide la desigualdad dentro de cada grupo. Un Gini alto en Gerencia indica que los pocos gerentes tienen salarios muy distintos entre sí.

8. Separación: SD y media de distancias euclídeas

La desviación estándar ya la conoces. La novedad es su interpretación como índice de diversidad: una SD alta en satisfacción laboral dentro de un departamento no significa satisfacción baja, sino que hay posiciones polarizadas.

La media de distancias euclídeas (MDE) es más informativa cuando la distribución es multimodal:

mde <- function(x) {
  x <- na.omit(x)
  if (length(x) < 2) return(NA_real_)
  mean(dist(x, method = "manhattan"))
}

9. Resumen: ¿qué índice para qué pregunta?

¿Qué quiero medir?	Variable	Índice
¿Cuántos tipos hay y cuán equilibrados? (variedad)	Categórica (género, departamento)	Blau o Teachman
¿Cuán concentrados están los recursos? (disparidad)	Continua jerárquica (ingreso, estatus)	CV o Gini
¿Cuán polarizado está el grupo? (separación)	Continua lateral (satisfacción)	SD o MDE

10. Waffle charts con el paquete `waffle`

Los waffle charts son una alternativa visual al pie chart donde cada cuadro representa una persona o una unidad proporcional:

# install.packages("waffle", repos = "https://cinc.rud.is")
library(waffle)

waffle(
  c("Hombre" = 78, "Mujer" = 22),
  rows = 5,
  colors = c("#1B2A4A", "#B85042"),
  title = "Gerencia: composición de género"
)

# Combinar múltiples waffles con iron()
w1 <- waffle(c(H = 55, M = 45), rows = 5, title = "Operativo")
w2 <- waffle(c(H = 78, M = 22), rows = 5, title = "Gerencia")
iron(w1, w2)

Si hay problemas de instalación. El paquete waffle no está en CRAN principal. Si la instalación falla, puedes construir un waffle manualmente con geom_tile() en ggplot2: genera un data frame con coordenadas x/y en una grilla y usa fill para colorear.

11. Análisis interseccional

La interseccionalidad (Crenshaw, 1989) sostiene que las categorías identitarias no operan de forma aditiva. Para analizar cruces múltiples:

# Tabla cruzada género × nivel × rango etario
activos |>
  count(nivel_jerarquico, genero, rango_edad) |>
  group_by(nivel_jerarquico, rango_edad) |>
  mutate(pct = n / sum(n) * 100)

# Heatmap
ggplot(datos_mujer, aes(x = rango_edad, y = nivel, fill = pct)) +
  geom_tile(color = "white") +
  geom_text(aes(label = sprintf("%.0f%%", pct)))

Tamaños mínimos de celda. Si un cruce interseccional produce una celda con n < 5, no la reportes. Con 3 mujeres gerentes en Soporte Técnico, decir "el 33 % se siente poco incluida" identifica a una persona. Es una regla ética, no estadística.

12. Adverse impact en promociones

La regla del 4/5 (EEOC, 1978), ya vista en la Clase 8 para reclutamiento, se aplica igual a promociones:

# Tasa de promoción por género
tasa <- datos |>
  group_by(genero) |>
  summarise(tasa = sum(promovido == "Sí") / n())

# Impact ratio
ir <- min(tasa$tasa) / max(tasa$tasa)
# Si IR < 0.80 → adverse impact

# Test complementario
prop.test(x = c(prom_h, prom_m), n = c(n_h, n_m))

13. Errores frecuentes

Error	Corrección
Usar Blau para medir disparidad salarial	El Blau mide variedad categórica. Para salarios usa CV o Gini
Comparar Blau de género (máx 0,50) con Blau de departamento (máx 0,83)	Normaliza antes de comparar
Interpretar Blau alto como "la organización es equitativa"	El Blau mide heterogeneidad, no justicia. Una composición 50/50 puede coexistir con discriminación
Reportar celdas interseccionales con n < 5	Riesgo de re-identificación. Agrupa o no reportes
Olvidar que la SD mide separación, no nivel	Media 3,5 con SD 1,2 ≠ insatisfacción. Es polarización

Referencias

Blau, P. M. (1977). Inequality and heterogeneity. Free Press.
Crenshaw, K. (1989). Demarginalizing the intersection of race and sex. University of Chicago Legal Forum, 1989(1), 139–167.
Eagly, A. H., & Carli, L. L. (2007). Women and the labyrinth of leadership. Harvard Business Review, 85(9), 62–71.
EEOC (1978). Uniform guidelines on employee selection procedures. 29 C.F.R. Part 1607.
Harrison, D. A., & Klein, K. J. (2007). What's the difference? Diversity constructs as separation, variety, or disparity in organizations. Academy of Management Review, 32(4), 1199–1228.
Roberson, Q. M. (2006). Disentangling the meanings of diversity and inclusion in organizations. Group & Organization Management, 31(2), 212–236.
Simpson, E. H. (1949). Measurement of diversity. Nature, 163, 688.
Solanas, A., Selvam, R. M., Navarro, J., & Leiva, D. (2012). Some common indices of group diversity: Upper boundaries. Psychological Reports, 111(3), 777–796.
Teachman, J. D. (1980). Analysis of population diversity. Sociological Methods & Research, 8(3), 341–362.

Apunte 25 — Diversidad organizacional: índices, representación e interseccionalidad

1. Diversidad ≠ inclusión

2. Tres tipos de diversidad: Harrison y Klein (2007)

3. Variedad: el índice de Blau (1977)

Implementación en R

Ejemplo numérico

4. Variedad: el índice de entropía de Teachman (1980)

5. Normalizar los índices de variedad

6. Disparidad: el coeficiente de variación (CV)

7. Disparidad: el coeficiente de Gini (1912)

8. Separación: SD y media de distancias euclídeas

9. Resumen: ¿qué índice para qué pregunta?

10. Waffle charts con el paquete waffle

11. Análisis interseccional

12. Adverse impact en promociones

13. Errores frecuentes

Referencias

10. Waffle charts con el paquete `waffle`