David Roxbee Cox, matemático y estadístico, nació el 15 de julio de 1924 en Birmingham, Inglaterra, y falleció el 18 de enero de 2022, a los 97 años. Está considerado como uno de los grandes estadísticos del siglo XX. Revolucionó la estadística con sus numerosas aportaciones, que hoy en día se utilizan de forma rutinaria en multitud de disciplinas, como la economía, la agricultura, las ciencias de la edificación y, particularmente, en la medicina. Realizó sus primeros estudios en el Handsworth Grammar School y en el St. John's College de Cambridge. En su fructífera y larga carrera, trabajó como estadístico para el Royal Aircraft Establishment, durante la Segunda Guerra Mundial, y la Wool Industries Research Association. Posteriormente, en los años 50, fue profesor en el laboratorio de estadística de la Universidad de Cambridge y profesor invitado en la Universidad de Carolina. Además, fue profesor en el Imperial College de Londres y en el Nuffield College, en la Universidad de Oxford, donde se jubiló en 1994, y siguió trabajando hasta su fallecimiento. Fue editor de la revista Biometrika durante 25 años (1966-1991)1-4.
Las contribuciones de Sir David Cox han sido numerosas y muy relevantes, tanto en el campo de la estadística teórica como en el de la estadística práctica y la probabilidad. Sus trabajos han ayudado a comprender mejor las bases de la inferencia estadística y a interpretar mejor los resultados estadísticos.
Dentro del campo teórico, caben destacar sus aportaciones al estudio de la verosimilitud, eje central en la actualidad de la regresión logística y los estudios de supervivencia. Sus aportaciones en el campo de la inferencia estadística figuran en su artículo On some principles of statistical inference6, donde discute los principios de la inferencia estadística, mostrándola mejor y más coherentemente.
En 1958, formula las bases teóricas por primera vez de la regresión logística (RL), en su trabajo The Regression Analysis of Binary Sequences7. Posteriormente, en la década de los 70, Cornfield, Gordon y Smith8, en un trabajo sobre el riesgo de padecer una enfermedad coronaria, son los primeros en publicar una aplicación práctica importante que, en la década de los 80, se popularizó gracias a la llegada de la computación de datos que hacía más fácil su cálculo. Es curioso que en la literatura no se mencione a Cox como el pionero de esta técnica. Hasta ese momento, solo era posible realizar modelos explicativos de regresión con variables dependientes continuas mediante regresión lineal9. Esta contribución es de vital importancia, ya que ofrece un modelo explicativo o de asociación cuando la variable dependiente es binaria, aportando un modelo matemático para predecir las probabilidades de ocurrencia del suceso, en función del valor que toman las variables independientes10. La RL es, hoy en día, una de las técnicas estadísticas más utilizadas en epidemiología y en las ciencias de la salud en general, gracias a su versatilidad de los análisis y su robustez, siendo cada vez más las revistas médicas que la emplean. Una prueba de ello es que, en los últimos 30 años, la RL está referenciada en más de 1000 artículos del American Journal of Epidemiology y en más de 400 del New England Journal of Medicine.
Su desarrollo ha sido fundamental para conocer las probabilidades de ocurrencia de enfermedades respecto a una serie de factores de riesgo y en el análisis de los diseños epidemiológicos, predominantemente de casos y controles, pero, en general, de todos los que requieren controlar las variables que pudieran alterar el resultado.
La RL tiene un papel fundamental en el desarrollo de las curvas ROC, donde es posible conocer, en una prueba diagnóstica cuantitativa (p.ej.: calprotectina fecal), el mejor valor o punto de corte que predice la presencia o no de enfermedad (p.ej.: enfermedad inflamatoria intestinal).
Pero la mayor contribución de David Cox es, sin duda, su trabajo sobre el análisis de supervivencia. En 1972, en su artículo Regression models and life-tables (with discussion)11 describe por primera vez el modelo de riesgos proporcionales, también conocido como "regresión de Cox (RC)", en su honor, que se ha convertido en el modelo central en el análisis de supervivencia y ha sido citado más de 50 000 veces, aunque, curiosamente, en palabras de su autor: "sin duda, leído con bastante menos frecuencia".
En 2014, la revista Nature lo situó en el puesto 16.º de su ranking de 100 de artículos científicos de todas las áreas y todos los tiempos. La contribución de este artículo también fue reconocida en 2016, con la concesión a su autor del primer Premio Internacional de Estadística. Cox, ya en sus primeros estudios, cuando trabajaba para la industria textil, tomó conciencia de que la resistencia y la vida de los materiales eran unas cuestiones importantes. Pero no fue hasta finales de los 60, según el propio Cox reconoce, cuando varios investigadores de los EE. UU. y del Reino Unido le comentaron que tenían ciertos datos de tiempos de supervivencia de las personas bajo varios tratamientos y otros datos de pacientes, pero que no sabían cómo analizarlos. Según contaba el propio Cox: "La proporción de mi vida que pasé trabajando en el modelo de riesgos proporcionales es, de hecho, muy pequeña. Tenía una idea de cómo resolverlo, pero no pude completar el argumento y me llevó cuatro años concluirlo"11. La RC es un paso de gigante, ya que, hasta ese momento, solo se tenían modelos “estáticos”, fijos en el tiempo, donde la variable dependiente dicotómica se relacionaba con variables independientes como la RL. La RC añade un valor dinámico cambiante, el tiempo durante el cual ha sucedido el evento, dando lugar a una función de riesgo o supervivencia entre la(s) variable(s) independiente(s) y la dependiente. Soluciona el problema de estudiar la relación entre la aparición de un suceso determinado (muerte, recidiva de un tumor, recidiva de una enfermedad, fracaso de un trasplante, diagnóstico de hipertensión, etc.) y una o varias variables explicativas o independientes. Su planteamiento teórico y ejemplo práctico excede a este editorial, pero será expuesto en breve en la serie de estadística que estamos realizando en la sección de “Fundamentos de Medicina Basada en la Evidencia” de esta misma revista. La RC es, actualmente, una herramienta fundamental para modelizar la distribución estadística de factores causales y se utiliza ampliamente en otras muchas áreas que no son la salud, como la economía, los ensayos de productos industriales, la sociología, etc.
En los últimos años, Cox realizó aportaciones en el desarrollo matemático de la epidemiología del SIDA12, en los modelos matemáticos de epidemiología para la tuberculosis bovina13, y en el estudio y la aplicación de los Big Data, su precisión, errores y coeficientes de regresión14.
En resumen, estamos ante un genio matemático que con sus trabajos ha ayudado, de forma inequívoca, al avance de la medicina en los 50 últimos años, al conocimiento de las relaciones de los factores de riesgo con el modo de enfermar, y al tratamiento y la supervivencia de las enfermedades. Sin duda, la comunidad científica tiene una deuda eterna con este hombre. Reconozcámoslo, siguiendo sus propias palabras: “(…) lo que realmente valoro no es el premio, sino el reconocimiento de amigos y colegas”.
Ortega Paez, E. Sir David Cox. Un genio de la estadística a quien la medicina le debe mucho. Evid Pediatr. 2022;18:13.