Este capítulo examina una premisa que estructura gran parte de la regulación contemporánea de la inteligencia artificial: que la opacidad de los sistemas de aprendizaje profundo es, para fines prácticos, irreductible. Sobre esa base, marcos normativos como la Ley de IA de la Unión Europea, cierta jurisprudencia reciente, y buena parte de la literatura jurídica han privilegiado mecanismos externos de control–documentación técnica, supervisión humana, explicaciones post-hoc. El capítulo sostiene q…
Read moreEste capítulo examina una premisa que estructura gran parte de la regulación contemporánea de la inteligencia artificial: que la opacidad de los sistemas de aprendizaje profundo es, para fines prácticos, irreductible. Sobre esa base, marcos normativos como la Ley de IA de la Unión Europea, cierta jurisprudencia reciente, y buena parte de la literatura jurídica han privilegiado mecanismos externos de control–documentación técnica, supervisión humana, explicaciones post-hoc. El capítulo sostiene que esa premisa ya no puede asumirse sin más; y que las consecuencias de asumirla son más graves de lo que suele reconocerse.
En primer lugar, argumento que las soluciones más intuitivas al problema de la opacidad fallan en el contexto del aprendizaje profundo. La revisión de código confirma la arquitectura, pero no revela las capacidades que el modelo aprendió. Las herramientas post-hoc de explicabilidad aproximan comportamientos sin poder explicativo genuino y carecen de estándares para validar sus propios hallazgos. Y las explicaciones generadas por el propio sistema son sistemáticamente infieles a su proceso causal interno: cuando un modelo confabula explicaciones plausibles pero falsas sobre su propio razonamiento, el resultado es epistemológicamente peor que la mera opacidad, porque genera confianza ilegítima y oculta exactamente los límites que la opacidad señalaría.
En segundo lugar, el capítulo muestra que avances recientes en interpretabilidad mecanicista debilitan la tesis fuerte de la opacidad total e irreductible. Distintas líneas de investigación han demostrado que ciertas representaciones internas, circuitos y sesgos pueden ser localizados, analizados e intervenidos causalmente en modelos no triviales. Esto no equivale a una auditoría completa de modelos de frontera, ni demuestra que el problema de la explicabilidad esté resuelto. Pero sí falsifica la idea de que ninguna estructura interna relevante pueda recuperarse.
A partir de ello, propongo distinguir cuatro niveles de acceso epistémico: interpretabilidad mecanicista ambiciosa, interpretabilidad causalmente validada, interpretabilidad exploratoria, y auditoría a caja negra. El criterio que separa los dos niveles intermedios–la existencia o ausencia de validación causal–no es técnico sino epistémico: colapsar esos niveles arriesga confundir a los reguladores sobre qué tipo de evidencia ofrece cada técnica. La principal barrera actual, sin embargo, ya no es puramente técnica sino institucional: aunque la caja negra puede abrirse parcialmente, el acceso a pesos, activaciones y gradientes permanece controlado por los propios proveedores. La brecha decisiva es la que separa lo técnicamente auditable de lo institucionalmente auditado.
Finalmente, el capítulo examina límites persistentes incluso cuando existe acceso de caja blanca–falsos descubrimientos, no-identificabilidad, sobredeterminación causal–y los desarrollos teóricos emergentes que comienzan a abordarlos. La conclusión no es que la regulación deba abandonar sus exigencias de explicabilidad, sino que debe reformularlas antes de que los marcos vigentes se cristalicen. Los regímenes normativos que se consolidan bajo la premisa de que los estados internos de un modelo son inaccesibles no producen solo regulación insuficiente: producen las condiciones institucionales bajo las cuales la opacidad permanece irreductible, confirmando la premisa que la fundó. Es ese equilibrio autorrealizante el que este capítulo busca interrumpir.