El informe que ha generado ese titular y causado furor es este: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
Este titular fue algo polémico hace una semana, donde, en revistas como Forbes, se le dio un giro interesante: https://www.forbes.com/sites/jaimecatmull/2025/08/22/mit-says-95-of-enterprise-ai-failsheres-what-the-5-are-doing-right/
A un titular como este:
«El 95% de la IA empresarial falla»
La manera de decirlo cambia bastante.
Porque de lo que se habla es de un PILOTO, no de un producto lanzado a producción y funcionando con usuarios reales 24/7.
De hecho, rescatando lo que dice el executive summary del propio informe del MIT:
«Despite $30–40 billion in enterprise investment into GenAI, this report uncovers a surprising result in that 95% of organizations are getting zero return. The outcomes are so starkly divided across both buyers (enterprises, mid-market, SMBs) and builders (startups, vendors, consultancies) that we call it the GenAI Divide. Just 5% of integrated AI pilots are extracting millions in value, while the vast majority remain stuck with no measurable P&L impact. This divide does not seem to be driven by model quality or regulation, but seems to be determined by approach.»
Con lo cual, hay un par de lecturas interesantes detrás de esta historia, y que se repiten en el mundo de la informática con otras tecnologías que hemos normalizado:
1. El 95% de los pilotos no vale nada, pero el 5% genera millones.
Esto no es nada nuevo; lo mismo pasa con las apps de las Stores de Android e iOS.
Al inicio de la era de las Stores, hubo una fiebre generalizada por crear apps para todo, aunque sus casos de uso fueran estúpidos. Pero la gente en sus móviles (si quieres revisa el tuyo), solo tiene un puñado de apps útiles, o que le reportan satisfacción o conexión:
WhatsApp/Telegram/Signal, TikTok, X, Instagram/Facebook, LinkedIn, YouTube, Spotify, Duolingo, Tinder, App de gestión del banco, Uber, Mapa, Navegador(es) web, algún videojuego, app de notas, y alguna app específica que tengas por tu trabajo o lo que sea.
Y ya. No necesitas más.
Con el ámbito de la IA (y enfatizo especialmente la Generativa), pasa lo mismo. Y como con la excusa de la IA Generativa se pueden hacer pilotos hasta pegando una patada a una piedra, evidentemente el porcentaje de «fallos» aumenta.
Y con ello, se da una máxima de los proyectos software de mierda que ha existido desde que este sector existe:
Bajo coste, baja aversión a riesgo, baja implicación, baja calidad, nulo resultado.
2. La ganancia de beneficios tangibles viene determinada por la aproximación.
O dicho en jerga empresarial, que haya un business case con un ROI positivo que justifique la inversión.
O dicho en lenguaje coloquial, crear algo que sea útil.
Suelo navegar en LinkedIn para informarme, y estoy bastante enfermo de las automatizaciones de herramientas tipo n8n y otros sistemas que se venden como la panacea. Son muy útiles para automatizar cadenas de tareas repetitivas y que tengan un cierto grado de variabilidad, cosa que en la época preLLM era imposible. Pero si realmente tenías a una persona para hacer (solo) ese tipo de tareas, actualmente te tienes que plantear tu modelo de negocio de base.
Ahora bien, lo bueno es que esta digitalización con IA Generativa está ayudando a que los negocios se procedimenten y documenten su trabajo. Cosa que les hubiera ayudado igualmente, pero ahora lo ven una acción necesaria para no quedarse atrás en esta ola.
¿Y esto cómo nos afecta?
Me preguntaban varios amigos en estos días:
«¿Volveremos a un invierno de la IA?»
Lo dudo. Más bien, estamos en una burbuja de la IA que va a reventar más pronto que tarde. Además de que la economía mundial está en un estado pésimo, con lo que reventar una burbuja le viene de maravilla como efecto corrector.
Lo irónico es que hasta la propia persona que ha contribuido a generar la burbuja, Sam Altman, CEO de OpenAI, y anteriormente presidente de Y Combinator, uno de los fondos de inversión de startups más importantes del mundo, lo admite:
¿Y esto en qué lugar nos deja a quienes nos dedicamos a este mundo?
Hay varios perfiles de usuario que convivimos en este campo de la IA, y su manera de aproximarse a ella es muy distinta. Lo resumo en la siguiente tabla:
Grupos de Adopción de IA
Grupo | Descripción | Educación requerida | Gobierno del dato y Privacidad | ROI de la inversión | Retos |
---|---|---|---|---|---|
Investigadores y gente puntera en modelos fundacionales | Desarrollan la base científica y técnica | Muy alta (PhD, investigación) | Muy estricto | Largo plazo | 1. Financiación sostenida para los investigadores. 2. Ya están pensando en las siguientes arquitecturas. El Transformer se les ha quedado viejo (va a hacer 10 años en breve – https://arxiv.org/abs/1706.03762), y están trabajando con World Models para evitar problemas conocidos de los LLMs. Como argumenta el Premio Turing Yann Le Cun, los LLMs son «aburridos»: https://youtu.be/YLDUYm_46n0?si=a3k5IzzVZ_NiUD_H&t=24295 |
Startups de IA puntera | Crean soluciones innovadoras tratando de aplicar la IA más puntera posible | Alta (técnica y emprendedora) | Intermedio | Alto riesgo, alto retorno | 1. Competencia feroz. 2. Falta de datos propios. 3. Deben poder llegar a un modelo de negocio económicamente viable. Queda por ver si, salvo que los modelos no sigan bajando de precio, efectivamente un usuario va a pagar 20x lo que paga actualmente para poder sostener estas empresas. Ejemplo: Cursor: https://youtu.be/cMLqa7cJ64I?si=ymBxBWOceJJRaRQi&t=247 |
Mediana-gran empresa | Co-creación de soluciones de datos, IA «clásica» e IA Generativa. En este espacio trabajamos en Galde, por cierto. | Mixta (tecnología + negocio) | Elevado y necesario para poder ejecutar la IA de manera satisfactoria | Medio-alto | 1. Integración con sistemas heredados. 2. Cambio cultural organizacional. 3. Normativa bloqueante en diferentes sectores (ejemplo, AI Act). 4. Realizar prototipos con validez técnica y económica que pasen el business case más allá del piloto. 5. Estar atentos a las últimas tendencias, en productos de datos, IA «clásica» e IA Generativa. |
Micropymes y pequeñas empresas | Automatización con IA | Media | Bajo, aunque debe haber conocimiento documentado de los procesos a automatizar | Rápido, limitado | 1. Recursos limitados. 2. Necesidad de identificar muy bien los procesos críticos de la empresa para poder apalancar la inversión correctamente. 3. Necesidad de tener cuidado con la fiabilidad de las automatizaciones y no «dejarse llevar», intentando saltarse el trabajo y verificación de profesionales (abogados, diseñadores, etc.). 4. Falta de formación en el manejo de la IA Generativa y lo que se puede esperar de ella. |
Usuarios individuales | Uso personal con herramientas gratuitas | Variable | Prácticamente nulo | Personal, no económico | 1. Privacidad de la documentación aportada, especialmente en las versiones gratuitas. 2. Necesidad de tener cuidado con la fiabilidad de resultados y no «dejarse llevar», intentando saltarse el trabajo y verificación de profesionales (abogados, diseñadores, etc.). 3. Falta de formación en el manejo de la IA Generativa y lo que se puede esperar de ella. |
Eso sí, como se puede ver, hay 2 máximas que son muy importantes para estos efectos: la educación y la privacidad.
Por ello, dejo aquí 2 vídeos de 2 personas que explican esto infinitamente mejor que yo: Andrew Ng, sobre la educación, y Meredith Whittaker, sobre la privacidad.
Más elaborada su reflexión en The Batch: https://www.deeplearning.ai/the-batch/issue-292/
Ah, y ya que estás, aprovecha para suscribirte a la newsletter de la Bennytácora en el recuadro de arriba. Seguimos en contacto.