Lo que DeepSeek nos enseña sobre lo que creíamos saber

Tabla de contenido

Hay una pregunta que me persigue desde hace años, y cada tanto algo la trae de vuelta con fuerza: ¿cuánto de lo que damos por cierto en tecnología es realmente verdad, y cuánto es simplemente algo que dejamos de cuestionar? Las últimas semanas fueron, para mí, un buen recordatorio de esa diferencia. Un modelo de inteligencia artificial salido de una empresa china relativamente desconocida bastó para que medio mundo, incluidos mercados financieros que mueven cifras inimaginables, se sacudiera en cuestión de días. Y lo que más me interesó no fue el modelo en sí —ya van a salir otros, mejores, la semana que viene o el mes que viene—, sino lo que su irrupción dejó al descubierto: la cantidad de supuestos que repetíamos como si fueran leyes físicas. Que hacía falta un presupuesto descomunal. Que el liderazgo estaba donde siempre había estado. Que más grande era, sí o sí, mejor. De eso quiero hablar acá. No del modelo, sino de nuestras certezas.

Lo que pasó, contado en pocas líneas
#

El 20 de enero, una empresa china llamada DeepSeek liberó un modelo de razonamiento al que bautizó R1. Hasta ahí, una noticia más en un campo que produce noticias todos los días. Lo que lo volvió distinto fueron dos cosas. La primera, que su desempeño se acercaba bastante al de los mejores modelos de razonamiento disponibles, esos que hasta hace poco parecían patrimonio exclusivo de un puñado de laboratorios occidentales con bolsillos profundos. La segunda, y para mí la más interesante, que lo hizo afirmando haber gastado una fracción de lo que esos laboratorios invierten, y lo publicó de forma abierta, con sus pesos disponibles para que cualquiera lo descargue, lo inspeccione y lo modifique.

La reacción fue rápida y desproporcionada en relación con cómo solemos tratar este tipo de lanzamientos. Para fin de enero, la aplicación de asistente conversacional de DeepSeek había escalado hasta lo más alto de las descargas en la tienda de Apple, trepó hasta el primer puesto de las apps más descargadas en la tienda de Apple en Estados Unidos, desplazando nada menos que a ChatGPT. Un inversor de los más ruidosos de Silicon Valley llegó a llamarlo “el momento Sputnik de la IA”, comparándolo con aquel satélite soviético de 1957 que obligó a Estados Unidos a repensar su lugar en la carrera espacial. Y el 27 de enero los mercados respondieron con una caída fuerte de las acciones de los fabricantes de chips y de varias de las empresas más expuestas a la promesa de la IA, borrando de golpe una cantidad enorme de valor bursátil.

No me interesa entrar en si la comparación con Sputnik es justa o exagerada, ni en la pelea geopolítica que se armó alrededor, ni siquiera en validar los números que DeepSeek puso sobre la mesa, varios de ellos en disputa desde el primer día. Me interesa otra cosa. Me interesa que un solo evento haya bastado para que tanta gente, de un día para el otro, empezara a dudar de cosas que venía repitiendo con total seguridad. Porque eso no dice tanto sobre DeepSeek como sobre la fragilidad de nuestras certezas.

El supuesto del presupuesto infinito
#

Durante el último par de años, una idea se instaló casi sin discusión: para jugar en la primera división de la inteligencia artificial hacían falta cifras de entrenamiento descomunales. Cientos de millones, miles de millones, infraestructura del tamaño de un país. La conversación pública estaba dominada por anuncios de inversiones gigantescas, y de tanto escucharlos terminamos asumiendo que el dinero era, lisa y llanamente, la barrera de entrada. Si no tenías ese capital, no estabas en la mesa.

DeepSeek no demostró que esa idea sea completamente falsa —entrenar modelos de frontera sigue siendo caro, y la cifra que reportaron probablemente esconde costos que no están en el titular—, pero sí metió una astilla incómoda en la certeza. Si una empresa con recursos limitados, trabajando además bajo restricciones de acceso al mejor hardware, logró acercarse tanto, entonces quizás el presupuesto no era exactamente la barrera que creíamos. Quizás parte de esa cifra astronómica era necesaria, y parte era simplemente la forma en que un grupo de actores muy bien financiados decidió resolver el problema, porque podían permitírselo.

Y acá hay algo que en tecnología vemos todo el tiempo, lejos de los modelos de IA. Cuando una solución funciona y hay plata, rara vez nos preguntamos si era la forma más eficiente de resolverla. Funciona, listo, seguimos. La eficiencia se vuelve una preocupación recién cuando aparece la restricción: cuando el presupuesto se achica, cuando la infraestructura no da más, cuando alguien de afuera hace lo mismo gastando menos y nos obliga a mirar nuestros propios números con otros ojos. La restricción, muchas veces, es la que empuja la innovación real. Lo vi en proyectos chicos que resolvieron con ingenio lo que otros equipos, con muchísimos más recursos, resolvían a fuerza de comprar más servidores.

El supuesto del liderazgo permanente
#

El segundo supuesto que tambaleó fue más sutil, pero quizás más importante: la idea de que el liderazgo tecnológico, una vez conseguido, se queda donde está. Que los que están adelante van a seguir adelante, casi por inercia. Que existe una especie de foso, un “moat”, que protege a quien llegó primero y vuelve muy difícil que alguien lo alcance.

Es una idea reconfortante si uno está adelante, y peligrosa por la misma razón. La historia de la tecnología está llena de liderazgos que parecían inamovibles y que dejaron de serlo. Empresas que dominaban un mercado y desaparecieron, no porque hicieran algo terriblemente mal, sino porque asumieron que su posición era permanente y dejaron de cuestionarse. El foso no es un accidente geográfico: hay que mantenerlo, y mantenerlo cuesta atención, humildad y la disposición a asumir que el que viene atrás puede estar resolviendo el problema de una manera que vos descartaste por comodidad.

Lo que DeepSeek puso sobre la mesa no fue tanto “China alcanzó a Occidente” —eso es un titular, y los titulares envejecen rápido— sino algo más general: la ventaja era menos sólida de lo que se asumía. Y eso aplica muchísimo más allá de la geopolítica de la IA. Aplica a cualquier organización, a cualquier producto, a cualquier equipo que crea que su posición está garantizada. La pregunta no es si tenemos una ventaja hoy, sino qué tan fácil sería para alguien construir algo equivalente, y qué estamos haciendo para que esa ventaja no se evapore mientras miramos para otro lado.

El supuesto de que más grande es mejor
#

El tercer supuesto, y el que más me interesa como persona técnica, tiene que ver con la fuerza bruta. Durante mucho tiempo la lógica dominante en IA fue, simplificando bastante, “más es más”: más datos, más parámetros, más cómputo, modelos más grandes. Y funcionó, no lo niego. Esa escala produjo avances reales. El problema es cuando una estrategia que funciona se convierte en la única estrategia que se considera, y lo que era un camino pasa a ser, sin que nadie lo decida explícitamente, el camino.

Parte de lo que llamó la atención de DeepSeek fueron las optimizaciones técnicas que reportaron para lograr más con menos: formas de reducir el cómputo necesario sin sacrificar tanto la calidad. Más allá de los detalles, que se discutirán y se replicarán o se desmentirán con el tiempo, lo relevante es el recordatorio: cuando la fuerza bruta es abundante y barata, la eficiencia deja de ser una prioridad. Y cuando deja de ser una prioridad, dejamos de buscarla. Nos volvemos perezosos, no por falta de talento, sino por exceso de recursos.

Esto resuena con algo que aprendí en muchos años de mantener sistemas en producción. La solución más grande, la más cara, la que mete más máquinas al problema, no es necesariamente la mejor. A veces lo es. Pero muchas otras veces es solo la que está al alcance de quien tiene los recursos para no pensar demasiado. La elegancia técnica, la solución que hace lo mismo gastando menos, entendiendo mejor el problema, suele venir de equipos que no podían permitirse el lujo de la fuerza bruta. La escasez agudiza el ingenio. La abundancia, con frecuencia, lo adormece.

Lo abierto cambia la conversación
#

Hay un cuarto elemento en esta historia que no quiero pasar por alto, porque para una organización tiene consecuencias muy concretas: DeepSeek liberó su modelo de forma abierta. Cualquiera puede descargarlo, ejecutarlo en su propia infraestructura, estudiarlo, adaptarlo. Eso es distinto del modelo cerrado al que accedemos a través de una interfaz o una API, donde la empresa que lo construyó mantiene el control sobre los pesos y sobre las condiciones de acceso.

No quiero idealizar lo abierto, porque también trae sus complicaciones —preguntas sobre seguridad, sobre cómo se entrenó, sobre qué se puede y qué no se puede hacer con eso, sobre la confianza que merece un componente que vamos a meter en el corazón de un sistema—. Pero sí quiero señalar lo que habilita. Cuando un modelo capaz se vuelve descargable, baja la barrera para que organizaciones más chicas, equipos con menos recursos o lugares con menos acceso a infraestructura de punta puedan construir sobre esa base en lugar de empezar de cero. Cambia quién puede participar de la conversación.

Y cambia algo más, algo que toca de lleno a cualquier responsable de tecnología: la pregunta de la dependencia. Cuando dependemos de un modelo cerrado al que accedemos por una API, dependemos también de las decisiones de quien lo controla: sus precios, sus términos, su disponibilidad, su continuidad. Un modelo abierto, que puedo correr en mi propia infraestructura, ofrece una forma distinta de dependencia, con otras ventajas y otros costos. No digo que una opción sea mejor que la otra en abstracto; digo que la irrupción de alternativas abiertas y capaces nos obliga a tomar esa decisión con conciencia, en lugar de asumir que el único camino es atarse a un proveedor y rezar para que no cambie las reglas.

La trampa de reaccionar al titular
#

Ahora bien, hay una reacción que me parece tan equivocada como la certeza ciega que critiqué hasta acá, y es la reacción opuesta: el pánico. En estas semanas vi de todo. Gente declarando el fin del liderazgo occidental en IA. Gente diciendo que había que tirar a la basura toda la estrategia de inversión en infraestructura. Gente afirmando que las restricciones de hardware ya no servían para nada. Y gente, también, asegurando que todo era un truco, que las cifras eran mentira, que no había que prestarle atención.

Esa oscilación entre el deslumbramiento y el desprecio es, en sí misma, otra forma de no pensar. Reaccionar al titular —para celebrarlo o para descartarlo— nos ahorra el trabajo más difícil, que es mirar con calma qué cambió de verdad y qué no. Lo que un evento como este merece no es una conclusión apresurada, sino una revisión honesta de nuestros supuestos. ¿Era el presupuesto la barrera que creíamos? Tal vez no del todo. ¿Está el liderazgo tan garantizado como asumíamos? Claramente no. ¿Es la fuerza bruta el único camino? Parece que no. Pero de ahí a saltar a “todo cambió” o “no cambió nada” hay un abismo, y ese abismo se cruza pensando, no reaccionando.

Esto vale para la IA, pero vale para casi todo lo que llega como novedad disruptiva. La madurez técnica no está en abrazar cada anuncio ni en rechazarlo por reflejo. Está en la capacidad de sostener la incomodidad de no tener una opinión definitiva hasta haber entendido lo suficiente. Y esa incomodidad, en un mundo que premia la reacción inmediata, es cada vez más difícil de sostener.

Lo que esto significa para una organización real
#

Bajemos esto a tierra, porque toda esta reflexión corre el riesgo de quedar en lo abstracto. ¿Qué hace alguien que lidera tecnología en una empresa cuando pasa algo así? Lo primero, creo, es resistir la tentación de actuar de inmediato. No hay que salir corriendo a cambiar de proveedor porque apareció un modelo nuevo, ni a reescribir la estrategia porque un inversor habló de Sputnik en una red social. La gran mayoría de las decisiones que tomamos no deberían depender de qué modelo está de moda esta semana.

Lo segundo, y más valioso, es usar el evento como una excusa para revisar los propios supuestos. Si estábamos asumiendo que cierto proveedor era insustituible, conviene preguntarse qué tan cierto es eso hoy. Si dábamos por hecho que cierta capacidad solo estaba al alcance de los grandes, vale la pena verificar si eso sigue siendo así. Si elegimos una solución grande y costosa sin evaluar alternativas más eficientes, quizás sea momento de mirar de nuevo. El valor de un evento como DeepSeek, para una organización, no está en lo que hace DeepSeek, sino en las preguntas que nos obliga a hacernos sobre nuestras propias decisiones.

Y lo tercero, que es casi una postura ante la tecnología en general: cultivar la duda sana. No la duda paralizante, la que impide decidir, sino la que mantiene viva la pregunta. La que nos hace revisar cada tanto si lo que creemos saber sigue siendo verdad o si se convirtió, sin que nos diéramos cuenta, en un supuesto que dejamos de cuestionar. Las organizaciones que mejor se adaptan no son las que tienen más certezas, sino las que tienen mejores preguntas y la humildad de hacérselas aunque las respuestas resulten incómodas.

La ironía de la restricción
#

Hay un detalle en esta historia que merece una pausa, porque es profundamente contraintuitivo. Buena parte del contexto en el que apareció DeepSeek está marcado por las restricciones que Estados Unidos impuso sobre la exportación de los chips más avanzados, pensadas justamente para frenar el desarrollo de la IA en China. La lógica detrás de esas restricciones era simple: si limitamos el acceso al mejor hardware, limitamos la capacidad de competir. Y sin embargo, lo que muchos leyeron en este episodio fue casi lo opuesto. La restricción de acceso al hardware de punta pudo haber sido, paradójicamente, uno de los motores de la eficiencia.

No quiero afirmar esto como una certeza, porque caería en el mismo error que vengo criticando. Es una hipótesis, y habrá que ver cómo se sostiene con el tiempo. Pero la idea me resulta fascinante porque la vi funcionar en escalas mucho más chicas, una y otra vez, a lo largo de mi carrera. Cuando un equipo tiene acceso ilimitado a recursos, rara vez optimiza. ¿Para qué, si siempre puede sumar otra máquina, otro servicio, otra licencia? La optimización aparece cuando el recurso escasea. El programador que tiene que hacer que algo corra en un dispositivo modesto piensa la solución de otra manera que el que asume memoria y cómputo infinitos. La restricción no es solo un obstáculo: a veces es el incentivo que faltaba para buscar la solución elegante en lugar de la solución cara.

Esto debería darnos que pensar sobre cómo diseñamos nuestros propios entornos de trabajo. No estoy proponiendo trabajar con las manos atadas ni celebrar la precariedad, que sería absurdo. Pero sí sospecho que la abundancia de recursos, cuando no viene acompañada de la disciplina de cuestionarse si los estamos usando bien, tiende a producir soluciones perezosas. El equipo que nunca tuvo que preocuparse por el costo de su infraestructura probablemente esté gastando de más sin saberlo. El que nunca tuvo que pelear con un presupuesto ajustado quizás nunca aprendió a distinguir lo necesario de lo cómodo. La restricción, bien entendida, es una maestra incómoda pero efectiva.

El liderazgo técnico frente a las modas
#

Quiero detenerme en algo que me toca de cerca, porque tiene que ver con el rol de quien conduce equipos de tecnología. Cuando aparece un evento como este, con toda su carga mediática, una de las cosas más difíciles de gestionar no es la tecnología en sí, sino la ansiedad que genera alrededor. De golpe llegan preguntas de todos lados: ¿no deberíamos estar usando esto? ¿no nos estamos quedando atrás? ¿por qué seguimos con el proveedor de siempre si apareció algo más barato? Son preguntas legítimas, y descartarlas de plano sería un error. Pero responderlas apresuradamente, dejándose llevar por el ruido, es un error todavía peor.

Parte del trabajo de liderar tecnología es, justamente, ser una especie de amortiguador entre el ruido del afuera y las decisiones del adentro. No para frenar la innovación ni para resistirse al cambio por comodidad, sino para asegurarse de que las decisiones se tomen por las razones correctas y no por la urgencia que impone un titular. Cambiar de tecnología tiene un costo real: migración, aprendizaje, riesgo, deuda nueva. Ese costo se justifica cuando hay un beneficio claro, no cuando lo único que cambió es qué nombre está de moda esta semana. Una de las cosas más valiosas que puede hacer alguien en esa posición es ayudar al equipo a distinguir entre lo que es urgente y lo que solo parece urgente porque está en todas las conversaciones.

Y hay una dimensión más, que es la del aprendizaje. Un evento como DeepSeek es una oportunidad pedagógica enorme, mucho más que una amenaza. Es el momento ideal para sentarse con el equipo y revisar juntos los supuestos sobre los que venimos trabajando, para preguntarse en voz alta qué damos por cierto y por qué, para mirar la propia arquitectura, los propios costos, las propias dependencias con ojos frescos. No para cambiar todo, sino para entender mejor lo que tenemos. Las mejores conversaciones técnicas que tuve en mi carrera no surgieron de implementar la última herramienta, sino de cuestionar, con honestidad y sin miedo, decisiones que ya habíamos tomado. Y los eventos disruptivos, cuando uno los usa bien, son la excusa perfecta para esas conversaciones.

La velocidad del campo y lo que de verdad perdura
#

Hay algo más que este episodio deja en claro, y es la velocidad a la que se mueve todo esto. Cuando escribo estas líneas, R1 es la novedad. Pero sería ingenuo pensar que lo seguirá siendo por mucho tiempo. Los laboratorios que se sintieron desafiados ya están trabajando en sus respuestas, y es probable que en las próximas semanas o meses aparezcan modelos que dejen a este episodio como una nota al pie. Esa es la naturaleza del campo: lo que hoy parece un terremoto, en unos meses es historia conocida.

Y justamente por eso me parece un error escribir sobre el modelo en sí. El modelo va a envejecer. Lo que no envejece tan rápido son las preguntas que dejó al descubierto. Dentro de un año, cuando R1 sea apenas un recuerdo y haya cinco modelos mejores, las preguntas sobre nuestros supuestos van a seguir siendo igual de válidas. ¿Cuánto de lo que asumimos como necesario lo es realmente? ¿Cuánto de nuestra ventaja es sólida y cuánto es comodidad? ¿Estamos eligiendo nuestras soluciones por criterio o por inercia? Esas preguntas no caducan con el próximo lanzamiento.

Me parece una distinción importante para cualquiera que trabaje en tecnología y quiera no quedar atrapado en la rueda de las novedades. La rueda gira sin parar, y si uno corre detrás de cada anuncio, termina agotado y sin haber pensado nada en profundidad. El valor no está en saber primero qué modelo salió, sino en entender qué nos dice cada uno de estos sacudones sobre cómo construimos, decidimos y nos posicionamos. La novedad es el ruido. El aprendizaje sobre nuestros propios supuestos es la señal.

Cuando la certeza es el verdadero riesgo
#

Si tuviera que quedarme con una sola idea de todo esto, sería esta: en tecnología, el mayor riesgo no suele ser equivocarse, sino estar demasiado seguro. La equivocación se corrige cuando aparece la evidencia. La certeza, en cambio, nos vuelve ciegos a esa evidencia, porque cuando algo nos parece obvio dejamos de mirarlo. Y mientras dejamos de mirarlo, el mundo sigue cambiando.

DeepSeek no es importante por ser un modelo extraordinario, aunque quizás lo sea. Es importante porque, en pocos días, le recordó a una industria entera que varias de sus verdades fijas eran en realidad supuestos que nadie se había molestado en revisar. Y ese recordatorio es valioso no por DeepSeek, sino por la incomodidad sana que produce. La incomodidad de descubrir que algo que repetíamos con seguridad era apenas una costumbre.

Me quedo, entonces, con una pregunta que cada uno puede llevarse a su propio terreno, lejos de la IA y de los modelos de razonamiento. En tu trabajo, en tu equipo, en tu organización: ¿cuáles son las certezas que repetís sin cuestionar? ¿Qué supuesto estás tratando como ley cuando quizás sea solo una comodidad heredada? Porque tarde o temprano va a aparecer tu propio DeepSeek —un competidor, una tecnología, una forma distinta de hacer las cosas— que te va a obligar a revisarlo. Y la diferencia entre las organizaciones que se adaptan y las que se quedan no está en quién tiene más certezas, sino en quién es capaz de cuestionarlas antes de que la realidad lo obligue.

Fuentes consultadas
#

DeepSeek, “DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning”, repositorio del modelo publicado el 20 de enero de 2025.
Reuters, “DeepSeek sparks AI stock selloff; Nvidia posts record market-value loss”, 27 de enero de 2025.
Fortune, “Marc Andreessen warns DeepSeek is ‘AI’s Sputnik moment’”, 27 de enero de 2025.
World Economic Forum, “What is open-source AI and how could DeepSeek change the industry?”, febrero de 2025.

Lo que pasó, contado en pocas líneas#

El supuesto del presupuesto infinito#

El supuesto del liderazgo permanente#

El supuesto de que más grande es mejor#

Lo abierto cambia la conversación#

La trampa de reaccionar al titular#

Lo que esto significa para una organización real#

La ironía de la restricción#

El liderazgo técnico frente a las modas#

La velocidad del campo y lo que de verdad perdura#

Cuando la certeza es el verdadero riesgo#

Fuentes consultadas#

Relacionados