Com s'ho ha fet la 'start-up' xinesa d'IA DeepSeek per competir amb els gegants de Silicon Valley
La companyia construeix un xatbot més barat i competitiu amb menys xips d'ordinador de gamma alta que Google i OpenAI

San Francisco / TaiwanL'endemà de Nadal, una petita empresa xinesa, DeepSeek, presentava un nou sistema d'IA amb capacitats equiparables als xatbots d'avantguarda d'empreses com OpenAI i Google. Només això ja hauria estat una fita. Però l'equip que hi ha darrere del sistema, el DeepSeek-V3, va fer un pas encara més gran: els seus enginyers han explicat que només utilitzen una fracció dels xips informàtics altament especialitzats en què confien les principals empreses d'IA per entrenar els seus sistemes.
Aquests xips són al centre d'una tensa competència tecnològica entre els Estats Units i la Xina. El govern nord-americà està intentant limitar el nombre de xips potents, com els fabricats per la firma de Silicon Valley Nvidia, que es poden vendre a la Xina i altres rivals. Però el rendiment del model DeepSeek planteja ara preguntes sobre les conseqüències no desitjades de les restriccions comercials del govern dels EUA. Els controls han obligat els investigadors de la Xina a ser creatius amb una àmplia gamma d'eines que estan disponibles gratuïtament a internet.
El xatbot DeepSeek respon preguntes, resol problemes de lògica i escriu els seus propis programes informàtics amb la mateixa habilitat que qualsevol cosa que ja hi ha al mercat, segons les proves de referència que han estat utilitzant les empreses nord-americanes d'IA. I a més s'ha fet a baix cost, desafiant la idea predominant que només les empreses més grans de la indústria tecnològica, totes amb seu als EUA, podien permetre's el luxe de fabricar els sistemes d'IA més avançats. Els enginyers xinesos asseguren que només han necessitat uns 6 milions de dòlars en potència informàtica bruta per construir el nou sistema. Això és unes deu vegades menys del que el gegant tecnològic Meta va gastar per la seva darrera tecnologia d'IA.
"El nombre d'empreses que tenen 6 milions de dòlars per gastar és molt més gran que el de les que tenen 100 o 1.000 milions de dòlars", diu Chris V. Nicholson, inversor de la firma de capital risc Page One Ventures, que se centra en tecnologies d'IA. Des que OpenAI va provocar l'auge de la IA el 2022 amb el llançament de ChatGPT, molts experts i inversors havien conclòs que cap empresa podia competir amb els líders del mercat sense gastar centenars de milions de dòlars en xips especialitzats.
Les principals empreses d'IA del món entrenen els seus xatbots amb superordinadors que utilitzen fins a 16.000 xips, si no més. Els enginyers de DeepSeek, en canvi, diuen que només han necessitat uns 2.000 xips d'ordinador especialitzats de Nvidia. Les limitacions dels xips a la Xina van obligar-los a "entrenar-lo de manera més eficient perquè encara pogués ser competitiu", assegura Jeffrey Ding, professor ajudant de la Universitat George Washington especialitzat en tecnologia emergent i relacions internacionals.
A principis d'aquest mes, l'administració Biden va emetre noves regles que tenen per objectiu evitar que la Xina obtingui xips avançats d'IA a través d'altres països. Les regles es basen en diverses rondes de restriccions anteriors que impedeixen que les empreses xineses puguin comprar o fabricar xips informàtics d'avantguarda. El president Trump encara no ha indicat si mantindrà les normes o les anul·larà.
El govern dels EUA ha intentat mantenir els xips avançats fora de les mans de les empreses xineses per la preocupació que poguessin utilitzar-se amb finalitats militars. En resposta, algunes empreses de la Xina han emmagatzemat milers de fitxes, mentre que altres les van obtenir d'un pròsper mercat clandestí de contraban.
DeepSeek està dirigit per una empresa de comerç d'accions quantitativa, High Flyer. El 2021 havia canalitzat els seus beneficis en l'adquisició de milers de xips Nvidia, que va utilitzar per entrenar els seus models anteriors. L'empresa s'ha fet coneguda a la Xina per recollir talent de les millors universitats amb la promesa d'alts sous i la capacitat de seguir els temes de recerca que més interès els despertés. DeepSeek deixa que els seus enginyers se centrin per complet en la investigació.
Les principals empreses nord-americanes continuen avançant en el desenvolupament de la IA. Al desembre, OpenAI va presentar un nou sistema de "raonament" anomenat o3 que supera el rendiment de les tecnologies existents, tot i que encara no està àmpliament disponible fora de l'empresa. Però DeepSeek està demostrant que no es queda enrere. Aquest mes, va llançar un model de raonament impressionant.
Una part crucial d'aquest mercat global que canvia ràpidament és una idea antiga: el programari de codi obert. Com altres empreses, DeepSeek ha obert el seu darrer sistema d'IA, cosa que significa que ha compartit el codi subjacent amb altres empreses i investigadors. Això permet que altres puguin construir i distribuir els seus propis productes utilitzant les mateixes tecnologies.
Tot i que els empleats de les grans empreses tecnològiques xineses es limiten a col·laborar amb els seus companys, "si treballes en codi obert, treballes amb talent a tot el món", diu Yineng Zhang, enginyer de programari principal de Baseten, a San Francisco, que treballa amb el codi obert SGLang Project. Ajuda altres persones i empreses a crear productes mitjançant el sistema de DeepSeek.
L'ecosistema de codi obert per a la IA va agafar força l'any 2023 quan Meta va compartir lliurement un sistema d'IA anomenat LLama. Molts van suposar que aquesta comunitat prosperaria només si empreses com Meta, gegants tecnològics amb centres de dades massius plens de xips especialitzats, continuaven obrint les seves tecnologies. Però DeepSeek i altres han demostrat que ells també poden ampliar els poders de les tecnologies de codi obert.
"El centre de gravetat de la comunitat de codi obert s'ha traslladat a la Xina", diu Ion Stoica, professor d'informàtica a la Universitat de Califòrnia, a Berkeley. "Això podria ser un perill enorme per als EUA", perquè permet a la Xina accelerar el desenvolupament de noves tecnologies. Hores després de la seva investidura, el president Trump va rescindir una ordre executiva de l'administració Biden que amenaçava amb frenar les tecnologies de codi obert.
Stoica i els seus estudiants van construir recentment un sistema d'IA anomenat Sky-T1 que rivalitza amb el rendiment de l'últim sistema d'OpenAI, anomenat OpenAI o1, en determinades proves de referència. Només necessitaven 450 dòlars en potència informàtica. Ho van fer basant-se en dues tecnologies de codi obert publicades pel gegant tecnològic xinès Alibaba.
El seu sistema de 450 dòlars no és tan potent com la tecnologia d'OpenAI o el nou sistema de DeepSeek. I és poc probable que les tècniques que van utilitzar proporcionin sistemes que superin el rendiment de les tecnologies líders. Però el projecte va demostrar que fins i tot les operacions amb recursos minúsculs poden crear sistemes competitius.
Reuven Cohen, consultor tecnològic a Toronto, fa servir DeepSeek-V3 des de finals de desembre. Diu que és comparable als últims sistemes d'OpenAI, Google i la start-up de San Francisco Anthropic, i molt més barat d'utilitzar. "DeepSeek és una manera per a mi d'estalviar diners", diu. "Aquest és el tipus de tecnologia que algú com jo vol utilitzar".