DeepSeek: IA chinesa barata e poderosa para todos. O que poderia dar errado?
A startup de IA revolucionou o setor ao desenvolver um modelo que custa muito menos para ser produzido – e está disponível gratuitamente para um universo de usuários
Foto: FMT/Reprodução
Via The Guardian
Nada anima mais um colunista de tecnologia do que a visão de US$ 600 bilhões sendo eliminados da capitalização de mercado de um gigante da tecnologia supervalorizado em um único dia. No entanto, na última segunda-feira, foi isso que aconteceu com a Nvidia, a principal fabricante de picaretas e pás eletrônicas para a corrida do ouro da IA. Foi a maior queda em um único dia para qualquer empresa na história, e não foi a única – as ações de empresas dos setores de semicondutores, energia e infraestrutura expostas à IA perderam coletivamente mais de US$ 1 trilhão em valor no mesmo dia.
A causa próxima desse caos foi a notícia de que uma startup chinesa de tecnologia, da qual poucos tinham ouvido falar até então, havia lançado o DeepSeek R1, um poderoso assistente de IA que era muito mais barato de treinar e operar do que os modelos dominantes dos gigantes da tecnologia dos EUA – e ainda assim era comparável em competência ao modelo de “raciocínio” o1 da OpenAI. Apenas para ilustrar a diferença: Diz-se que o R1 custou apenas US$ 5,58 milhões para ser construído, o que é uma pequena quantia em comparação com os bilhões que a OpenAI e companhia gastaram em seus modelos; e o R1 é cerca de 15 vezes mais eficiente (em termos de uso de recursos) do que qualquer coisa comparável feita pela Meta.
O aplicativo DeepSeek chegou imediatamente ao topo da loja de aplicativos da Apple, onde atraiu um grande número de usuários que claramente não se incomodaram com o fato de que os termos e condições e a política de privacidade que precisavam aceitar estavam em chinês. E isso claramente energizou o público do Vale do Silício. “O DeepSeek R1”, alardeou o capitalista de risco Marc Andreessen, um dos mais barulhentos da Califórnia, ‘é o momento Sputnik da IA’. Ele também o chamou de “uma das descobertas mais incríveis e impressionantes que já vi – e como código aberto, um profundo presente para o mundo”. Donald Trump, que não acredita em dar presentes ao mundo, descreveu o R1 como um “alerta” para as empresas de tecnologia americanas.
As ressonâncias históricas foram abundantes. Andreessen estava se referindo ao momento seminal em 1957, quando a União Soviética lançou o primeiro satélite da Terra, demonstrando assim superioridade tecnológica sobre os EUA – um choque que desencadeou a criação da Nasa e, por fim, da Internet. Outras pessoas se lembraram do advento do “computador pessoal” e do escárnio lançado sobre ele pelos então gigantes do mundo da computação, liderados pela IBM e outros fornecedores de enormes computadores centrais. De repente, as pessoas estão começando a se perguntar se o DeepSeek e seus descendentes farão com os gigantes da IA de trilhões de dólares do Google, Microsoft, OpenAI e outros o que o PC fez com a IBM e seus semelhantes. E, é claro, há os teóricos da conspiração que se perguntam se o DeepSeek é, na verdade, apenas uma manobra disruptiva inventada por Xi Jinping para desestabilizar o setor de tecnologia dos EUA. O treinamento do modelo é realmente tão barato? Podemos acreditar nos números dos relatórios técnicos publicados por seus criadores? E assim por diante.
Em retrospectiva, há quatro conclusões a serem tiradas da chegada do DeepSeek.
A primeira é que a China alcançou os principais laboratórios de IA dos EUA, apesar da suposição ocidental generalizada (e arrogante) de que os chineses não são tão bons em software quanto nós. Até mesmo um exame superficial de alguns dos detalhes técnicos do R1 e do modelo V3 que está por trás dele evidencia uma criatividade e uma engenhosidade técnica formidáveis.
Em segundo lugar, os baixos custos de treinamento e inferência do R1 turbinarão a ansiedade americana de que o surgimento de uma IA chinesa poderosa – e barata – possa derrubar a economia do setor, da mesma forma que o advento do PC transformou o mercado de computação nas décadas de 1980 e 90. O que o advento do DeepSeek indica é que essa tecnologia – como toda tecnologia digital – acabará se tornando uma mercadoria. O R1 é executado em meu laptop sem nenhuma interação com a nuvem, por exemplo, e em breve modelos como esse serão executados em nossos telefones.
Em terceiro lugar, a DeepSeek conseguiu isso apesar das ferozes proibições tecnológicas impostas pelo primeiro governo Trump e depois pelo governo Biden. O relatório técnico da empresa mostra que ela possui um cluster de 2.048 GPUs Nvidia H800 – tecnologia oficialmente proibida pelo governo dos EUA para venda à China.
E por último, mas não menos importante, o R1 parece ser um modelo genuinamente de código aberto. Ele é distribuído sob a licença permissiva do MIT, que permite que qualquer pessoa use, modifique e comercialize o modelo sem restrições. Enquanto escrevo este texto, meu palpite é que geeks de todo o mundo já estão mexendo e adaptando o R1 para suas próprias necessidades e propósitos específicos, criando aplicativos que nem mesmo os criadores do modelo poderiam ter imaginado. Não é preciso dizer que isso tem suas vantagens e desvantagens, mas está acontecendo. O gênio da IA agora está realmente fora da garrafa.