Nenhum post encontrado.

Procurar
Digite para fazer uma pesquisa ou pressione ESC para fechar
HARDWARE

“Produzo os tokens de menor custo do mundo”, afirma o CEO da NVIDIA ao destacar a abordagem full-stack para IA

Durante sua apresentação no Cadence Live 2026, o CEO da NVIDIA, Jensen Huang, defendeu que a liderança da empresa não se baseia apenas na venda de hardware potente, mas na entrega da unidade fundamental da inteligência artificial — o token — pelo menor custo do mercado. Embora reconheça que seus sistemas, como as plataformas Blackwell e a futura Vera Rubin, possuem preços de aquisição na casa dos milhões de dólares, Huang argumenta que a eficiência na geração de dados compensa o investimento inicial.

Fonte: NVIDIA

Um token funciona como o “átomo” do processamento de linguagem de IA. Segundo a NVIDIA, a velocidade e o custo de geração dessas unidades dependem de uma integração profunda entre silício e código, algo que a empresa chama de abordagem full-stack.

O ecossistema CUDA e a eficiência por Watt

O pilar dessa estratégia é o ecossistema CUDA. Com décadas de desenvolvimento de software, a NVIDIA otimizou seu hardware para que ele não apenas gere tokens por “força bruta”, mas o faça de maneira inteligente. Isso resulta em uma métrica de Custo Total de Propriedade (TCO) imbatível para grandes datacenters.

“Você precisa ser uma empresa full-stack porque ninguém vai descobrir isso por você. Somos líderes em baixo custo de tokens. Produzo os tokens de menor custo do mundo. É um sistema caro, eu reconheço. Mas quanto mais você compra, mais você economiza.” — Jensen Huang, CEO da NVIDIA.

IA Agêntica e o Custo por Token

Com a transição para a IA Agêntica — sistemas capazes de tomar decisões e agir de forma autônoma — a demanda por processamento saltou para patamares sem precedentes. A NVIDIA introduziu uma nova forma de avaliar o desempenho: o Custo por Token por Watt.

PlataformaArquiteturaFoco PrincipalVantagem de Custo
H100/H200HopperTreinamento de LLMsBase instalada sólida e confiável.
B200BlackwellInferência massivaRedução de até 25x no custo de energia.
RubinVera RubinIA AgênticaMenor custo por token/W da história.

Desafios e concorrência

Apesar do otimismo de Huang, a NVIDIA enfrenta um cenário desafiador em 2026. A escassez global de semicondutores e a corrida de concorrentes para lançar ASICs customizados pressionam o fornecimento da linha Vera Rubin. Contudo, a estratégia de dominar toda a pilha — do chip ao aplicativo final — tem garantido que a “equipe verde” permaneça como a escolha preferencial para empresas que buscam escalar infraestruturas de IA com o melhor retorno sobre o investimento.

Fonte da matéria: WCCFtech

Siga o TecLab em todas as mídias: linktr.ee/rbuass

Galindowie • 22 de abril de 2026 às 11:31 GMT-3

0 comentários





error: Conteúdo protegido!
Lendo