HARDWARE

“Produzo os tokens de menor custo do mundo”, afirma o CEO da NVIDIA ao destacar a abordagem full-stack para IA

Durante sua apresentação no Cadence Live 2026, o CEO da NVIDIA, Jensen Huang, defendeu que a liderança da empresa não se baseia apenas na venda de hardware potente, mas na entrega da unidade fundamental da inteligência artificial — o token — pelo menor custo do mercado. Embora reconheça que seus sistemas, como as plataformas Blackwell e a futura Vera Rubin, possuem preços de aquisição na casa dos milhões de dólares, Huang argumenta que a eficiência na geração de dados compensa o investimento inicial.

Um token funciona como o “átomo” do processamento de linguagem de IA. Segundo a NVIDIA, a velocidade e o custo de geração dessas unidades dependem de uma integração profunda entre silício e código, algo que a empresa chama de abordagem full-stack.

O ecossistema CUDA e a eficiência por Watt

O pilar dessa estratégia é o ecossistema CUDA. Com décadas de desenvolvimento de software, a NVIDIA otimizou seu hardware para que ele não apenas gere tokens por “força bruta”, mas o faça de maneira inteligente. Isso resulta em uma métrica de Custo Total de Propriedade (TCO) imbatível para grandes datacenters.

“Você precisa ser uma empresa full-stack porque ninguém vai descobrir isso por você. Somos líderes em baixo custo de tokens. Produzo os tokens de menor custo do mundo. É um sistema caro, eu reconheço. Mas quanto mais você compra, mais você economiza.” — Jensen Huang, CEO da NVIDIA.

https://twitter.com/NVIDIAAI/status/2046635816189849905?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E2046635816189849905%7Ctwgr%5E70430410638bacb55fde234eb17fb4202b04e137%7Ctwcon%5Es1_c10&ref_url=https%3A%2F%2Fwccftech.com%2Fi-produce-the-lowest-cost-tokens-in-the-world-says-nvidia-ceo%2F

IA Agêntica e o Custo por Token

Com a transição para a IA Agêntica — sistemas capazes de tomar decisões e agir de forma autônoma — a demanda por processamento saltou para patamares sem precedentes. A NVIDIA introduziu uma nova forma de avaliar o desempenho: o Custo por Token por Watt.

Plataforma	Arquitetura	Foco Principal	Vantagem de Custo
H100/H200	Hopper	Treinamento de LLMs	Base instalada sólida e confiável.
B200	Blackwell	Inferência massiva	Redução de até 25x no custo de energia.
Rubin	Vera Rubin	IA Agêntica	Menor custo por token/W da história.

Desafios e concorrência

Apesar do otimismo de Huang, a NVIDIA enfrenta um cenário desafiador em 2026. A escassez global de semicondutores e a corrida de concorrentes para lançar ASICs customizados pressionam o fornecimento da linha Vera Rubin. Contudo, a estratégia de dominar toda a pilha — do chip ao aplicativo final — tem garantido que a “equipe verde” permaneça como a escolha preferencial para empresas que buscam escalar infraestruturas de IA com o melhor retorno sobre o investimento.

Fonte da matéria: WCCFtech

Siga o TecLab em todas as mídias: linktr.ee/rbuass

Galindowie • 22 de abril de 2026 às 11:31 GMT-3

“Produzo os tokens de menor custo do mundo”, afirma o CEO da NVIDIA ao destacar a abordagem full-stack para IA

O ecossistema CUDA e a eficiência por Watt

IA Agêntica e o Custo por Token

Desafios e concorrência

0 comentários

TecLab 2025 - Todos os direitos reservados

Inscreva-se

“Produzo os tokens de menor custo do mundo”, afirma o CEO da NVIDIA ao destacar a abordagem full-stack para IA

O ecossistema CUDA e a eficiência por Watt

IA Agêntica e o Custo por Token

Desafios e concorrência

Relacionados

0 comentários

TecLab 2025 - Todos os direitos reservados