Artigo Money·Monetização·12 min de leitura

Como cobrar pelo uso de IA no Stripe: guia de billing para SaaS indie

Aprenda a precificar e cobrar automaticamente pelo consumo de tokens IA no Stripe. Setup prático para solopreneur monetizar produto com Claude, GPT ou Gemini.

Vitor Morais

Por Vitor Morais

Fundador do MochaLabz ·

Cobrar pelo uso de IA dentro do seu produto SaaS é hoje mais fácil que nunca — mas requer setup específico na infraestrutura de billing. O Stripe lançou em 2026 suporte nativo a metering e markup automático para tokens de IA, permitindo que você aplique um markup percentual sobre o custo bruto do modelo (Claude 3.5, GPT-4, Gemini) e cobre o cliente em tempo real, sem tocar uma linha de código a cada transação. Este guia te leva do conceito ao primeiro cliente pagante.

Por que cobrar por token e não por usuário

Cobrar por usuário (seat-based) funciona para SaaS tradicional, mas falha com produtos que usam IA: um cliente pode mexer com seu assistente 10 minutos por mês; outro pode deixá-lo rodando 8 horas por dia. O custo para você é radicalmente diferente, mas você cobra o mesmo.

Cobrar por consumo de tokens alinha incentivos: você lucra mais quando o cliente usa mais sua IA (porque ele vê valor), e o cliente não paga por capacidade que não usa. É o modelo que APIs como OpenAI, Anthropic e Google usam internamente — simples, justo, escalável.

  • Margem protegida: você define markup (30%, 50%, 100%) sobre custo de API. Se Claude custa R$ 0,003 por token, você cobra R$ 0,0039 e lucra a diferença.
  • Zero overhead administrativo: Stripe lida com cálculo, fatura, cobrança e reconciliação automaticamente.
  • Cliente paga pelo que usa: incentivo natural a criar produto mais eficiente em consumo de tokens.
  • Previsibilidade de cost: você sabe exatamente quanto paga de API por cliente; markup é fixo.

Como funciona o Stripe Billing para IA em 2026

O Stripe lançou dois novos recursos dentro do Stripe Billing: metering (registrar consumo em tempo real) e pricing baseado em uso com suporte a markup percentual.

Fluxo básico: seu app envia um evento meter_event ao Stripe com a quantidade de tokens consumidos; Stripe multiplica pelo preço base (que você configura), aplica o markup automático, e na data de faturamento (fim do período, ou imediato) cobra o cliente.

exemplo-metering-stripe.ts

// Seu app usa Claude API const response = await anthropic.messages.create({ model: "claude-3-5-sonnet-20241022", max_tokens: 1024, messages: [{ role: "user", content: userMessage }], }); // Extrai tokens consumidos const inputTokens = response.usage.input_tokens; const outputTokens = response.usage.output_tokens; const totalTokens = inputTokens + outputTokens; // Envia para Stripe await stripe.billing.meterEventAdjustments.create({ event_name: 'tokens_used', timestamp: Math.floor(Date.now() / 1000), identifier: customerId, // ID do cliente no seu banco quantity: totalTokens, }); console.log(`Registrado: ${totalTokens} tokens para cliente ${customerId}`);

No dashboard do Stripe, você configura uma price com tipo usage_based e define o custo por unidade + markup percentual. A cobrança é automática no final do ciclo de faturamento.

Passo 1: Configure a Price com metering no Stripe

Acesse o dashboard do Stripe → Products → Create product (ou edite um existente).

  1. Nome: ex. "Claude API - tokens consumed"
  2. Billing model: selecione Usage-based
  3. Unit label: ex. "token" (usado em fatura)
  4. Price type: Metered (carrega em tempo real)
  5. Price per unit: R$ 0,00015 (exemplo: Claude 3.5 Sonnet input é ~0,003 por 1k tokens = 0,000003 por token; com markup de 50%, você cobra 0,0000045, arredondado aqui a 0,00015 por mil tokens)
  6. Apply markup: abilite Markup pricing e defina 50% (ou o percentual que quiser lucrar)

Cálculo de preço com markup

Se você paga Claude R$ 3 por 1 milhão de tokens e quer 50% de markup: (R$ 3 × 1,5) / 1M = R$ 0,0000045 por token. No Stripe, você pode configurar por 1M tokens (R$ 4,50) e deixar o metering contar cada token individualmente.

Passo 2: Configure a subscription do cliente com essa price

Quando o cliente assina seu SaaS, você cria uma subscription no Stripe que aponta para essa price. Não precisa criar nova subscription por cliente — uma única price_id funciona pra todos.

criar-subscription-com-metering.ts

// Cliente assina seu SaaS const subscription = await stripe.subscriptions.create({ customer: customerId, items: [ { price: 'price_IA_TOKEN_METERED', // ID da price que você configurou }, ], billing_cycle_anchor: Math.floor(Date.now() / 1000), // Start today off_session: true, // permite cobrança automática }); console.log('Subscription criada:', subscription.id);

Pronto. A partir de agora, toda vez que seu app chamar a Claude API, você envia um meter_event pro Stripe, e ele acumula consumo.

Passo 3: Envie meter events sempre que houver consumo

Cada vez que o cliente usa a IA no seu produto, você registra o consumo de tokens no Stripe. Isso pode ser feito imediatamente (após a API call) ou em lote (ex. a cada 1 hora).

meter-event-batch.ts

// Envio imediato (recomendado) async function logTokenUsage(customerId: string, tokensUsed: number) { try { await stripe.billing.meterEventAdjustments.create({ event_name: 'tokens_used', timestamp: Math.floor(Date.now() / 1000), identifier: customerId, quantity: tokensUsed, }); console.log(`✓ ${tokensUsed} tokens registrados para ${customerId}`); } catch (error) { console.error('Erro ao registrar tokens:', error); // Reintente ou armazene em fila } } // Uso dentro da função de chat const response = await anthropic.messages.create({ model: "claude-3-5-sonnet-20241022", max_tokens: 1024, messages: [...], }); await logTokenUsage(req.user.customerId, response.usage.input_tokens + response.usage.output_tokens);

Idempotência: evite contar tokens em dobro

Se você reenviar o mesmo meter_event duas vezes, Stripe pode contar em dobro. Use um ID único (idempotency_key no header da request) ou uma fila com deduplicação pra garantir que cada token é contado uma única vez.

Precificação: quanto cobrar por token

Não existe número "certo" — depende do seu posicionamento, custo de operação e valor para o cliente. Mas existem três estratégias comprovadas:

EstratégiaMarkupExemplo (Claude 3.5)Quando usar
Agressiva100% – 200%Você paga R$ 3/1M; cobra R$ 6–9/1MSeu produto agrega valor claro (geração de código, análise); cliente tem orçamento
Balanceada50% – 75%Você paga R$ 3/1M; cobra R$ 4,5–5,25/1MProduto competitivo; quer crescimento + margem razoável
Loss leader20% – 40%Você paga R$ 3/1M; cobra R$ 3,6–4,2/1MEstágio inicial; vai ganhar na retenção e upsell de features

Uma SaaS de código com assistente IA que cobra por token usado está entre R$ 4 e R$ 8 por milhão de tokens. Consumo típico de um dev em 1 hora: 100k–500k tokens = R$ 0,40–4 por hora de uso.

Benchmark real de SaaS IA em 2026

Ferramentas como Cursor, Replit Agent e GitHub Copilot cobram entre R$ 50–150/mês (seat) sem limite de tokens. Assistentes B2B especializados cobram R$ 10–50/mês + R$ 0,01–0,05 por solicitação. Se seu produto é nicho, você pode cobrar mais por token sem soar caro.

Exemplo prático: SaaS de geração de descrição de produto

Você construiu uma SaaS que gera descrição otimizada de produtos em e-commerce usando Claude. Cliente envia: título, categoria, preço, features. Você chama Claude, retorna descrição. Cliente quer pagar por uso, não por mês.

  • Custo por requisição: ~400 tokens input + 150 tokens output = 550 tokens = R$ 0,00165 (a R$ 3/1M)
  • Seu preço com 100% markup: R$ 0,0033 por requisição (ou R$ 3,30 por 1.000 requisições)
  • Cliente usa 500 requisições/mês: pagará ~R$ 1,65/mês em IA
  • Fatura do cliente: variável (ex. R$ 0 a R$ 50 dependendo uso); Stripe calcula automaticamente

Na prática: cliente vê na fatura "Geração com IA: 500 requisições × R$ 0,0033 = R$ 1,65" — super transparente, sem surpresas.

Perguntas frequentes

E se meu cliente usar muitos tokens em um dia e quiser cancelar no mês que vem?+

O Stripe cobra pelo período de faturamento completo. Se o cliente cancela em dia 15, ele paga pelo consumo de tokens até dia 15. Qualquer overage após o cancelamento não é cobrado. Você pode configurar datas de faturamento específicas no setup da subscription.

Posso ter múltiplas prices de IA (uma por modelo: Claude, GPT, Gemini)?+

Sim, totalmente. Você cria três prices separadas (`price_claude`, `price_gpt`, `price_gemini`), cada uma com seu próprio metering e markup. Quando o cliente usa Claude, você envia meter do Claude; quando usa GPT, você envia meter do GPT. Stripe soma tudo na mesma fatura.

Quanto tempo demora pra Stripe processar um meter_event?+

Meter events são processados em tempo real ou quasi-real (~segundos). O Stripe agrega o consumo durante o ciclo de faturamento e cobra no final do período. Não há delay na invoice final.

Se meu app falhar na chamada de meter_event, o cliente paga mesmo assim?+

Não. Se você não enviar o meter_event, Stripe não tem registro de consumo, portanto não cobra. É sua responsabilidade garantir que todo token seja registrado — use retry logic, filas e logging.

É possível dar cap/limite de tokens por cliente?+

Sim. No seu app, você controla: se cliente já consumiu 1M tokens neste ciclo, você nega a requisição com mensagem "Limite atingido". Stripe não bloqueia automaticamente — você que implementa a lógica no backend.

Como esse modelo se comporta com múltiplas moedas? Tenho clientes no BR e US.+

Stripe suporta pricing dinâmico por moeda. Você cria a mesma price em BRL e USD com valores diferentes. Cliente vê cobrado em sua moeda local. Exemplos: price_tokens_brl, price_tokens_usd.

Próximos passos: infraestrutura e monitoramento

Seu setup está completo quando você tem:

  1. Logging robusto de tokens: todo token consumido é registrado no banco + enviado pro Stripe com retry
  2. Dashboard interno: você vê consumo real vs Stripe, identifica discrepâncias
  3. Alertas: notificação se cliente consumir muito mais que o esperado (may indicar bug ou abuso)
  4. Fallback: se Stripe cair, seu app continua funcionando (você disputa charges depois ou reajusta invoice)
  5. Documentação clara: cliente entende exatamente como funciona a cobrança (adicione à landing page ou onboarding)

Muitos solopreneurs com SaaS de IA rodam esse modelo com Stripe em produção desde 2025 — é seguro, escalável e o Stripe suporta sem limite de volume.

Calcule seu markup de token

Use a calculadora de markup para descobrir o preço final que você deve cobrar por token, dado o custo da API.

Abrir calculadora
#cobrar-token-ia-stripe#billing-saas-ia#precificacao-consumo-api#monetizar-produto-ia#stripe-metering

Artigos relacionados