Regulação de dados alternativos para crédito: o limite entre inovação e discriminação
Ponto-chave
O uso de dados alternativos revolucionou a inclusão financeira no Brasil, mas esbarra no risco de discriminação algorítmica por meio de proxies sociais. O grande desafio regulatório do BACEN e da ANPD agora é garantir a explicabilidade dos modelos de IA sem asfixiar a inovação das fintechs.
Imagine abrir o aplicativo da sua fintech favorita, solicitar um modesto limite de R$ 500 no cartão de crédito e receber uma negativa instantânea. Seu nome está limpo no Serasa. Você não tem dívidas ativas. O problema? A bateria do seu celular estava em 5% no momento da solicitação, você digitou seu CPF rápido demais e o GPS indicou que você mora em um bairro periférico de São Paulo. Sinal vermelho na matriz de risco. Crédito negado.
Parece um roteiro distópico de Black Mirror, mas essa é a realidade crua dos bastidores da análise de crédito em 2025. Nós da Ouro Capital acompanhamos a evolução desse mercado de perto há mais de uma década. Vimos o nascimento das primeiras maquininhas, a explosão dos bancos digitais e a revolução do Pix. Agora, assistimos à corrida armamentista pelos dados não-tradicionais.
O mercado financeiro brasileiro vive um dilema fascinante e perigoso. De um lado, temos a urgência da inclusão financeira. Do outro, o fantasma do racismo algorítmico e da exclusão digital. A linha que separa a inovação disruptiva da discriminação automatizada é assustadoramente tênue. E os reguladores — BACEN, CVM e ANPD — estão correndo atrás do prejuízo para entender como auditar caixas-pretas de inteligência artificial.
O Cemitério dos "Thin Files" no Brasil
Para entender como chegamos até aqui, precisamos olhar para o espelho retrovisor. O modelo tradicional de concessão de crédito no Brasil sempre foi punitivo. Birôs como Serasa Experian e SPC Brasil construíram impérios baseados em dados negativos: quem deu calote, quem protestou título, quem falhou.
A aprovação da Lei do Cadastro Positivo (Lei 12.414/2011) mudou as regras do jogo ao incluir o histórico de bom pagador. Observamos um salto imediato na concessão de crédito. No entanto, o sistema tradicional esbarrou em um teto de vidro. Existem milhões de brasileiros que operam quase inteiramente na economia informal. Eles pagam aluguel em dinheiro vivo, compram mantimentos via Pix direto para o mercadinho do bairro e não possuem uma única conta de luz em seus nomes.
Na linguagem técnica, chamamos essas pessoas de "thin files" (arquivos finos) ou "invisíveis de crédito". Como um banco precifica o risco de alguém que não existe formalmente no sistema financeiro tradicional? Se você é o Nubank, o Mercado Pago ou a Stone, você não pode simplesmente ignorar uma fatia de mercado que movimenta bilhões de reais anualmente. A resposta da engenharia financeira foi buscar sinais de confiabilidade onde ninguém estava olhando.
Dissecando o Dado Alternativo
O que exatamente compõe esse universo que chamamos de dados alternativos? Esqueça os holerites e as declarações de Imposto de Renda. Estamos falando da sua pegada digital completa. Os cientistas de dados das grandes fintechs dividem esse arsenal em três grandes baldes.
Comportamento de Navegação e Biometria
Como você interage com o aplicativo do banco diz muito sobre a sua propensão ao risco. Você lê os Termos e Condições antes de aceitar? Estudos internos de grandes emissores de cartão mostram que usuários que rolam a tela dos termos de uso até o final, gastando pelo menos 15 segundos na página, apresentam taxas de inadimplência consideravelmente menores. A velocidade da digitação, o uso de letras maiúsculas no preenchimento do nome e até os horários em que você acessa o app alimentam os modelos de machine learning.
Transacional Periférico
Aqui entram os dados de consumo cotidiano que não necessáriamente configuram crédito. Quantas vezes você pede comida por aplicativo? Você paga suas corridas de Uber no Pix ou no dinheiro? Para o microempreendedor, adquirentes como PagSeguro e Stone útilizam o fluxo de recebíveis da maquininha para estimar o faturamento real do negócio, ignorando a contabilidade formal muitas vezes defasada.
Metadados de Hardware e Telecomúnicações
Este é o território mais controverso. Empresas especializadas em inteligência de dados capturam informações como o modelo do seu smartphone, a versão do sistema operacional, a quantidade de contatos na agenda e o histórico de recargas de celular pré-pago. Um iPhone de última geração rodando o iOS mais recente recebe uma pontuação de risco radicalmente diferente de um Android de entrada com a tela trincada e sistema desatualizado.
O Perigo Mora no Proxy: Quando o Algoritmo Discrimina
Aqui entramos no coração do debaté regulatório. Um algoritmo de inteligência artificial não acorda de manhã com preçonceitos. Ele não entende o que é racismo, machismo ou classismo. Ele é uma máquina fria de correlação matemática, buscando otimizar uma única métrica: reduzir o default (calote).
O problema estrutural ocorre quando o modelo de IA encontra variáveis que funcionam como "proxies" (procuradores) para características protegidas por lei. Vamos a um exemplo prático. Suponha que o algoritmo de uma fintech descubra que usuários residentes no CEP 08000 (Itaim Paulista, periferia de São Paulo) têm uma correlação estatística maior com inadimplência do que usuários do CEP 04500 (Vila Olímpia, área nobre).
O modelo rápidamente aprende a penalizar ou negar crédito sistematicamente para qualquer solicitação vinda daquele CEP da periferia. Isso é o clássico "redlining" — uma prática ilegal onde instituições financeiras desenhavam linhas vermelhas em mapas para negar serviços a moradores de bairros habitados por minorias. A diferença é que o redlining de 2025 é digital, invisível e justificado por uma rede neural complexa.
O CEP atua como um proxy para classe social e, na demografia brasileira, um proxy direto para raça. O mesmo acontece com o modelo do celular. Quando uma instituição nega crédito baseada no fato do usuário possuir um aparelho de baixo custo, ela está, na prática, punindo a pobreza e perpetuando a exclusão financeira sob o verniz da sofisticação tecnológica. A inovação vira uma máquina de moer pobres.
O Xadrez Regulatório Brasileiro: BACEN e ANPD
Como os xerifes do mercado estão lidando com essa bomba-relógio? O Banco Central do Brasil sempre adotou uma postura pró-inovação. Desde a gestão de Ilan Goldfajn, passando por Roberto Campos Neto e agora com Gabriel Galípolo, o BACEN prefere regular a conduta do que proibir a tecnologia. No entanto, a paciência com modelos de risco inexplicáveis está acabando.
A Resolução CMN nº 4.943, que trata do gerenciamento de riscos, exige que as instituições financeiras tenham controle absoluto sobre seus modelos de crédito. Se o seu algoritmo discrimina, o risco de imagem, o risco legal e o risco sistêmico são inteiramente seus. O regulador não aceita a desculpa clássica do Vale do Silício: "A inteligência artificial fez isso sozinha e nós não sabemos como". A explicabilidade é inegociável.
Simultaneamente, temos a Lei Geral de Proteção de Dados (Lei 13.709/2018). O Artigo 20 da LGPD é a principal arma do consumidor moderno. Ele garante o direito de solicitar a revisão de decisões tomadas únicamente com base em tratamento automatizado de dados pessoais que afetem seus interesses. Se o seu crédito foi negado por um robô, você tem o direito de saber quais critérios pesaram nessa decisão.
A Autoridade Nacional de Proteção de Dados (ANPD) tem apertado o cerco contra empresas que usam dados comportamentais sem consentimento explícito e claro. O desafio da agência, contudo, é técnico. Fiscalizar a governança de dados de um bancão com 100 mil funcionários é uma coisa; auditar os pesos e vieses de uma rede neural profunda de uma fintech de crédito é um desafio monumental que exige auditores algoritmos especializados.
Open Finance: O Antídoto Contra o Caos
Enquanto o mercado debaté os limites éticos de analisar a bateria do celular do cliente, o próprio Banco Central construiu uma via expressa muito mais segura: o Open Finance. Com dezenas de milhões de consentimentos ativos no Brasil, o sistema aberto permite que o usuário leve seu histórico financeiro real de uma instituição para outra.
Se você é cliente do Nubank e quer um empréstimo no Itaú, você não precisa que o Itaú adivinhe seu comportamento por meio de metadados obscuros do seu smartphone. Você simplesmente autoriza o compartilhamento do seu extrato, limite e histórico de pagamentos via API regulamentada. É determinístico. É financeiro. É baseado em consentimento granular.
O Open Finance atua como um antídoto contra a dependência excessiva de dados alternativos invasivos. Ele fornece a riqueza de informações que as fintechs precisam para aprovar os "thin files", mas dentro de um arcabouço regulatório limpo e auditável. Observamos uma migração clara de estratégia nos grandes players: o dado alternativo selvagem está sendo substituído pelo dado aberto estruturado.
Implicações Práticas: O Que Muda Para o Mercado
Se você opera uma operação de crédito, preste atenção aqui. A era do "vale-tudo" algorítmico acabou. Os diretores de risco (CROs) precisam implementar uma governança de inteligência artificial rigorosa imediatamente. O que isso significa na prática?
Primeiro, audite seus modelos de machine learning periodicamente em busca de vieses discriminatórios. Pergunte aos seus cientistas de dados quais variáveis estão puxando as negativas de crédito. Se houver qualquer correlação indireta com raça, gênero ou CEP que não tenha justificativa estritamente financeira, remova a variável. O custo de uma ação civil pública movida pela Senacon ou pelo Ministério Público destruirá o seu lucro trimestral.
Segundo, documente a explicabilidade. Quando um cliente acionar o Serviço de Atendimento ao Consumidor (SAC) exigindo a revisão do Artigo 20 da LGPD, a sua equipe de atendimento não pode responder com jargões técnicos sobre "score de propensão". A resposta precisa ser clara: "Seu crédito foi negado devido ao alto comprometimento de renda nos últimos 90 dias".
Para o consumidor brasileiro, a regra de ouro é o controle da própria identidade digital. A conscientização sobre o valor dos próprios dados está crescendo. Negar o acesso aos contatos do celular ou à localização exata para um aplicativo de finanças deixará de ser preciosismo de privacidade e passará a ser uma estratégia ativa de proteção do próprio score de crédito.
A Próxima Fronteira do Risco
O mercado de crédito não vai retroceder. A busca por informações que prevejam o comportamento humano continuará impulsionando a indústria financeira. O limite entre a inovação que inclui e a discriminação que exclui não será definido por uma única lei caneta-tinteiro em Brasília, mas pela jurisprudência contínua e pelos testes de estrêsse regulatórios.
O score de crédito da próxima década não será um número estático de três dígitos fornecido por um birô tradicional. Será uma matriz dinâmica, contextual e alimentada por milhares de variáveis em tempo real. O sucesso do Brasil nesse cenário dependerá da nossa capacidade de garantir que essa matriz matemática avalie o caráter financeiro do indivíduo, e não o código postal onde ele dorme.
Perguntas Frequentes
Matheus Feijão
CEO & Fundador — ouro.capital
Especialista em fintech e criptoativos desde 2002. CEO da ouro.capital.