IA Responsável

Princípios de IA responsável, mitigação de riscos e compromissos éticos da Polar.

A Polar desenvolve inteligência artificial com o compromisso de que seus modelos sejam seguros, justos e benéficos para a sociedade brasileira. Este documento descreve nossos princípios, práticas e compromissos em IA responsável.

Nossa Missão

Construir uma plataforma de IA soberana brasileira que democratize o acesso à inteligência artificial de alta qualidade, respeitando a diversidade cultural, linguística e social do Brasil. Acreditamos que a IA deve amplificar capacidades humanas, nunca substituí-las em decisões críticas.

Princípios

1. Transparência

Documentação pública de arquiteturas, dados de treinamento e metodologias
Model cards detalhados para cada modelo da família Urso
Comunicação clara sobre capacidades e limitações dos modelos
Relatórios periódicos de avaliação de vieses e segurança

2. Equidade e Não Discriminação

Avaliação contínua de vieses de gênero, raça, região e socioeconômicos
Datasets de avaliação específicos para contexto brasileiro
Representatividade linguística (sotaques, regionalismos, variações do PT-BR)
Métricas de fairness monitoradas em produção

3. Segurança

Filtros de conteúdo para bloquear saídas prejudiciais
Red teaming interno e externo
Monitoramento contínuo de comportamentos inesperados
Plano de resposta a incidentes documentado

4. Privacidade

Conformidade com a LGPD
Remoção de PII nos dados de treinamento
Sem armazenamento de dados de usuário além do necessário
Criptografia em trânsito e em repouso

5. Responsabilidade

Canais claros de reporte para problemas
Equipe dedicada de segurança e ética
Compromisso com correção rápida de problemas identificados
Cooperação com reguladores e sociedade civil

Usos Pretendidos

Usos recomendados

Os modelos Urso são projetados para auxiliar profissionais e usuários em tarefas como:

Análise e sumarização de documentos
Atendimento ao cliente e suporte
Geração e revisão de conteúdo
Desenvolvimento de software
Pesquisa e educação
Análise jurídica (com supervisão profissional)

Usos não pretendidos

Os modelos não devem ser usados para:

Diagnóstico médico ou prescrição de tratamentos
Decisões judiciais ou pareceres jurídicos definitivos sem supervisão humana
Decisões autônomas sobre crédito, emprego ou moradia
Vigilância ou monitoramento de indivíduos
Geração de desinformação ou conteúdo enganoso
Atividades ilegais ou desenvolvimento de armas
Perfilamento discriminatório de indivíduos ou grupos
Manipulação psicológica ou persuasão indevida

Capacidades e Limitações

Capacidades

Compreensão e geração de texto em PT-BR com alta qualidade
Raciocínio lógico e matemático (especialmente com variantes Think)
Análise de documentos multimodais
Geração de código em diversas linguagens
Busca semântica e recuperação de informações

Limitações conhecidas

Alucinações: Os modelos podem gerar informações factualmente incorretas com alta confiança
Cutoff temporal: Conhecimento limitado aos dados de treinamento
Vieses: Podem refletir vieses presentes nos dados de treinamento
Variabilidade regional: Performance pode variar para dialetos e regionalismos específicos
Contexto longo: Qualidade pode degradar em contextos muito longos
Raciocínio complexo: Modelos menores têm capacidade limitada de raciocínio multi-etapas

Mitigação de Riscos

Riscos identificados e estratégias

Risco	Estratégia de mitigação
Alucinações	RAG para fundamentar respostas; instruções para citar fontes
Vieses discriminatórios	Avaliação contínua; diversidade nos dados de treinamento
Conteúdo tóxico	Filtros de saída; GRPO para alinhamento
Uso indevido	Termos de uso claros; monitoramento; rate limiting
Privacidade	Remoção de PII; conformidade LGPD; criptografia
Dependência excessiva	Comunicação clara de limitações; human-in-the-loop

Human-in-the-Loop

A Polar recomenda fortemente a supervisão humana em cenários críticos:

Análise jurídica: Sempre revise com um advogado antes de tomar decisões
Conteúdo publicado: Revise o conteúdo gerado antes de publicar
Dados sensíveis: Verifique a precisão de extrações de dados críticos
Decisões de negócio: Use como ferramenta de apoio, não como decisor final

# Exemplo: adicionando nota sobre supervisão humana
response = client.chat.completions.create(
    model="urso-mabe",
    messages=[
        {"role": "system", "content": "Você é um assistente jurídico. Sempre informe que suas respostas não substituem o aconselhamento de um advogado."},
        {"role": "user", "content": "Quais são meus direitos neste caso?"}
    ]
)

Avaliação de Vieses

Metodologia

A Polar realiza avaliações periódicas de vieses nos modelos, incluindo:

Vieses de gênero: Testes com prompts neutros e análise de associações de gênero
Vieses raciais: Avaliação de tratamento diferenciado baseado em raça ou etnia
Vieses regionais: Análise de performance entre diferentes regiões do Brasil
Vieses socioeconômicos: Testes para detectar discriminação baseada em classe social

Datasets de avaliação

Dataset proprietário de avaliação de vieses em PT-BR
Adaptações de benchmarks internacionais (BBQ, WinoBias)
Cenários específicos do contexto brasileiro
Avaliação por equipes diversas

Conformidade LGPD

Direitos dos titulares

A Polar garante os direitos previstos na LGPD:

Acesso: Usuários podem solicitar informações sobre dados processados
Correção: Usuários podem solicitar correção de dados incorretos
Eliminação: Usuários podem solicitar a exclusão de dados pessoais
Portabilidade: Usuários podem solicitar a portabilidade de seus dados
Revogação: Usuários podem revogar consentimento a qualquer momento

Contato do DPO

Encarregado de Dados (DPO): dpo@polar.com.br
Portal de privacidade: polar-ai.com/privacidade

Compromissos Futuros

Publicação de relatórios periódicos de transparência
Ampliação dos datasets de avaliação de vieses
Participação em iniciativas brasileiras e internacionais de IA responsável
Colaboração com academia e sociedade civil
Certificações de segurança e conformidade

Canais de Reporte

Segurança e vieses: safety@polar.com.br
Proteção de dados: dpo@polar.com.br
Suporte geral: suporte@polar.com.br

Todos os reportes são tratados com confidencialidade e respondidos em até 48 horas úteis.

IA Responsável

On this page