PolarPOLAR

Model Card

Especificações, usos pretendidos, limitações e considerações éticas dos modelos Urso.

Model Card — Família Urso

Este document descreve as especificações técnicas, usos pretendidos, limitações e considerações éticas dos modelos de linguagem da família Urso, desenvolvidos pela Polar.

Especificações do Modelo

Arquitetura

ModeloArquiteturaParâmetros totaisParâmetros ativosContexto
Urso LiteDense Transformer3B3B128K
Urso BaseMixture of Experts30B6B128K
Urso ProMixture of Experts70B14B128K
Urso UltraMixture of Experts200B+30B128K
Urso EmbedDense Transformer8K

Treinamento

  • Pré-treinamento: Realizado em corpus multilingual com ênfase em PT-BR (65% dos dados)
  • SFT: Fine-tuning supervisionado com dados de alta qualidade em instrução-resposta
  • Alinhamento: GRPO (Group Relative Policy Optimization) com preferências humanas
  • Think variants: Treinamento adicional com dados de cadeia de pensamento

Capacidades

  • Geração e compreensão de texto em português brasileiro e inglês
  • Processamento multimodal (imagens, documentos, áudio) nos modelos Base, Pro e Ultra
  • Raciocínio explícito com variantes Think
  • Function calling e structured output
  • Embeddings semânticos (modelo Embed)

Uso Pretendido

Os modelos Urso foram projetados para os seguintes casos de uso:

Usos recomendados

  • Atendimento ao cliente: Chatbots e assistentes virtuais para empresas brasileiras
  • Análise de documentos: Leitura, sumarização e extração de informações de documentos
  • Assistência profissional: Suporte a profissionais em suas tarefas diárias
  • Geração de conteúdo: Redação, tradução e revisão de textos
  • Desenvolvimento: Geração, revisão e documentação de código
  • Educação: Tutoria, explicação de conceitos e geração de material didático
  • Pesquisa: Análise de dados, revisão de literatura e síntese de informações

Usos fora do escopo

Os modelos Urso não devem ser usados para:

  • Diagnóstico médico: Os modelos não são substitutos para profissionais de saúde e não devem ser usados para diagnóstico, prescrição ou orientação médica
  • Aconselhamento jurídico definitivo: Embora possam auxiliar profissionais do direito, não substituem o julgamento de um advogado e não devem ser usados como única fonte de orientação jurídica
  • Decisões autônomas com consequências significativas: Decisões que impactam significativamente a vida, liberdade, emprego ou direitos de pessoas não devem ser tomadas exclusivamente por IA
  • Vigilância e monitoramento: Não devem ser usados para vigilância em massa ou monitoramento de indivíduos
  • Geração de conteúdo enganoso: Não devem ser usados para criar desinformação, deepfakes ou conteúdo que engane deliberadamente
  • Armas ou atividades ilegais: Não devem ser usados para desenvolver armas ou facilitar atividades ilegais

Dados de Treinamento

Resumo das fontes

FonteTokensTipo
GigaVerbo v2320BCorpus PT-BR curado
FineWeb-Edu1.3TWeb educacional filtrado
The Stack v2900BCódigo-fonte
Wikipedia PTEnciclopédia
CulturaXCorpus multilingual
Legislação e jurisprudência brasileiraGoverno e direito

Distribuição linguística

  • 65% Português brasileiro (PT-BR)
  • 17% Inglês (EN)
  • 8% Governo e legal
  • 6% Matemática e ciência
  • 4% Código-fonte

Para detalhes completos sobre proveniência de dados, consulte a Proveniência de Dados.

Resultados de Avaliação

Os modelos Urso são avaliados continuamente em benchmarks de referência. Resultados detalhados serão publicados em relatórios técnicos periódicos.

Benchmarks principais:

  • ENEM (vestibular brasileiro)
  • OAB (Exame da Ordem dos Advogados)
  • MMLU adaptado para PT-BR
  • HumanEval (geração de código)
  • MT-Bench adaptado para PT-BR
  • MATH (raciocínio matemático)

Para scores atualizados, consulte Comparar Modelos.

Considerações Éticas

Vieses conhecidos

Como todo modelo de linguagem treinado em dados da internet, os modelos Urso podem refletir vieses presentes nos dados de treinamento, incluindo vieses de gênero, raça, região e socioeconômicos. A Polar trabalha continuamente para identificar e mitigar esses vieses.

Medidas de segurança

  • Filtros de conteúdo: Sistemas de filtragem para bloquear conteúdo tóxico, prejudicial ou ilegal
  • Alinhamento: Treinamento com GRPO para alinhar respostas com valores humanos
  • Red teaming: Avaliação adversarial contínua por equipes internas e externas
  • Monitoramento: Logs e métricas para detectar comportamentos inesperados em produção
  • Rate limiting: Limites de taxa para prevenir abuso

Limitações

  • Os modelos podem gerar informações incorretas ou inventadas (alucinações)
  • Conhecimento limitado a dados de treinamento (cutoff temporal)
  • Podem não entender corretamente nuanças culturais de todas as regiões do Brasil
  • Performance pode variar significativamente entre diferentes tipos de tarefas
  • Modelos menores (Lite) têm capacidades mais limitadas

Canais de Reporte

Para reportar problemas de segurança, vieses ou comportamentos inadequados:

Levamos todos os reportes a sério e respondemos em até 48 horas úteis.

Atualizações

Este Model Card é atualizado periodicamente conforme novos dados de avaliação e melhorias são implementados. Última atualização: Março 2026.

On this page