A Maritaca AI, uma empresa brasileira dedicada à pesquisa e desenvolvimento de IA, publicou o Sabiá-2, um LLM especializado em português que está revolucionando o campo da IA no Brasil.
A Inteligência Artificial (IA) tem avançado a passos largos nos últimos anos, especialmente no campo do Processamento de Linguagem Natural (PLN). Os modelos de linguagem grandes (LLMs) têm se tornado cada vez mais poderosos e versáteis, capazes de realizar uma ampla gama de tarefas, desde a geração de textos criativos até a resposta a perguntas complexas. Nesse cenário, a Maritaca AI, uma empresa brasileira dedicada à pesquisa e desenvolvimento de IA, publicou no dia 26/03/2024 o Sabiá-2, um LLM especializado em português que está revolucionando o campo.
O Sabiá-2 foi desenvolvido por um time de pesquisadores da Maritaca AI, composto por Thales Sales Almeida, Hugo Abonizio, Rodrigo Nogueira e Ramon Pires. Esses especialistas uniram seus conhecimentos e habilidades para criar um modelo de linguagem que não apenas compreende profundamente o idioma português, mas também é capaz de gerar textos coerentes, criativos e informativos nessa língua, como primeira língua, sem qualquer tipo de tradução no front ou backend.
Uma das características mais impressionantes do Sabiá-2 é seu desempenho excepcional em exames brasileiros. Em diversos testes, o modelo demonstrou uma performance que rivaliza e, em alguns casos, até supera a do renomado GPT-4, desenvolvido pela OpenAI.
Acesse o Maritalk, equivalente ao ChatGPT, gratuito e muito bom (com performance superior ao ChatGPT 3.5 - que é a versão gratuita).
Os testes realizados utilizando todos os modelos abaixo incluem:
Admissão em universidades (USP, UNICAMP e Enem)
Ensino superior (Enade 2022 e 2023),
Direito (OAB),
Contabilidade (CFCES)
Medicina: (Revalida e provas de residência da USP e UNICAMP)
Pós graduação em engenharia da computação (Poscomp)
Mais abaixo apresento os resultados.
Funcionalidades Técnicas
Por trás do desempenho excepcional do Sabiá-2, há uma arquitetura robusta e bem projetada. O modelo é baseado em Transformers, uma arquitetura de rede neural que se tornou o padrão ouro para tarefas de PLN. Essa escolha permite que o Sabiá-2 processe e gere linguagem de maneira eficiente e precisa.
O treinamento do Sabiá-2 envolveu a exposição a uma vasta quantidade de textos em português, provenientes de diversas fontes, como a internet, livros, artigos e muito mais. Esse processo de aprendizado abrangente permite que o modelo adquira um conhecimento profundo sobre a língua portuguesa, seus nuances e peculiaridades.
O Sabiá-2 está disponível em duas versões: Small e Medium. Essas opções oferecem flexibilidade aos usuários, permitindo que escolham o modelo mais adequado às suas necessidades e recursos computacionais disponíveis.
Um aspecto crucial do treinamento do Sabiá-2 é o uso de instruções específicas para garantir que o modelo gere respostas seguras, éticas e alinhadas com os "valores humanos". Isso é fundamental para evitar que o modelo produza conteúdo ofensivo, inadequado ou potencialmente prejudicial.
Além disso, o Sabiá-2 é capaz de realizar uma ampla gama de tarefas, graças à sua arquitetura versátil. Ele pode responder perguntas, gerar textos criativos, traduzir idiomas e muito mais. Essa versatilidade o torna uma ferramenta poderosa para diversas aplicações, desde chatbots até a criação de conteúdo.
Aplicações Práticas - exemplos
Uma das grandes vantagens do Sabiá-2 é sua integração com a API MariTalk. Essa API permite que desenvolvedores e empresas incorporem facilmente o poder do Sabiá-2 em suas aplicações e serviços.
Com a MariTalk, é possível:
Criar chatbots avançados, capazes de interagir de maneira natural e eficiente com usuários em português. Esses chatbots podem ser aplicados em diversos setores, como atendimento ao cliente, suporte técnico, vendas e muito mais. A capacidade do Sabiá-2 de compreender o contexto e gerar respostas coerentes e relevantes torna-o uma ferramenta ideal para aprimorar a experiência do usuário e aumentar a eficiência dos serviços.
Geração automática de conteúdo. Com sua habilidade de produzir textos criativos e informativos, o modelo pode ser utilizado para criar artigos, posts de blog, descrições de produtos e outros tipos de conteúdo em português. Isso pode ser especialmente útil para empresas e profissionais de marketing que buscam otimizar sua produção de conteúdo e se destacar em um mercado cada vez mais competitivo.
No âmbito jurídico, por exemplo, o Sabiá-2 pode ser utilizado para auxiliar na geração de petições, contratos e outros documentos legais. Sua capacidade de compreender o contexto jurídico e gerar textos precisos e bem estruturados pode agilizar significativamente o trabalho dos profissionais do direito, permitindo que se concentrem em tarefas mais estratégicas.
Na área educacional, o Sabiá-2 pode ser uma ferramenta valiosa para auxiliar estudantes e professores. Com sua habilidade de responder perguntas e fornecer explicações detalhadas sobre uma ampla gama de tópicos, o modelo pode ser utilizado como um tutor virtual, ajudando os estudantes a aprofundar seu conhecimento e esclarecer dúvidas. Além disso, os professores podem usar o Sabiá-2 para gerar materiais didáticos, como exercícios e exemplos, de maneira rápida e eficiente.
Privacidade e Segurança dos dados
Para organizações que lidam com dados sensíveis e têm preocupações com privacidade e segurança, a Maritaca AI oferece a opção de hospedagem local com a MariTalk Local. Essa solução permite que o Sabiá-2 seja executado diretamente nos servidores da empresa, garantindo que os dados permaneçam dentro da infraestrutura da organização. Isso é particularmente relevante para setores como o jurídico, financeiro e de saúde, onde a confidencialidade é primordial.
Performance comparada com outros LLMs
Em diversos exames brasileiros, o Sabiá-2 demonstrou uma performance superior ao GPT-3.5 e comparável ao GPT-4, dois dos modelos mais avançados desenvolvidos pela OpenAI. Essa conquista é especialmente impressionante considerando que o GPT-4 é um modelo de linguagem de ponta, treinado em uma quantidade massiva de dados e com capacidades que vão além do processamento de linguagem natural.
Como resultado, o desempenho do Sabiá-2 em relação a outros LLMs, a tabela abaixo apresenta a média de acurácia nos principais testes realizados, em ordem decrescente:
Testes realizados:
Admissão em universidades (USP, UNICAMP e Enem)
Ensino superior (Enade 2022 e 2023),
Direito (OAB),
Contabilidade (CFCES)
Medicina: (Revalida e provas de residência da USP e UNICAMP)
Pós graduação em engenharia da computação (Poscomp)
Como pode ser observado, o Sabiá-2 Medium se posiciona como o terceiro modelo mais performático, atrás apenas do GPT-4 Turbo e do Claude 3 Opus. Esse resultado é um testemunho da eficácia da especialização em idiomas e contextos culturais específicos. Ao focar no português e em conteúdos relevantes para o Brasil, o Sabiá-2 é capaz de superar modelos maiores e mais genéricos em tarefas que envolvem essa língua e contexto.
É importante ressaltar que o Sabiá-2 Small, apesar de ser uma versão mais compacta do modelo, ainda assim apresenta um desempenho superior a diversos outros LLMs, como o GPT-3.5 Turbo e o Llama 70B. Isso demonstra que a arquitetura e o treinamento especializado do Sabiá-2 são fatores determinantes para seu sucesso, independentemente do tamanho do modelo.
Outro fator importante que vale a menção é seu custo. O gráfico abaixo ilustra a performance e o preço por milhões de tokens. Uma vez que é precificado em Reais, ao contrário do GPT-4 Turbo e o Claude 3 Opus, os dois melhores modelos da atualidade.
Conclusão
O Sabiá-2 representa um marco no desenvolvimento de LLMs especializados em português. Seu desempenho excepcional em exames brasileiros, rivalizando e até superando modelos de ponta como o GPT-4, é uma prova contundente do poder da especialização em idiomas e contextos culturais específicos.
Com sua arquitetura robusta, treinamento abrangente e capacidade de realizar uma ampla gama de tarefas, o Sabiá-2 tem o potencial de revolucionar a forma como interagimos com a tecnologia e acessamos informações em português. Seja na criação de chatbots avançados, na geração de conteúdo, no auxílio a profissionais do direito ou na educação, o modelo oferece possibilidades ilimitadas de aplicação.
Além disso, o Sabiá-2 se destaca pelo seu excelente custo-benefício. Ao oferecer um desempenho comparável a modelos mais caros e genéricos, ele se torna uma opção atraente para empresas e organizações que buscam incorporar a IA em seus processos de maneira eficiente e econômica.
Olhando para o futuro, é emocionante imaginar as possibilidades de evolução e aprimoramento do Sabiá-2. Com o avanço contínuo da pesquisa em IA e o comprometimento da Maritaca AI em impulsionar a inovação, podemos esperar ver o modelo se tornar ainda mais poderoso e versátil com o tempo.
O Sabiá-2 não é apenas um modelo de linguagem; é um símbolo do potencial da IA para transformar a maneira como nos comunicamos, aprendemos e trabalhamos. Ao abraçar essa tecnologia e explorar suas possibilidades, estamos dando um passo em direção a um futuro mais inteligente, eficiente e conectado. O Sabiá-2 é, sem dúvida, um protagonista nessa jornada emocionante rumo à revolução da IA no mundo lusófono.
Me baseei nas infos abaixo para a elaboração deste texto:
Abraço,
Guilherme