LLMs – Prof. Pedro Andretta

4 de julho de 2026

AMALIA não é o ChatGPT — O que é realmente a primeira IA soberana portuguesa / TIC, Web e Educação

Por Pedro Andretta em Informe-CI Tag InteligênciaArtificial, LLMs, Portugal

AMALIA não é o ChatGPT — O que é realmente a primeira IA soberana portuguesa / TIC, Web e Educação

Portugal lançou a AMALIA (Assistente Multimodal Automático de Linguagem com Inteligência Artificial) – o primeiro grande modelo de linguagem em português europeu – mas quem esperava um rival do ChatGPT encontrou apenas silêncio digital: sem site, sem app. É, na verdade, uma infraestrutura de código aberto, de 9 mil milhões de parâmetros, treinada com 195 terabytes de dados do Arquivo.pt, destinada a hospitais, escolas e forças armadas que precisam de processar dados sensíveis sem os exportar para servidores estrangeiros. Custou 7 milhões de euros, supera rivais como o Llama e o Mistral nos exames nacionais, mas fica aquém em matemática – e o seu verdadeiro veredicto dependerá dos próximos 24 meses.

#LLMs #Portugal #IA

via TIC, Web e Educação

Disponível em: https://jfborges.com/2026/07/02/amalia-nao-e-o-chatgpt-o-que-e-realmente-a-primeira-ia-soberana-portuguesa/

15 de junho de 2026

Artigo de opinião: IA generativa e o futuro da cientometria / Scientometrics

Por Pedro Andretta em Informe-CI Tag cientometria, InteligênciaArtificial, LLMs

Artigo de opinião: IA generativa e o futuro da cientometria / Scientometrics

Em conclusão, a GenAI não é apenas um novo método ou ferramenta de produtividade. Tem o potencial de alterar a representação textual da ciência, o que pode representar tanto um desafio como uma oportunidade para a cientometria. Desafia a fiabilidade dos indicadores estabelecidos, mas também poderá abrir novos caminhos para a modelação e o estudo da comunicação científica. Um trabalho empírico cuidadoso e a reflexão teórica serão essenciais para garantir que a área continue capaz de interpretar e explicar os padrões em evolução da produção de conhecimento na era da IA.

#IA #LLMs #Cientometria

via Scientometrics

Disponível em: https://link.springer.com/article/10.1007/s11192-026-05667-1

9 de maio de 2026

Os modelos de IA mais inteligentes em 2026 / Voroni

Por Pedro Andretta em Informe-CI Tag LLMs

Os modelos de IA mais inteligentes em 2026 / Voroni

Os modelos de IA mais inteligentes em 2026 estão agora agrupados no topo, com apenas alguns pontos separando os líderes. O Grok-4.20 Expert Mode e o OpenAI GPT 5.4 Pro (Visão) compartilham a maior pontuação neste ranking, com 145. Nos resultados de 2025, o OpenAI o3 obteve a maior pontuação, com 135, enquanto seu modelo de visão GPT 4o alcançou apenas 63 pontos.

via Voroni

#LLMs

Disponível em: https://www.voronoiapp.com/technology/Ranked-The-Smartest-AI-Models-in-2026-8123

23 de abril de 2026

O Problema da Citação Fantasma / Search Engine Journal

Por Pedro Andretta em Informe-CI Tag LLMs

O Problema da Citação Fantasma / Search Engine Journal

Quando uma IA responde a uma pergunta usando seu conteúdo, geralmente ela cita você com um link para a fonte. O que ela não faz, em 62% dos casos, é mencionar seu nome. O link está lá. A menção da marca, não. É o que eu gosto de chamar de citação fantasma : a IA que usa seu conteúdo não menciona você na resposta.

Esta análise baseia-se em 3.981 domínios em 115 perguntas, 14 países e quatro mecanismos de busca de IA (ChatGPT, Google AI Overviews, Gemini, AI Mode), usando dados do Semrush AI Toolkit. Cada ocorrência é marcada como “citada” (link da fonte presente) e/ou “mencionada” (nome da marca aparece no texto da resposta). A lacuna entre esses dois estados é o problema da citação fantasma.

#LLMs

via Search Engine journal

Disponível em: https://www.searchenginejournal.com/the-ghost-citation-problem/572453/

6 de janeiro de 2026

Produção científica na era dos grandes modelos de linguagem / Science

Por Pedro Andretta em Informe-CI Tag LLMs, ProduçãoCientífica

Produção científica na era dos grandes modelos de linguagem / Science

Analisamos dados em larga escala de três importantes repositórios de preprints para demonstrar que o uso de GMLs acelera a produção de manuscritos, reduz as barreiras para falantes não nativos de inglês e diversifica a descoberta de literatura prévia. No entanto, indicadores tradicionais de qualidade científica, como a complexidade da linguagem, estão se tornando indicadores de mérito pouco confiáveis, justamente quando vivenciamos um aumento na quantidade de trabalho científico. À medida que os sistemas de IA avançam, eles desafiarão nossas premissas fundamentais sobre a qualidade da pesquisa, a comunicação acadêmica e a natureza do trabalho intelectual.

#LLMs #ProduçãoCientífica

Disponível em: https://www.science.org/doi/10.1126/science.adw3000

30 de dezembro de 2025

Recomendação de literatura acadêmica em redes de citação em larga escala aprimorada por grandes modelos de linguagem / Scientometrics

Por Pedro Andretta em Informe-CI Tag InteligênciaArtificial, LLMs, RecuperaçãoDaInformação

Recomendação de literatura acadêmica em redes de citação em larga escala aprimorada por grandes modelos de linguagem / Scientometrics

Em resumo, nosso trabalho não apenas fornece um sistema de dados completo para a construção e análise de redes de citação, mas também introduz um método prático de recomendação que auxilia pesquisadores a navegar pelo crescente volume de literatura acadêmica, facilitando a busca pelos artigos mais relevantes e influentes na era da sobrecarga de informação.

#RecuperaçãoDaInformação #IA #LLMs

Disponível em: https://link.springer.com/article/10.1007/s11192-025-05420-0

18 de dezembro de 2025

Os modelos de IA estão usando material de artigos científicos retratados / MIT Technology Review

Por Pedro Andretta em Informe-CI Tag InteligênciaArtificial, LLMs, Retratação

Os modelos de IA estão usando material de artigos científicos retratados / MIT Technology Review

Já se sabe que ferramentas de busca com IA e chatbots podem fabricar links e referências. Mas respostas baseadas em material de artigos científicos reais também podem induzir ao erro se esses artigos tiverem sido retratados. O chatbot está “usando um artigo científico real, material real, para te dizer algo”, afirma Weikuan Gu, pesquisador médico da Universidade do Tennessee em Memphis e um dos autores de um dos estudos recentes. Mas, segundo ele, se as pessoas olharem apenas para o conteúdo da resposta e não clicarem para acessar o artigo e verem que ele foi retratado, isso é um problema sério.

#LLMs #Retração

Disponível em: https://www.technologyreview.com/2025/09/23/1123897/ai-models-are-using-material-from-retracted-scientific-papers/

10 de dezembro de 2025

Testamos qual IA deu as melhores respostas sem inventar nada — One Beat ChatGPT / The Washington Post

Por Pedro Andretta em Informe-CI Tag InteligênciaArtificial, LLMs

Testamos qual IA deu as melhores respostas sem inventar nada — One Beat ChatGPT / The Washington Post

Principais Descobertas:

– Ferramenta Mais Confiável: O Modo IA do Google foi a IA que forneceu as respostas mais precisas e consistentes, especialmente em relação a informações recentes e curiosidades pouco conhecidas.
– Alucinações e Erros: Diversas IAs, incluindo o ChatGPT, geraram respostas incorretas com um ar de certeza, às vezes citando fontes que não abordavam a questão.
– Limitações com Informações Especializadas: Nenhuma IA respondeu corretamente em todos os casos que exigiam conhecimento específico ou fontes de difícil acesso.

#LLMs #IA

via The Washington Post

Disponível em: https://www.washingtonpost.com/technology/2025/08/27/ai-search-best-answers-facts/

12 de novembro de 2025

A Wikipédia recomenda que as empresas de IA usem sua API paga e parem de extrair dados de outros sistemas / Tech Crunch

Por Pedro Andretta em Informe-CI Tag LLMs, Wikipedia

A Wikipédia recomenda que as empresas de IA usem sua API paga e parem de extrair dados de outros sistemas / Tech Crunch

Em uma postagem no blog, a Fundação Wikimedia, organização responsável pela popular enciclopédia online, fez um apelo aos desenvolvedores de IA para que usem seu conteúdo de forma “responsável”, garantindo que suas contribuições sejam devidamente atribuídas e que o conteúdo seja acessado por meio de seu produto pago, a plataforma Wikimedia Enterprise.

O produto pago, que exige adesão opcional, permite que empresas usem o conteúdo da Wikipédia em larga escala sem “sobrecarregar severamente os servidores da Wikipédia”, explica a postagem da Fundação Wikimedia. Além disso, a natureza paga do produto permite que empresas de IA apoiem a missão sem fins lucrativos da organização.

#Wikipedia #LLMs

via Tech Crunch

Disponível em: https://techcrunch.com/2025/11/10/wikipedia-urges-ai-companies-to-use-its-paid-api-and-stop-scraping/

11 de novembro de 2025

Amazônia IA

Por Pedro Andretta em Informe-CI Tag Amazônia, InteligênciaArtificial, LLMs

Amazônia IA

A Amazônia IA é a Inteligência Artificial do Brasil. Um modelo de linguagem grande (LLM) com potência computacional no mesmo nível dos maiores modelos do mundo. Com uma grande diferença. A Amazônia IA nasceu no Brasil. Criado por pesquisadores brasileiros, nativo em português, treinado com toda cultura, riqueza natural e criatividade brasileiras.

#LLMs #Amazônia #IA

Disponível em: https://amazoniaia.com.br/

2 de outubro de 2025

LLM é uma camada de apresentação na pesquisa de IA / DEJAN

Por Pedro Andretta em Informe-CI Tag InteligênciaArtificial, LLMs, RecuperaçãoDaInformação

LLM é uma camada de apresentação na pesquisa de IA / DEJAN

Existe um mito persistente de que os modelos de linguagem de grande porte (LLMs) substituíram fundamentalmente a busca. Na verdade, os LLMs não rastreiam a web, não mantêm índices e não impõem algoritmos de classificação em escala da internet. Eles operam como camadas de apresentação e raciocínio sobre o pipeline clássico de recuperação de informação (RI).

O artigo recente “Por que os Modelos de Linguagem Alucinam” (Kalai, Nachum, Vempala, Zhang, 2025) mostra por que essa distinção é importante: os LLMs inevitavelmente alucinam devido a limites estatísticos e incentivos de avaliação. Sem base em sistemas de recuperação reais, eles não podem fornecer buscas confiáveis.

#IA #LLMs #RecuperaçãoDaInformação

Disponível em: https://dejan.ai/blog/llm-is-a-presentation-layer-in-ai-search/

23 de julho de 2025

Linguística para uma inteligência artificial (IA) brasileira / SciELO

Por Pedro Andretta em Informe-CI Tag Linguística, LLMs

Linguística para uma inteligência artificial (IA) brasileira / SciELO

A proposta de curadoria da Plataforma da Diversidade Linguística Brasileira, que reúne dados estruturados e documentados de diferentes variedades do português brasileiro e de outras línguas do Brasil, está diretamente alinhadas às metas da ação para ampliar a oferta de conjuntos de dados nacionais e permitir o desenvolvimento de um LLM que seja sensível à diversidade real do uso da língua no Brasil.

Em vez de replicar padrões de traduções do inglês, os dados estruturados sob curadoria da Plataforma da Diversidade Linguística Brasileira possibilitam o treino de LLMs que reflitam a realidade linguística brasileira, essencial para o sucesso de aplicações tecnológicas nas áreas de saúde, educação, justiça, inclusão digital e outros setores estratégicos.

#LLMs #Linguística

via SciELO

Disponível em: https://blog.scielo.org/blog/2025/07/18/linguistica-para-uma-inteligencia-artificial-ia-brasileira/

Tag: LLMs