Produção científica na era dos grandes modelos de linguagem / Science

Produção científica na era dos grandes modelos de linguagem / Science

Analisamos dados em larga escala de três importantes repositórios de preprints para demonstrar que o uso de GMLs acelera a produção de manuscritos, reduz as barreiras para falantes não nativos de inglês e diversifica a descoberta de literatura prévia. No entanto, indicadores tradicionais de qualidade científica, como a complexidade da linguagem, estão se tornando indicadores de mérito pouco confiáveis, justamente quando vivenciamos um aumento na quantidade de trabalho científico. À medida que os sistemas de IA avançam, eles desafiarão nossas premissas fundamentais sobre a qualidade da pesquisa, a comunicação acadêmica e a natureza do trabalho intelectual.

#LLMs #ProduçãoCientífica

Disponível em: https://www.science.org/doi/10.1126/science.adw3000

Recomendação de literatura acadêmica em redes de citação em larga escala aprimorada por grandes modelos de linguagem / Scientometrics 

Recomendação de literatura acadêmica em redes de citação em larga escala aprimorada por grandes modelos de linguagem / Scientometrics 

Em resumo, nosso trabalho não apenas fornece um sistema de dados completo para a construção e análise de redes de citação, mas também introduz um método prático de recomendação que auxilia pesquisadores a navegar pelo crescente volume de literatura acadêmica, facilitando a busca pelos artigos mais relevantes e influentes na era da sobrecarga de informação.

#RecuperaçãoDaInformação #IA #LLMs

Disponível em: https://link.springer.com/article/10.1007/s11192-025-05420-0

Os modelos de IA estão usando material de artigos científicos retratados / MIT Technology Review

Os modelos de IA estão usando material de artigos científicos retratados / MIT Technology Review

Já se sabe que ferramentas de busca com IA e chatbots podem fabricar links e referências. Mas respostas baseadas em material de artigos científicos reais também podem induzir ao erro se esses artigos tiverem sido retratados. O chatbot está “usando um artigo científico real, material real, para te dizer algo”, afirma Weikuan Gu, pesquisador médico da Universidade do Tennessee em Memphis e um dos autores de um dos estudos recentes. Mas, segundo ele, se as pessoas olharem apenas para o conteúdo da resposta e não clicarem para acessar o artigo e verem que ele foi retratado, isso é um problema sério.

#LLMs #Retração

Disponível em: https://www.technologyreview.com/2025/09/23/1123897/ai-models-are-using-material-from-retracted-scientific-papers/

Testamos qual IA deu as melhores respostas sem inventar nada — One Beat ChatGPT / The Washington Post

Testamos qual IA deu as melhores respostas sem inventar nada — One Beat ChatGPT / The Washington Post

Principais Descobertas:

– Ferramenta Mais Confiável: O Modo IA do Google foi a IA que forneceu as respostas mais precisas e consistentes, especialmente em relação a informações recentes e curiosidades pouco conhecidas.
– Alucinações e Erros: Diversas IAs, incluindo o ChatGPT, geraram respostas incorretas com um ar de certeza, às vezes citando fontes que não abordavam a questão.
– Limitações com Informações Especializadas: Nenhuma IA respondeu corretamente em todos os casos que exigiam conhecimento específico ou fontes de difícil acesso.

#LLMs #IA

via The Washington Post

Disponível em: https://www.washingtonpost.com/technology/2025/08/27/ai-search-best-answers-facts/

A Wikipédia recomenda que as empresas de IA usem sua API paga e parem de extrair dados de outros sistemas / Tech Crunch

A Wikipédia recomenda que as empresas de IA usem sua API paga e parem de extrair dados de outros sistemas / Tech Crunch

Em uma postagem no blog, a Fundação Wikimedia, organização responsável pela popular enciclopédia online, fez um apelo aos desenvolvedores de IA para que usem seu conteúdo de forma “responsável”, garantindo que suas contribuições sejam devidamente atribuídas e que o conteúdo seja acessado por meio de seu produto pago, a plataforma Wikimedia Enterprise.

O produto pago, que exige adesão opcional, permite que empresas usem o conteúdo da Wikipédia em larga escala sem “sobrecarregar severamente os servidores da Wikipédia”, explica a postagem da Fundação Wikimedia. Além disso, a natureza paga do produto permite que empresas de IA apoiem a missão sem fins lucrativos da organização.

#Wikipedia #LLMs

via Tech Crunch

Disponível em: https://techcrunch.com/2025/11/10/wikipedia-urges-ai-companies-to-use-its-paid-api-and-stop-scraping/

Amazônia IA

Amazônia IA

A Amazônia IA é a Inteligência Artificial do Brasil. Um modelo de linguagem grande (LLM) com potência computacional no mesmo nível dos maiores modelos do mundo. Com uma grande diferença. A Amazônia IA nasceu no Brasil. Criado por pesquisadores brasileiros, nativo em português, treinado com toda cultura, riqueza natural e criatividade brasileiras.

#LLMs #Amazônia #IA

Disponível em: https://amazoniaia.com.br/

LLM é uma camada de apresentação na pesquisa de IA / DEJAN

LLM é uma camada de apresentação na pesquisa de IA / DEJAN

Existe um mito persistente de que os modelos de linguagem de grande porte (LLMs) substituíram fundamentalmente a busca. Na verdade, os LLMs não rastreiam a web, não mantêm índices e não impõem algoritmos de classificação em escala da internet. Eles operam como camadas de apresentação e raciocínio sobre o pipeline clássico de recuperação de informação (RI).

O artigo recente “Por que os Modelos de Linguagem Alucinam” (Kalai, Nachum, Vempala, Zhang, 2025) mostra por que essa distinção é importante: os LLMs inevitavelmente alucinam devido a limites estatísticos e incentivos de avaliação. Sem base em sistemas de recuperação reais, eles não podem fornecer buscas confiáveis.

#IA #LLMs #RecuperaçãoDaInformação

Disponível em: https://dejan.ai/blog/llm-is-a-presentation-layer-in-ai-search/

Linguística para uma inteligência artificial (IA) brasileira / SciELO

Linguística para uma inteligência artificial (IA) brasileira / SciELO

A proposta de curadoria da Plataforma da Diversidade Linguística Brasileira, que reúne dados estruturados e documentados de diferentes variedades do português brasileiro e de outras línguas do Brasil, está diretamente alinhadas às metas da ação para ampliar a oferta de conjuntos de dados nacionais e permitir o desenvolvimento de um LLM que seja sensível à diversidade real do uso da língua no Brasil.

Em vez de replicar padrões de traduções do inglês, os dados estruturados sob curadoria da Plataforma da Diversidade Linguística Brasileira possibilitam o treino de LLMs que reflitam a realidade linguística brasileira, essencial para o sucesso de aplicações tecnológicas nas áreas de saúde, educação, justiça, inclusão digital e outros setores estratégicos.

#LLMs #Linguística

via SciELO

Disponível em: https://blog.scielo.org/blog/2025/07/18/linguistica-para-uma-inteligencia-artificial-ia-brasileira/

O uso da engenharia de prompts e seu impacto na prática do profissional da informação / Charlley Luz

O uso da engenharia de prompts e seu impacto na prática do profissional da informação

Este estudo examinou o uso de prompts na geração de respostas pela LLM (Large Language Model), destacando aspectos relevantes em termos de clareza, concisão, interpretação dos prompts e qualidade das respostas geradas. Observou-se que as respostas da LLM conseguiram atingir os objetivos de clareza e concisão, fornecendo informações pertinentes e enxutas, mesmo quando os prompts não especificavam claramente o contexto.
A partir dos exemplos de dados fornecidos, foi possível especializar as respostas, adaptando-as ao contexto do ambiente hospitalar, o que demonstra a capacidade da LLM em interpretar e utilizar os prompts de forma eficaz. Além disso, as respostas foram direcionadas de acordo com as necessidades específicas de cada solicitação, evidenciando uma abordagem personalizada e fundamentada na ciência da informação.

#EngenhariaDePrompts #LLMs

Disponível em: https://www.researchgate.net/publication/387294311_O_USO_DA_ENGENHARIA_DE_PROMPTS_E_SEU_IMPACTO_NA_PRATICA_DO_PROFISSIONAL_DA_INFORMACAO

A escala inacreditável do problema dos livros pirateados da IA

A escala inacreditável do problema dos livros pirateados da IA

Documentos judiciais divulgados ontem à noite mostram que o gerente sênior sentiu que era “muito importante para [Meta] obter livros o mais rápido possível”, pois “os livros são, na verdade, mais importantes do que os dados da web”. Os funcionários da Meta voltaram sua atenção para a Library Genesis, ou LibGen, uma das maiores bibliotecas piratas que circulam online. Atualmente, ela contém mais de 7,5 milhões de livros e 81 milhões de artigos de pesquisa. Por fim, a equipe da Meta obteve permissão da “MZ” — uma aparente referência ao CEO da Meta, Mark Zuckerberg — para baixar e usar o conjunto de dados.

via The Atlantic

#IA #Pirataria #LLMs #Llama3

Disponível em: https://www.theatlantic.com/technology/archive/2025/03/libgen-meta-openai/682093/?gift=iWa_iB9lkw4UuiWbIbrWGYDRoX8kfg3ZQZL6J-W0kQE

A adoção generalizada da escrita assistida por modelos de linguagem ampla em toda a sociedade / Arxiv

A adoção generalizada da escrita assistida por modelos de linguagem ampla em toda a sociedade

No final de 2024, cerca de 18% do texto de reclamação de consumidores financeiros parece ser assistido por LLM, com padrões de adoção amplamente espalhados por regiões e um pouco mais altos em áreas urbanas. Para comunicados de imprensa corporativos, até 24% do texto é atribuível a LLMs. Em anúncios de emprego, a escrita assistida por LLM responde por pouco menos de 10% em pequenas empresas e é ainda mais comum entre empresas mais jovens. Os comunicados de imprensa da ONU também refletem essa tendência, com quase 14% do conteúdo sendo gerado ou modificado por LLMs.

#LLMs #Escrita

Disponível em: https://arxiv.org/abs/2502.09747

Meta se prepara para desafiar a ChatGPT e Google Gemini com seu próprio chatbot / WWWhatsNews

Meta se prepara para desafiar a ChatGPT e Google Gemini com seu próprio chatbot

A notícia do chatbot da Meta não passou despercebida. Sam Altman, CEO da OpenAI, reagiu com um comentário sarcástico na rede social X (antigo Twitter): “Ok, tudo bem, talvez façamos um aplicativo social.” Esta mensagem parece uma zombaria direta da Meta, uma empresa historicamente focada em mídias sociais que agora está se aventurando no mundo dos chatbots.

#Chatbot #LLMs

via WWWhatsNews

Disponível em: https://wwwhatsnew.com/2025/02/28/meta-se-prepara-para-desafiar-a-chatgpt-y-google-gemini-con-su-propio-chatbot/