As big techs estão escaneando todos os cantos da internet para treinar seus modelos grandes de linguagem (LLM) usados em inteligência artificial. O Reddit, porém, deseja ser compensado financeiramente pelos dados coletados no fórum, e parece que está difícil chegar a um acordo com a Microsoft.
Em uma entrevista com o The Verge, o CEO do Reddit, Steve Huffman, compartilhou sua visão sobre os acordos que o Reddit já tem com a Google e OpenAI. Ele destacou a importância de saber como os dados serão usados, sem divulgar os valores envolvidos nesse tipo de transação.
“Sem esses acordos, não temos nenhuma influência ou conhecimento em como nossos dados são mostrados e no que eles são usados, o que nos coloca em uma posição agora de bloquear quem não está disposto a entrar em um acordo sobre como gostaríamos que nossos dados sejam usados ou não”, disse Huffman. Ele acrescentou que bloquear empresas como a Microsoft tem sido “um verdadeiro problema”.
Já havia notícias de que a Microsoft havia se recusado a negociar com o Reddit. No entanto, um representante do fórum esclareceu ao Engadget que houve uma tentativa de negociação, mas as empresas não chegaram a um acordo.
Como resultado, o Reddit já bloqueia o Bing de acessar os dados do fórum para seus resultados. A plataforma alega seus termos de serviço e proteção aos usuários como motivo para a restrição: “Qualquer um acessando o conteúdo do Reddit precisa aceitar nossas políticas, incluindo aquelas criadas para proteger os usuários”, disse um porta-voz da empresa ao Engadget. “Somos seletivos sobre com quem trabalhamos e confiamos para acesso em grande escala ao conteúdo do Reddit.”
Com a inteligência artificial generativa ficando cada vez mais popular, as big techs estão ficando cada vez mais agressivas na coleta de dados para treinar seus modelos. Microsoft, Apple, Meta, Nvidia – é difícil encontrar algum exemplo que não se envolva em processos ou reprimendas pela maneira como esses dados têm sido coletados.
Fonte: Adrenaline