🔗 A degradação da web em tempos de IA não é acidental
Essa semana essa imagem, aparentemente originada do Reddit, circulou pelo Mastodon:

Continuei dando scroll e vendo outras pessoas postando outros exemplos, demonstrando que o scraping de IA do Google pega trechos de posts compartilhados em redes sociais e os afirma como fatos nos resultados de busca, mesmo quando eram satíricos.
Basicamente, hoje em dia, dizer “eu vi no Google” e nada, é a mesma coisa. Em termos práticos, é basicamente impossível convencer o público em geral a parar de usar o Google, migrar para outras opções como o DuckDuckGo (e lembrá-los de desabilitar os anti-recursos de IA do DuckDuckGo!). O único conselho prático que se pode dar que eu tenho alguma esperança que as pessoas possam seguir é: se a busca no Google deu uma resposta direta nessas caixinhas, ignore e siga algum link pra um site editado por humanos, como a Wikipedia.
Comentando sobre isso com a minha família, comentaram como as respostas de IA são ruins comparadas com a do ChatGPT, pois às vezes o Google sequer acerta o assunto. De certa forma, o ChatGPT acertar o assunto é até pior, pois não é mais correto, apenas mais convincente.
O que temos que lembrar é que o que chamam de “IA” hoje são modelos de linguagem, não modelos de informação. O ChatGPT “fala melhor”, mas mente tanto quanto.
Isso nos leva à questão: por que investir bilhões em sistemas computacionais que efetivamente mentem? Lembrando que não há razões técnicas pra acreditar que eles vão deixar de mentir. O discurso de “ah, mas eles ficarão melhores com o tempo” é um discurso de marketing, não da ciência. Os grandes players já consumiram toda a informação disponível na internet, e estão reclamando que está faltando dados novos para treinamento, e a Amazon reclamou recentemente que ao tentar varrer a internet para obter dados para um sistema de tradução automática, a qualidade do material era muito baixa… porque grande parte do texto disponível na web hoje são textos de baixa qualidade gerados via IA.
A razão, portanto, não é técnica. Ela é econômica, e, com isso, inseparavelmente política—uma vez que a política é fonte de poder econômico e vice-versa.
Em suma, estamos vivendo uma era surreal: os poderosos estão fazendo uma guerra contra a realidade.
A realidade, especialmente aquela que alcança a todos, mete medo. Vimos uma primeira onda disso em 2011, em tempos de primavera árabe e Occupy Wall Street. Foi, como chamou Zizek, o ano em que sonhamos perigosamente. E dali continuou. As demonstrações de organização popular online que aconteceram em 2020, dos negros no Black Lives Matter, das mulheres no #MeToo a partir de 2017, dos trabalhadores da informática falando em sindicalização na pandemia, botaram medo nas estruturas de poder.
A onda de layoffs na indústria de informática em 2022, um movimento feito em concerto por grandes empresas e também pelas menores controladas por firmas de venture capital, todas demitindo entre 5% e 15% dos funcionários (e abrindo vagas logo em seguida), foi um espasmo contra a reação dos trabalhadores. Na mesma época, bilionários da informática começaram a se manifestar de forma mais explícita politicamente—reagindo, em direção oposta, a um movimento similar iniciado pelos próprios trabalhadores da área.
Os concentradores do poder no mundo da informática estão trabalhando pra desmantelar a estrutura descentralizada da internet. Eles têm feito isso há anos através do poder centralizador do Google, mas o Google antes agregava links, era como um tronco de uma árvore que ia pra múltiplos lugares. Agora o Google responde ele mesmo, distorcendo as respostas.
É o mesmo padrão em todas as empresas de IA. A OpenAI varre a internet sugando a escrita dos outros, mas ao invés de gerar um índice de links como o Google fazia, coleta tudo dentro de um modelo que regurgita informação e desinformação conforme critérios de filtragem que ninguém além deles mesmo têm acesso.
O objetivo é calar o povo, calar a internet. Antes, através dos links, a internet falava, enquanto voz das pessoas. Agora quem fala são as poucas mega-empresas através dos seus porta-vozes artificiais.
A Meta anunciou agora que nas suas redes sociais eles vão começar a promover ativamente influencers artificiais. São movimentos para gradualmente ocupar todos os espaços da internet onde antes se via a voz das pessoas.
Quando falei dessa notícia da Meta com minha família, a reação foi de espanto. Mas essas notícias só chocam quando são novidade. Depois as pessoas baixam a cabeça e aceitam. Quando o Google começou a botar mentiras no topo das páginas de resultados todo mundo achou chocante. Hoje todo mundo baixa a cabeça, dá de ombros e usa mesmo assim, dizendo “é a vida”. Hoje mesmo vi um screenshot do Google dizendo que 1,378 polegadas é o mesmo que 1¼ polegadas (só para relembrar, 1¼ é 1,25).
Esses tempos vi um YouTuber dizendo que calculou as medidas de um móvel no ChatGPT e depois teve que jogar fora as tábuas porque foram cortadas errado. Imagine quantas vezes por dia, com milhões de pessoas usando o ChatGPT para buscar informação, coisas desse tipo não acontecem. Imagine quais coisas mais sérias do que um móvel estragado podem estar sendo vítimas de desinformação.
A IA, tal como essas empresas promovem, não é “só mais uma ferramenta, que como todas pode ser usada para o bem ou para o mal”, contra-argumento que sempre ouvimos. Os algoritmos de machine learning que viabilizam esses produtos são sim as ferramentas neutras. Eles têm inúmeras aplicações excelentes e benéficas para a humanidade. Já esses produtos — ChatGPT, Google Gemini, Grok, etc. — são projetados, com bilhões de dólares por trás, com objetivos bem específicos e donos que têm projetos políticos cada vez mais explícitos.
Assim, dá pra entender a raiva do Elon Musk contra a Wikipedia, que é um dos últimos sites grandes da internet que preza por tentar coletar informação real e não lixo de IA. Musk tem uma visão de mundo clara: uma visão controlada pelo poder econômico (dele próprio, claro), com desprezo pela democracia e por outros povos, e sustentado por ligações corruptas entre o estado e o interesse privado, ao mesmo tempo que brada sobre a grandeza do país. Deixo aos leitores o exercício de dar um nome a essa ideologia. A sua tática de chamar tudo o que é contra a visão de mundo dele de “woke” funciona com muita gente, apelando à insegurança das pessoas quanto a um mundo em constante mudança.
Mas isso é uma cortina de fumaça. O que incomoda é o fato de que, no meio de uma tela cheia de informações falsas e links patrocinados como na imagem acima, ainda existe frequentemente perto do topo o link para a Wikipedia, um site é que produzido por um coletivo de seres humanos, dedicados a coletar e redistribuir seu conhecimento, de forma aberta e gratuita. Que são dedicados a revisar e corrigir seus erros, e buscar algo que sirva como uma representação da realidade à nossa volta. Não era esse afinal o o ideal das ciências, tanto exatas como humanas?
É sobre a disseminação da informação chegar a todos, e não sobre um mundo controlado por alguém que acha que pra atender a seus interesses econômicos pode nos derrubar a hora que quiser.

🔗 Quarta-feira, 10 de julho de 2013
Achievement unlocked: entreguei ontem uma monografia para uma cadeira do doutorado em informática onde consegui enfiar citações de Gilles Deleuze e Félix Guattari, Paul Krugman e Douglas Hofstadter.
E viva o comportamento emergente de sistemas complexos representados pelo crescimento das cidades como um exemplo de caos que demanda a construção de conceitos e estabelecimento de relações para que se faça seu entendimento através da maneira de pensar do design!
🔗 Automatizando a espera na fila do ingresso do GnR
Entrei no site da venda de ingressos pro Guns n’ Roses às 10 da noite (22:02 talvez?).
“Sua posição na fila é 25504”.
Fui até uma meia-noite e pouco olhando o número cair lentamente, até que o Rakan me lembrou que eu sei programar, aí eu escrevi esse script abaixo pra “tocar um alarme” quando a fila chegasse perto no final. Botei o computador do lado da cama e fui dormir. 7 da manhã do dia seguinte, acordo ao som de Nightrain ao vivo. Acompanhei os momentos finais da fila e, enfim, consegui comprar o meu ingresso!
🔗 Os hábitos do software livre…
Li um post de um amigo no Facebook e deu vontade de editar corrigindo um errinho de português (reflexo de ler a Wikipedia, onde eu posso fazer e faço isso).
Aí pensei que como o texto está no nome dele então não seria legal editar direto, mas sim editar uma cópia e enviar um “pull request” pra ele onde ele pudesse ver as mudanças e aceitá-las, atualizando o próprio post em um click (como acontece no Github, site de compartilhamento de código de software livre onde tenho meus projetos). Infelizmente o Facebook não oferece esse recurso.
Por que o mundo em geral não é mais como o mundo do software livre? A Wikipedia tá aí pra mostrar que, se você der pras pessoas ferramentas para atuar colaborativamente, um número suficiente de pessoas vai usá-las de modo a produzir resultados fantásticos.
🔗 Sobre a “nova economia” das empresas da internet
Vi essa imagem no Facebook:
Roteiro comum a todos esses:
- consiga uma graninha de de venture capital (seed money)
- use esse dinheiro para construir uma infraestrutura (site, aplicativo) para prover um serviço de middle-man para facilitar acesso centralizado a alguma coisa qualquer que esteja distribuída
- segundo round de investimento: (Series A round) apresente essa infra aos investidores e levante alguns milhões de venture capital, para sustentar a próxima fase [*]
- ofereça o serviço de middle-man gratuitamente à população, dando a eles a coisa com o preço do mercado (ou a prejuízo, vide: dumping), mas com conveniência maior (afinal, centralizado é sempre mais conveniente que distribuído)
- com a tendência natural de network effect, o serviço acumula usuários a ponto de “todo mundo estar nele” (network effect)
- uma vez que a fase anterior andou suficientemente, a base de usuários (especialmente, do lado dos usuários que provê conteúdo comercialmente à plataforma, os “parceiros”) estará “presa” à sua rede (ie, com esforço investido demais nela para migrar para outra [ex: likes na página da sua empresa no Facebook, pontuação de recomendações no Uber ou Airbnb], vide: vendor lock-in), aí pode “monetizar” em cima deles à vontade, eles não têm pra onde ir.
Resumindo, aparentemente a grande sacada do emprendedorismo moderno é construir um monopólio virtual como atravessador pela internet.
[*] essa fase funciona mais fácil se você estiver na grande San Francisco**
[**] preferencialmente se você já tiver passado pela fase 1 em San Francisco também***
[***] e especialmente se tiver sido por alguma encubadora de lá, tipo YCombinator****
[****] suas chances de entrar na YCombinator aumentam se você vier de alguma universidade tipo MIT ou Caltech
Follow
🐘 Mastodon ▪ RSS (English), RSS (português), RSS (todos / all)
Last 10 entries
- Frustrating Software
- What every programmer should know about what every programmer should know
- A degradação da web em tempos de IA não é acidental
- There are two very different things called "package managers"
- Last day at Kong
- A Special Hand
- How to change the nmtui background color
- Receita de Best Pancakes
- That time I almost added Tetris to htop
- Receita de Orange Chicken