hisham hm

🔗 What every programmer should know about what every programmer should know

I won’t deny it. I came up with the title for this post before coming up with the actual content. It came to my head and it was just too good to pass, because it entices you to think about that subject. What does every programmer need to know, after all?

If you run into any other of those lists, let me know at h@ this website’s domain!

🔗 A degradação da web em tempos de IA não é acidental

Essa semana essa imagem, aparentemente originada do Reddit, circulou pelo Mastodon:

Continuei dando scroll e vendo outras pessoas postando outros exemplos, demonstrando que o scraping de IA do Google pega trechos de posts compartilhados em redes sociais e os afirma como fatos nos resultados de busca, mesmo quando eram satíricos.

Basicamente, hoje em dia, dizer “eu vi no Google” e nada, é a mesma coisa. Em termos práticos, é basicamente impossível convencer o público em geral a parar de usar o Google, migrar para outras opções como o DuckDuckGo (e lembrá-los de desabilitar os anti-recursos de IA do DuckDuckGo!). O único conselho prático que se pode dar que eu tenho alguma esperança que as pessoas possam seguir é: se a busca no Google deu uma resposta direta nessas caixinhas, ignore e siga algum link pra um site editado por humanos, como a Wikipedia.

Comentando sobre isso com a minha família, comentaram como as respostas de IA são ruins comparadas com a do ChatGPT, pois às vezes o Google sequer acerta o assunto. De certa forma, o ChatGPT acertar o assunto é até pior, pois não é mais correto, apenas mais convincente.

O que temos que lembrar é que o que chamam de “IA” hoje são modelos de linguagem, não modelos de informação. O ChatGPT “fala melhor”, mas mente tanto quanto.

Isso nos leva à questão: por que investir bilhões em sistemas computacionais que efetivamente mentem? Lembrando que não há razões técnicas pra acreditar que eles vão deixar de mentir. O discurso de “ah, mas eles ficarão melhores com o tempo” é um discurso de marketing, não da ciência. Os grandes players já consumiram toda a informação disponível na internet, e estão reclamando que está faltando dados novos para treinamento, e a Amazon reclamou recentemente que ao tentar varrer a internet para obter dados para um sistema de tradução automática, a qualidade do material era muito baixa… porque grande parte do texto disponível na web hoje são textos de baixa qualidade gerados via IA.

A razão, portanto, não é técnica. Ela é econômica, e, com isso, inseparavelmente política—uma vez que a política é fonte de poder econômico e vice-versa.

Em suma, estamos vivendo uma era surreal: os poderosos estão fazendo uma guerra contra a realidade.

A realidade, especialmente aquela que alcança a todos, mete medo. Vimos uma primeira onda disso em 2011, em tempos de primavera árabe e Occupy Wall Street. Foi, como chamou Zizek, o ano em que sonhamos perigosamente. E dali continuou. As demonstrações de organização popular online que aconteceram em 2020, dos negros no Black Lives Matter, das mulheres no #MeToo a partir de 2017, dos trabalhadores da informática falando em sindicalização na pandemia, botaram medo nas estruturas de poder.

A onda de layoffs na indústria de informática em 2022, um movimento feito em concerto por grandes empresas e também pelas menores controladas por firmas de venture capital, todas demitindo entre 5% e 15% dos funcionários (e abrindo vagas logo em seguida), foi um espasmo contra a reação dos trabalhadores. Na mesma época, bilionários da informática começaram a se manifestar de forma mais explícita politicamente—reagindo, em direção oposta, a um movimento similar iniciado pelos próprios trabalhadores da área.

Os concentradores do poder no mundo da informática estão trabalhando pra desmantelar a estrutura descentralizada da internet. Eles têm feito isso há anos através do poder centralizador do Google, mas o Google antes agregava links, era como um tronco de uma árvore que ia pra múltiplos lugares. Agora o Google responde ele mesmo, distorcendo as respostas.

É o mesmo padrão em todas as empresas de IA. A OpenAI varre a internet sugando a escrita dos outros, mas ao invés de gerar um índice de links como o Google fazia, coleta tudo dentro de um modelo que regurgita informação e desinformação conforme critérios de filtragem que ninguém além deles mesmo têm acesso.

O objetivo é calar o povo, calar a internet. Antes, através dos links, a internet falava, enquanto voz das pessoas. Agora quem fala são as poucas mega-empresas através dos seus porta-vozes artificiais.

A Meta anunciou agora que nas suas redes sociais eles vão começar a promover ativamente influencers artificiais. São movimentos para gradualmente ocupar todos os espaços da internet onde antes se via a voz das pessoas.

Quando falei dessa notícia da Meta com minha família, a reação foi de espanto. Mas essas notícias só chocam quando são novidade. Depois as pessoas baixam a cabeça e aceitam. Quando o Google começou a botar mentiras no topo das páginas de resultados todo mundo achou chocante. Hoje todo mundo baixa a cabeça, dá de ombros e usa mesmo assim, dizendo “é a vida”. Hoje mesmo vi um screenshot do Google dizendo que 1,378 polegadas é o mesmo que 1¼ polegadas (só para relembrar, 1¼ é 1,25).

Esses tempos vi um YouTuber dizendo que calculou as medidas de um móvel no ChatGPT e depois teve que jogar fora as tábuas porque foram cortadas errado. Imagine quantas vezes por dia, com milhões de pessoas usando o ChatGPT para buscar informação, coisas desse tipo não acontecem. Imagine quais coisas mais sérias do que um móvel estragado podem estar sendo vítimas de desinformação.

A IA, tal como essas empresas promovem, não é “só mais uma ferramenta, que como todas pode ser usada para o bem ou para o mal”, contra-argumento que sempre ouvimos. Os algoritmos de machine learning que viabilizam esses produtos são sim as ferramentas neutras. Eles têm inúmeras aplicações excelentes e benéficas para a humanidade. Já esses produtos — ChatGPT, Google Gemini, Grok, etc. — são projetados, com bilhões de dólares por trás, com objetivos bem específicos e donos que têm projetos políticos cada vez mais explícitos.

Assim, dá pra entender a raiva do Elon Musk contra a Wikipedia, que é um dos últimos sites grandes da internet que preza por tentar coletar informação real e não lixo de IA. Musk tem uma visão de mundo clara: uma visão controlada pelo poder econômico (dele próprio, claro), com desprezo pela democracia e por outros povos, e sustentado por ligações corruptas entre o estado e o interesse privado, ao mesmo tempo que brada sobre a grandeza do país. Deixo aos leitores o exercício de dar um nome a essa ideologia. A sua tática de chamar tudo o que é contra a visão de mundo dele de “woke” funciona com muita gente, apelando à insegurança das pessoas quanto a um mundo em constante mudança.

Mas isso é uma cortina de fumaça. O que incomoda é o fato de que, no meio de uma tela cheia de informações falsas e links patrocinados como na imagem acima, ainda existe frequentemente perto do topo o link para a Wikipedia, um site é que produzido por um coletivo de seres humanos, dedicados a coletar e redistribuir seu conhecimento, de forma aberta e gratuita. Que são dedicados a revisar e corrigir seus erros, e buscar algo que sirva como uma representação da realidade à nossa volta. Não era esse afinal o o ideal das ciências, tanto exatas como humanas?

É sobre a disseminação da informação chegar a todos, e não sobre um mundo controlado por alguém que acha que pra atender a seus interesses econômicos pode nos derrubar a hora que quiser.


Follow

🐘 MastodonRSS (English), RSS (português), RSS (todos / all)


Last 10 entries


Search


Admin