Salvatore Sanfilippo argumenta que a IA já é útil no código, ainda é crua em música e audiolivros, e só funciona na arte quando o gosto e a seleção continuam humanos.
<p>A tese central de Sanfilippo é direta: a IA já é boa o bastante para mudar a programação, mas ainda está longe de substituir o julgamento humano que faz a arte funcionar. Ele diz que a diferença é estrutural, não sentimental. O código tem grandes conjuntos de treinamento, testes claros e um domínio em que o reinforcement learning pode premiar algo que funciona. Música, texto, ilustração e trabalho com voz, por outro lado, ainda dependem de gosto, seleção e técnica que os modelos não entregam de forma confiável.</p>
Sanfilippo começa argumentando que a programação é o campo mais exposto à IA, justamente porque os modelos de linguagem são excepcionalmente bons nisso. O motivo, diz ele, é prático: há código em abundância na internet, o reinforcement learning pode ser usado e o resultado pode ser testado para ver se funciona. Isso torna os ganhos mais difíceis de descartar como mera novidade.
O resultado do uso dessas ferramentas é código funcionando, muitas vezes até melhor do que se poderia obter de outra forma.
Nós, programadores, estamos neste momento na pior condição de todas.
Ele liga essa vulnerabilidade à própria natureza da programação. É uma tarefa de linguagem, diz ele, mas também um campo com um vasto corpus de treinamento e um ciclo de feedback que pode premiar a correção de um jeito que a arte muitas vezes não consegue. Na sua visão, essa combinação faz do software o caso mais limpo de substituição por máquinas, mesmo que os melhores resultados ainda venham com direcionamento e supervisão humanos.
O domínio da programação é em parte verificável, então o reinforcement learning funcionou de uma maneira superior ali do que nos outros campos.
Quando ele entra em música e escrita, Sanfilippo diz que o equilíbrio muda drasticamente. Ferramentas de música generativa, na sua visão, produzem lixo, enquanto modelos de escrita podem ser levados a uma prosa decente, mas não a boas histórias. O ingrediente que falta não é volume de saída, e sim discernimento: alguém ainda precisa saber o que vale a pena manter.
Elas produzem o lixo mais puro.
Elas conseguem escrever boa prosa, se muito guiadas, mas não conseguem escrever boas histórias.
O ponto maior dele é que a IA não elimina a necessidade de gosto, porque é o gosto que decide se uma linha de diálogo é apenas aceitável ou realmente viva. Ele diz que a máquina pode propor material, mas um humano ainda precisa selecionar, rejeitar e revisar até que isso se torne coerente. Sem esse filtro, argumenta, o resultado é só uma mistura de fragmentos ruins, decentes e bons que nunca se soma a nada.
Na base ainda precisa haver uma profunda capacidade de seleção por parte do ser humano.
Caso contrário, o que você obtém é uma mistura de coisas ruins, coisas decentes e coisas boas que, sem seleção e retrabalho, ainda termina em nada de bom.
Sanfilippo duvida que a IA vá acabar com músicos ou artistas, mas é igualmente cético em relação à economia cultural que já os cerca. Ele diz que a música mainstream há muito recompensa um punhado minúsculo de hits e rostos conhecidos, enquanto o público é treinado pela repetição a gostar do que lhe é servido. Nessa leitura, a IA não é a ameaça original; o mercado já foi construído para achatar o gosto.
As pessoas, em média, têm capacidade estética crítica zero.
As músicas do Sanremo me impressionam porque parecem coisas que você poderia inventar em três segundos.
Ele estende esse ceticismo à economia da arte. Músicos já lutam para ganhar a vida, diz ele, e escritores quase nunca conseguiram isso em primeiro lugar. Por isso, argumenta, a ideia de que a IA está destruindo de forma única os meios de subsistência artísticos ignora uma verdade mais dura: o mercado já era hostil à maioria dos artistas.
A música é uma subsecção de uma subsecção, você nunca pode viver disso.
Escrever nunca foi algo de que se vivia.
Onde Sanfilippo soa mais exasperado é na geração de áudio. Ele diz que texto para fala ainda está muito aquém do necessário para um audiolivro convincente, mesmo quando os benchmarks técnicos parecem impressionantes. Ele testou o Gemini 3.1 Flash TTS em uma de suas próprias histórias, a segmentou com o Claude e a renderizou com Python, apenas para descobrir que o resultado era tecnicamente polido, mas dramaticamente errado.
A qualidade do áudio é excelente, a entonação não é nem um pouco robótica, mas ler bem um audiolivro é outra coisa.
Todas as vozes que eu testei eram vozes como a de uma péssima atriz de Boris, maldita seja.
O que mais o incomoda é a impaciência da indústria. Ele diz que as empresas estão empurrando a produção automática de audiolivros para evitar pagar atores e narradores, e depois tratando o resultado barato como prova de que a tecnologia está pronta. O desfecho, argumenta ele, é slop, e a culpa recai menos sobre as redes neurais do que sobre organizações que as usam antes de estarem boas o suficiente.
Eles deram o passo além da conta para não pagar os artistas, os atores, as atrizes.
Isso é um motivo para odiar o capitalismo, não as redes neurais.
Sanfilippo encerra separando capacidade técnica de consequência cultural. Ele diz que os modelos de imagem estão melhorando, que ilustradores podem usá-los como ferramentas e que até algumas produções visualmente polidas podem ajudar pessoas com gosto, mas sem recursos. Ainda assim, ele volta sempre à mesma linha: o artista humano continua sendo o seletor, o editor, quem decide o que conta.
Essas são ferramentas muito interessantes, elas permitem que quem tem gosto faça a capa do disco sozinho.
Não vejo o desaparecimento dos músicos no horizonte.
Ainda assim, sua conclusão não é que a IA deixe a arte intocada, e sim que ela ainda não tomou o espaço da parte da arte que mais importa para ele. Ele aponta a banda microtonal Yin como exemplo de música nova que ainda pode soar específica, mesmo que se apoie em formas mais antigas e talvez irrite ouvidos conservadores. Para ele, isso é prova de que a arte não está morrendo, apenas sendo classificada em usos melhores e piores de novas máquinas.
A arte certamente não está no fim por causa da IA.
O problema não são as redes.
Por que Sanfilippo acha que os programadores estão mais expostos?
Ele diz que a programação oferece à IA a melhor combinação de dados abundantes, estrutura parecida com linguagem e resultados verificáveis. Isso faz dela o campo em que os modelos conseguem produzir resultados funcionais mais rápido.
Ele acha que a IA consegue escrever histórias?
Não muito, segundo Sanfilippo. Ele diz que alguns modelos conseguem gerar boa prosa se forem bem orientados, mas ainda não conseguem escrever boas histórias por conta própria.
Qual é a visão dele sobre IA na música?
Ele é desdenhoso das ferramentas musicais automáticas atuais. Na visão dele, elas basicamente geram resultados horríveis e não substituem o julgamento estético que torna uma faixa digna de ser ouvida.
Por que ele está tão irritado com audiolivros de IA?
Ele acha que as empresas estão usando automação para evitar pagar narradores e atores. O resultado, diz ele, é um áudio barato e ruim vendido como se fosse um problema resolvido.
Ele acredita que a IA vai acabar com a arte?
Não. Ele diz que a IA pode mudar fluxos de trabalho e aumentar a produção, mas não fará os artistas desaparecerem porque gosto e seleção continuam sendo humanos.
Resumo assistido por IA do podcast de Salvatore Sanfilippo, conferido com a transcrição original.