To be clear: it appears it is legal, at least in the USA, to buy a used copy of a physical book (used = the author gets nothing), chop the spine off, scan the pages, discard the paper copy and then train on the scanned content. The transformation from paper to scan is “fair use”.
https://simonwillison.net/2025/Sep/6/anthropic-settlement/#atom-everything
Menarik, jadi seperti itu sistem “fair use” untuk penggunaan bahan ajar LLM untuk AI tools. Jadi perusahaan bisa beli buku 2nd hand, scan dan dijadikan bahan pengetahuan AI.
Tentu saja ini belum termasuk paper research, artikel internet, forum, blog dan berbagai informasi di internet.
Oh btw, kalau mau rekap mengenai kasus denda Anthropic terkait penggunaan buku-buku secara tidak resmi sebagai bahan ajar LLM, bisa dilihat disini: https://pxlnv.com/linklog/anthropic-proposed-settlement/