Teknologi di balik Kecerdasan Buatan (AI) generatif menawarkan visi masa depan yang menakjubkan, tetapi Ed Newton-Rex, seorang pakar di bidang ini, menegaskan bahwa praktik mencuri karya kreatif dunia untuk membangun model-model AI adalah tindakan yang tidak adil dan tidak berkelanjutan. Ia menyoroti bahwa perusahaan AI menghabiskan miliaran dolar untuk sumber daya manusia (insinyur) dan komputasi (GPU), tetapi mengharapkan sumber daya ketiga, yaitu data pelatihan, diambil secara gratis.
Kompetisi yang Tak Terhindarkan
Saat ini, banyak perusahaan AI melatih model mereka menggunakan web scraper untuk mengunduh dan melatih konten tanpa izin atau pembayaran, termasuk karya berhak cipta seperti artikel berita dan media bajakan. Praktik ini telah menjadi standar industri, padahal pelatihan AI melibatkan penyalinan yang tunduk pada kerangka hukum hak cipta. Konsekuensi negatif dari pelatihan tanpa lisensi ini sangat serius: AI generatif secara langsung bersaing dengan data yang melatihnya.
Model bahasa besar yang dilatih dengan cerita pendek dapat menghasilkan cerita pendek yang menjadi pesaing. Model musik AI dapat menciptakan musik yang menyaingi lagu-lagu berlisensi untuk acara TV. Kompetisi ini bukan lagi teoretis. Bukti menunjukkan bahwa permintaan untuk tugas penulisan freelance telah berkurang secara signifikan, dan seniman seperti Kelly McKernan melaporkan penurunan pendapatan sebesar 33% setelah karyanya digunakan untuk melatih model gambar AI populer. Para kreator berpendapat bahwa tidak mungkin pengecualian fair use dalam hukum hak cipta dapat digunakan untuk melegitimasi eksploitasi massal karya kreatif untuk menciptakan pesaing otomatis.
Solusi: Lisensi yang Adil dan Transparan
Para kreator dan Newton-Rex sendiri mengusulkan solusi yang telah teruji: lisensi. Jika entitas komersial ingin menggunakan karya berhak cipta, mereka harus melisensikannya. Perusahaan AI sering berargumen bahwa lisensi tidak praktis karena jumlah data yang digunakan sangat banyak, tetapi Newton-Rex membantah argumen ini dengan menunjukkan beberapa opsi yang layak:
Kesepakatan Lisensi: Sudah ada puluhan kesepakatan besar antara perusahaan AI dan pemegang hak cipta.
Berbagi Pendapatan: Startup kecil terbukti mampu melisensikan data mereka tanpa biaya di muka yang besar, seringkali menggunakan model berbagi pendapatan (revenue share).
Data Domain Publik dan Sintetis: Model dapat menggunakan data domain publik (tanpa hak cipta) atau data sintetis yang dibuat sendiri oleh AI.
Newton-Rex, yang pernah merilis model musik AI yang dilatih dengan musik berlisensi, mendirikan Fairly Trained, sebuah organisasi nirlaba yang memberikan sertifikasi kepada perusahaan AI generatif yang tidak melatih model mereka menggunakan karya berhak cipta tanpa lisensi. Perusahaan-perusahaan ini mengambil beragam pendekatan lisensi, mulai dari membayar biaya di muka hingga berbagi pendapatan dengan penyedia data.
Dampak dan Seruan untuk Aksi
Penelitian menunjukkan bahwa 60% masyarakat umum tidak setuju dengan kebijakan perusahaan AI yang melatih model pada data yang tersedia secara publik tanpa kompensasi, dan 74% mendukung kompensasi bagi penyedia data. Pelatihan tanpa lisensi ini juga memaksa penerbit menutup akses ke konten mereka, secara bertahap menutup internet terbuka yang bermanfaat bagi semua orang.
Newton-Rex menyimpulkan bahwa AI generatif dan kreativitas manusia dapat hidup berdampingan secara simbiotik, tetapi hal itu harus dimulai dari rasa hormat terhadap nilai karya yang digunakan dan hak-hak pembuatnya. Ia tidak menyerukan penghentian AI, melainkan agar sumber daya yang digunakan untuk membangunnya harus dibayar. Lisensi mungkin memperlambat dalam jangka pendek, tetapi akan menghasilkan model yang sama mumpuni, tanpa memusuhi kreator dunia. Ia mendorong semua pihak, mulai dari karyawan perusahaan AI hingga pengguna, untuk menanyakan data apa yang digunakan oleh model favorit mereka dan menuntut perubahan.
Posting Komentar