Perusahaan kecerdasan buatan (AI) DeepSeek kembali menuai kontroversi. Model AI penalaran terbaru mereka, R1-0528, yang diluncurkan pekan lalu, menunjukkan performa tinggi dalam berbagai tolok ukur matematika dan pengkodean. Namun, keberhasilan ini dibayangi oleh tuduhan serius: penggunaan data dari model AI pesaing, khususnya Google Gemini.
Tuduhan ini bukan yang pertama kali ditujukan kepada DeepSeek. Sejarah perusahaan ini diwarnai kontroversi serupa, menunjukkan pola yang mengkhawatirkan dalam praktik pengembangan AI mereka.
Tuduhan Penggunaan Data Google Gemini
Sejumlah peneliti AI menduga DeepSeek memanfaatkan data dari model AI Gemini milik Google dalam pelatihan R1-0528. Bukti yang diajukan, meskipun tidak sepenuhnya kuat, cukup mengkhawatirkan.
Sam Paech, seorang pengembang Australia yang menciptakan evaluasi “kecerdasan emosional” untuk AI, mengklaim memiliki bukti kemiripan gaya respons dan pilihan kata antara R1-0528 dengan Gemini 2.5 Pro. Klaim serupa juga datang dari pengembang lain yang menciptakan evaluasi kebebasan berbicara AI, SpeechMap.
DeepSeek sendiri masih bungkam dan belum memberikan klarifikasi resmi mengenai sumber data pelatihan model R1-0528 mereka. Ketidaktransparanan ini semakin memperkuat kecurigaan mengenai praktik mereka.
Jejak Kontroversi DeepSeek: Dari ChatGPT hingga Microsoft
Ini bukanlah kali pertama DeepSeek dituduh menggunakan data dari model AI pesaing. Pada Desember lalu, model DeepSeek V3 sering mengidentifikasi dirinya sebagai ChatGPT, memicu dugaan penggunaan log percakapan ChatGPT dalam proses pelatihannya.
Lebih lanjut, awal tahun 2025, OpenAI menemukan bukti bahwa DeepSeek menggunakan teknik distilasi – meniru keluaran model yang lebih kuat untuk melatih model baru mereka. Meskipun distilasi sendiri bukan praktik ilegal, hal ini melanggar ketentuan layanan OpenAI.
Bahkan, Microsoft, mitra besar OpenAI, juga mendeteksi aktivitas mencurigakan berupa pengambilan data dalam jumlah besar melalui akun pengembang OpenAI pada akhir 2024, yang diduga terkait dengan DeepSeek.
Respons Industri dan Dampaknya terhadap Pengembangan AI
Kontroversi DeepSeek telah mendorong reaksi dari perusahaan-perusahaan besar di industri AI. Google mulai meringkas jejak berpikir model Gemini untuk mencegah pengambilan data oleh pesaing.
Anthropic juga mengumumkan langkah serupa dengan meringkas jejak berpikir model Claude mereka. OpenAI, sebagai pihak yang paling terdampak, menetapkan verifikasi identitas resmi untuk mengakses model-model canggih mereka, dan menghentikan akses dari China.
Insiden ini menyoroti perlunya transparansi dan etika yang lebih kuat dalam pengembangan AI. Praktik mengambil data model AI pesaing tanpa izin tidak hanya merugikan perusahaan yang modelnya dicuri, tetapi juga dapat merusak kepercayaan publik pada teknologi AI secara keseluruhan. Regulasi yang lebih ketat kemungkinan besar akan diperlukan untuk mencegah kejadian serupa di masa depan.
Ke depan, peningkatan transparansi dan penegakan aturan yang lebih ketat dalam penggunaan data pelatihan AI akan menjadi krusial untuk menjaga integritas dan kepercayaan pada inovasi di bidang ini. Kejadian yang melibatkan DeepSeek menjadi pembelajaran berharga bagi seluruh industri agar lebih bertanggung jawab dan etis dalam mengembangkan AI.