Apakah AI Training Data Kena Pajak?

konsultanpajak.or.id/ Apakah AI Training Data Kena Pajak? Sekarang semua orang lagi heboh soal AI. Dari ChatGPT, MidJourney, sampe AI bikin musik. Semua keren, semua bikin kagum, tapi di balik layar ada satu bahan bakar utama: data. AI itu gak bisa hidup tanpa data. Data jadi “bensin” buat mesin learning. Dan data itu dikumpulin dari mana-mana: internet, database, riset, bahkan data pribadi.

Pertanyaannya muncul: kalau data itu punya nilai ekonomi, kalau data itu jadi bahan baku buat bikin AI yang bisa cuan miliaran dolar, apakah data training bisa kena pajak?

Bayangin gini. Perusahaan AI ngumpulin data miliaran teks, gambar, suara. Mereka latih model gede, terus jual produknya. Value-nya gila-gilaan. OpenAI aja nilainya tembus ratusan miliar dolar. Google, Meta, semua rebutan. Nah, kalau ada value segede itu, negara mana sih yang gak kepikiran narik pajak?

Masalahnya: posisi “pajak” dalam data training itu gak jelas. Apakah dianggap kayak bahan baku produksi? Kalau iya, berarti bisa kena PPN kayak beli barang biasa. Atau dianggap intangible asset alias aset tak berwujud? Kalau gitu, bisa masuk ke pajak royalti atau hak cipta.


Indonesia sendiri belum ada aturan spesifik. UU Pajak kita lebih familiar sama hal-hal klasik: barang, jasa, aset, transaksi. Data masih dianggap barang aneh. Padahal, UU PDP (Perlindungan Data Pribadi) udah ngakuin data pribadi sebagai sesuatu yang berharga. Tapi itu lebih ke arah privasi, bukan pajak.

Di luar negeri, diskusinya mulai jalan. Uni Eropa misalnya, lagi nyusun regulasi AI Act. Bukan pajak langsung, tapi ada implikasi ekonomi. Kalau data training dianggap punya value komersial, bisa aja suatu saat ada tarif pajak tambahan buat perusahaan AI yang ngolah data itu.


Kita tarik ke analogi industri klasik. Dulu, ketika minyak pertama kali dieksploitasi, orang cuma mikir itu sekadar cairan hitam. Lama-lama ketahuan, minyak itu sumber energi. Langsung muncul regulasi, pajak, royalti. Data training AI bisa ngalamin hal serupa. Hari ini mungkin dianggap “gratisan dari internet.” Besok bisa dianggap “komoditas pajak.”


Masalah tricky muncul: siapa pemilik data? Kalau AI scraping data dari jutaan website, apakah pajaknya dibayar ke negara asal perusahaan? Atau dibagi ke negara tempat data berasal? Misalnya, model AI dilatih pake artikel berita dari Indonesia. Apakah RI bisa klaim hak pajak?

Kondisi ini mirip banget sama ribut pajak digital services. Negara-negara berebut. AS bilang pajak harus ke perusahaan mereka. Uni Eropa bilang harus ada revenue sharing global. OECD sampai bikin BEPS 2.0. Tapi sampe sekarang pun ribet. Jadi bayangin nanti kalau data training ikut diperebutkan.


Kita kasih contoh lebih dekat. Startup AI di Jakarta ngumpulin data dari jutaan pengguna aplikasi. Data itu dipake buat latih AI voice recognition. Lalu mereka jual ke klien luar negeri. Ada dua hal: pertama, perusahaan jelas dapet revenue. Kedua, data training itu sumber revenue. Kalau gitu, wajar dong kalau DJP mikir: “eh, ini harus dipajakin.”

baca juga

Tapi apakah pajaknya di level data raw, atau setelah model jadi produk? Itu masih gelap.


Ada juga isu “double counting.” Data bisa dipakai berkali-kali buat training. Apakah pajaknya dihitung sekali aja waktu data dikumpulin? Atau tiap kali dipake lagi buat model baru? Kalau tiap kali, bisa gila-gilaan. Perusahaan bisa ngerasa dicekik. Kalau cuma sekali, negara bisa ngerasa rugi.


Pro dan kontra mulai kelihatan.

Pro:

  • Pajak training data bikin perusahaan AI lebih accountable. Mereka gak bisa terus-terusan eksploitasi data gratisan.
  • Bisa jadi sumber pendapatan baru. Apalagi buat negara berkembang kayak Indonesia yang pengen digital tax lebih kuat.
  • Dorong fairness. Perusahaan AI besar bayar, negara dapet.

Kontra:

  • Sulit nentuin nilai data training. Apalagi kalau sumbernya internet publik.
  • Bisa hambat inovasi startup kecil. Mereka bisa keok duluan karena gak kuat bayar pajak.
  • Risiko privasi makin gede. Negara bisa “mengintip” data training buat ngecek pajak. Itu bisa bikin warga gak nyaman.

Kalau mau realistis, ada beberapa opsi skema pajak.

Pertama, treat training data kayak “bahan baku digital.” Jadi kena PPN. Kalau perusahaan AI impor dataset, misalnya dari luar negeri, bisa kena pajak impor digital.

Kedua, treat training data kayak “royalti.” Jadi tiap kali dipake buat komersialisasi, ada fee ke negara.

Ketiga, bikin kategori baru: AI Data Levy. Mirip kayak cukai. Jadi perusahaan AI bayar retribusi khusus karena pake data massal buat komersial.


Di Indo, bisa jadi ini jalan. Karena pemerintah udah punya rencana pajak ekonomi digital. Mulai dari pajak e-commerce, pajak fintech, sampe wacana digital service tax. Nambahin pajak training data bisa jadi langkah berikutnya.

Tapi harus hati-hati. Kalau buru-buru, bisa bikin investor kabur. Kalau terlalu longgar, bisa bikin data kita dijarah gratisan sama Big Tech luar. Dilema klasik.


Jadi, apakah AI training data bakal kena pajak? Jawabannya: belum sekarang. Tapi kemungkinan besar, iya, di masa depan. Karena tren pajak selalu ngikut duit. Dan duit sekarang lagi pindah ke AI.


Kalau besok ada headline: “RI Siapkan Pajak Training Data untuk Perusahaan AI,” jangan kaget. Itu cuma tanda bahwa negara mulai sadar: data bukan cuma privasi. Data adalah komoditas. Dan setiap komoditas yang bernilai… ujungnya pasti dipajakin.


Mau gue bikinin simulasi angka kasar? Misalnya, kalau satu model AI butuh dataset 1 miliar kata, terus tiap kata dihitung bernilai Rp1, pajaknya bisa jadi berapa? Biar kebayang scale duitnya kalau training data beneran kena pajak.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top