Sekarang siapa pun dapat membuat aplikasi yang menggunakan DALL-E 2 untuk menghasilkan gambar

Akhirnya, DALL-E 2, sistem AI penghasil gambar OpenAI, tersedia sebagai API, artinya pengembang dapat membangun sistem tersebut ke dalam aplikasi, situs web, dan layanan mereka. Dalam posting blog hari ini, OpenAI mengumumkan bahwa pengembang mana pun dapat mulai memanfaatkan kekuatan DALL-E 2 — yang sekarang digunakan lebih dari tiga juta orang untuk menghasilkan lebih dari empat juta gambar sehari — setelah mereka membuat akun OpenAI API sebagai bagian dari beta publik.

Harga untuk API DALL-E 2 bervariasi berdasarkan resolusi. Untuk gambar 1024×1024, biayanya $0,02 per gambar; Gambar 512×512 adalah $0,018 per gambar; dan gambar berukuran 256×256 adalah $0,016 per gambar. Diskon volume tersedia untuk perusahaan yang bekerja dengan tim perusahaan OpenAI.

Seperti pada DALL-E 2 beta, API akan memungkinkan pengguna untuk membuat gambar baru dari perintah teks (mis. “kelinci berbulu melompat melalui bidang bunga”) atau mengedit gambar yang ada. Microsoft, mitra dekat OpenAI, memanfaatkannya di Bing dan Microsoft Edge dengan alat Pembuat Gambarnya, yang memungkinkan pengguna membuat gambar jika hasil web tidak menampilkan apa yang mereka cari. Aplikasi desain fesyen CALA menggunakan DALL-E 2 API untuk alat yang memungkinkan pelanggan menyempurnakan ide desain dari deskripsi teks atau gambar, sementara Mixtiles startup foto membawanya ke aliran pembuatan karya seni untuk penggunanya.

Tidak banyak kebijakan yang berubah dengan peluncuran API, yang kemungkinan akan mengecewakan mereka yang takut sistem AI generatif seperti DALL-E 2 dirilis tanpa pertimbangan yang memadai untuk masalah etika dan hukum yang mereka ajukan. Seperti sebelumnya, pengguna terikat oleh ketentuan layanan OpenAI, yang melarang penggunaan DALL-E 2 untuk menghasilkan konten kekerasan, seksual, atau kebencian yang terang-terangan. OpenAI juga terus memblokir pengguna untuk mengunggah gambar orang tanpa persetujuan mereka atau gambar yang tidak berhak mereka gunakan, menggunakan campuran sistem pemantauan otomatis dan manusia untuk menegakkan ini.

Satu perubahan kecil adalah bahwa gambar yang dihasilkan dengan API tidak perlu mengandung tanda air. OpenAI memperkenalkan watermarking selama DALL-E 2 beta sebagai cara untuk menunjukkan gambar mana yang berasal dari sistem, tetapi memilih untuk menjadikannya opsional dengan peluncuran API.

“Kami mendorong pengembang untuk mengungkapkan bahwa gambar dihasilkan oleh AI, tetapi tidak mengharuskan mereka menyertakan tanda tangan DALL-E 2,” kata Luke Miller, manajer produk di OpenAI yang mengawasi pengembangan DALL-E 2, kepada TechCrunch melalui email.

Alat Desainer Microsoft, didukung oleh DALL-E 2 API.

Alat Desainer Microsoft, didukung oleh DALL-E 2 API. Kredit Gambar: Microsoft

OpenAI juga menggunakan filter tingkat prompt dan gambar dengan DALL-E 2, meskipun filter yang dikeluhkan beberapa pelanggan terlalu bersemangat dan tidak akurat. Dan perusahaan telah memfokuskan sebagian dari upaya penelitiannya pada diversifikasi jenis gambar yang dihasilkan DALL-E 2, yang bertujuan untuk memerangi bias yang diketahui menjadi korban sistem AI teks-ke-gambar (mis. menghasilkan sebagian besar gambar putih laki-laki ketika diminta dengan teks seperti “contoh CEO”).

Tetapi langkah-langkah ini tidak menghilangkan setiap kritik. Pada bulan Agustus, Getty Images melarang pengunggahan dan penjualan ilustrasi yang dihasilkan menggunakan DALL-E 2 dan alat serupa lainnya, menyusul keputusan serupa oleh situs termasuk Newgrounds, PurplePort, dan FurAffinity. CEO Getty Images Craig Peters mengatakan kepada The Verge bahwa larangan tersebut dipicu oleh kekhawatiran tentang “masalah hak yang belum terselesaikan”, karena kumpulan data pelatihan untuk sistem seperti DALL-E 2 berisi gambar berhak cipta yang diambil dari web.

Banyak kritikus mengatakan itu bukan hanya pelanggaran karya bermerek dagang yang menjadi perhatian mereka tentang DALL-E 2. Sistem tersebut mengancam mata pencaharian seniman yang gayanya sekarang dapat direplikasi dengan beberapa baris teks, kata mereka, termasuk seniman yang tidak setuju. untuk pekerjaan mereka digunakan untuk pelatihan DALL-E 2. (Agar adil bagi OpenAI, perusahaan memiliki melisensikan sebagian gambar dalam kumpulan data pelatihan DALL-E 2, yang lebih dari yang dapat dikatakan tentang beberapa pesaingnya.)

Mencoba menemukan jalan tengah, saingan Getty Images Shutterstock baru-baru ini mengumumkan bahwa mereka akan mulai menggunakan DALL-E 2 untuk menghasilkan konten tetapi secara bersamaan meluncurkan “dana kontributor” untuk mengganti pembuat ketika perusahaan menjual pekerjaan untuk melatih sistem AI teks-ke-gambar . Itu juga melarang seni AI yang diunggah oleh pihak ketiga untuk meminimalkan potensi karya berhak cipta masuk ke platform.

Teknolog Mat Dryhurst dan Holly Herndon memelopori upaya yang disebut Sumber+ untuk memungkinkan orang melarang pekerjaan atau kemiripan mereka digunakan untuk tujuan pelatihan AI. Tapi itu sukarela. OpenAI belum mengatakan apakah itu akan berpartisipasi – atau memang, apakah itu akan memperkenalkan alat swalayan untuk memungkinkan pemegang hak mengecualikan pekerjaan mereka dari pelatihan atau pembuatan konten.

Campuran DALL-E 2 API

Mixtiles adalah salah satu pengadopsi awal DALL-E 2 API. Kredit Gambar: Campuran

Dalam sebuah wawancara, Miller mengungkapkan sedikit secara spesifik mengenai langkah-langkah mitigasi baru, kecuali bahwa OpenAI telah meningkatkan tekniknya untuk mencegah sistem menghasilkan konten yang bias, beracun, dan menyinggung yang mungkin dianggap tidak menyenangkan oleh pelanggan. Dia menggambarkan open API beta sebagai proses “berulang”, yang akan melibatkan kerja dengan “pengguna dan artis” selama beberapa bulan ke depan karena OpenAI meningkatkan infrastruktur yang mendukung DALL-E 2.

Tentu saja, jika DALL-E 2 beta merupakan indikasi, program API akan berkembang seiring waktu. Awalnya, OpenAI menonaktifkan kemampuan untuk mengedit wajah orang dengan DALL-E 2, namun kemudian mengaktifkan kemampuan tersebut setelah melakukan peningkatan pada sistem keamanannya.

“Kami telah melakukan banyak pekerjaan di sisi itu — baik melalui gambar yang Anda unggah dan petunjuk yang Anda kirim sejauh menyelaraskannya dengan kebijakan konten kami dan membuat mitigasi yang berbeda untuk memfilter pada tingkat prompt dan di tingkat gambar untuk memastikannya selaras dengan kebijakan konten kami. Jadi, misalnya, jika seseorang mengunggah gambar yang mengandung simbol kebencian atau darah kental — seperti konten yang sangat, sangat, sangat kejam — itu akan ditolak,” kata Miller. “Kami selalu berpikir tentang bagaimana kami dapat meningkatkan sistem.”

Tapi sementara OpenAI tampaknya ingin menghindari kontroversi yang mengelilingi Stable Diffusion, sumber terbuka yang setara dengan DALL-E 2 yang telah digunakan untuk membuat deepfake porno, darah kental, dan selebritas, itu menyerahkan kepada pengguna API untuk memilih dengan tepat bagaimana dan di mana akan menyebarkan. teknologinya. Beberapa, seperti Microsoft, tidak diragukan lagi akan mengambil pendekatan terukur, meluncurkan produk yang didukung DALL-E 2 secara perlahan untuk mengumpulkan umpan balik. Yang lain akan menyelam lebih dulu, merangkul teknologi dan dilema etika yang menyertainya.

Jika ada satu hal yang pasti, itu adalah permintaan yang terpendam untuk AI generatif – konsekuensinya terkutuk. Bahkan sebelum API tersedia secara resmi, pengembang menerbitkan solusi untuk mengintegrasikan DALL-E 2 ke dalam aplikasi, layanan, situs web, dan bahkan permainan video. Dengan peluncuran beta publik, didorong oleh otot pemasaran OpenAI yang tangguh, gambar sintetis siap untuk benar-benar memasuki arus utama.

Related Posts