memo-x

Berita, komentar, dan fitur terbaru dari The Memo X

OpenAI merilis alat AI yang dapat mereproduksi gambar dari teks

Peneliti OpenAI telah menciptakan sistem baru yang dapat mereproduksi gambar lengkap, termasuk astronot menunggang kuda, dari kalimat sederhana dalam bahasa Inggris.

Dikenal sebagai DALL E 2, AI teks ke gambar generasi kedua mampu menciptakan gambar dan karya seni foto-realistis pada resolusi yang lebih tinggi daripada pendahulunya.

Kelompok peneliti AI tidak akan merilis sistem ke publik, tetapi diharapkan akan menawarkannya sebagai plugin untuk aplikasi pengeditan foto yang ada di masa mendatang.

Versi baru ini mampu membuat gambar dari teks sederhana, menambahkan objek ke gambar yang ada, atau bahkan memberikan perspektif berbeda pada gambar yang sudah ada.

Pengembang telah memberlakukan batasan pada ruang lingkup AI untuk memastikan bahwa itu tidak dapat menghasilkan gambar yang penuh kebencian, rasis atau kekerasan, atau digunakan untuk menyebarkan informasi yang salah.

Peneliti OpenAI telah menciptakan sistem baru yang dapat mereproduksi gambar lengkap, termasuk astronot menunggang kuda, dari kalimat sederhana dalam bahasa Inggris. Dalam hal ini, astronot menunggang kuda dengan gaya yang realistis

Dikenal sebagai DALL E 2, generasi kedua dari teks-ke-gambar AI yang mampu menciptakan gambar dan karya seni foto-realistis pada resolusi yang lebih tinggi dari pendahulunya.

Dikenal sebagai DALL E 2, generasi kedua dari teks-ke-gambar AI yang mampu menciptakan gambar dan karya seni foto-realistis pada resolusi yang lebih tinggi dari pendahulunya.

Versi aslinya, dinamai seniman surealis Spanyol Salvador Dali, robot Pixar WALL-E, dirilis pada Januari 2021 sebagai tes terbatas tentang cara kecerdasan buatan dapat digunakan untuk mewakili konsep — mulai dari deskripsi membosankan hingga penerbangan mewah.

Beberapa karya seni awal yang dibuat oleh AI termasuk model dalam kemeja flanel, ilustrasi lobak berjalan dengan anjing, dan emoji bayi penguin.

Contoh frasa yang digunakan dalam edisi kedua untuk menghasilkan gambar fotorealistik termasuk “seorang astronot menunggang kuda dengan gaya realistis.”

Di situs web DALL-E 2, ini dapat disesuaikan, untuk menghasilkan gambar ‘dalam penerbangan’, termasuk mengganti astronot dengan boneka beruang, kuda bermain basket dan menampilkannya sebagai gambar pensil atau sebagai seni pop ‘Andy Warhol’ lukisan.

Dia dapat menambah atau menghapus objek dari foto - seperti flamingo di sebelah kiri foto ini
Dia dapat menambah atau menghapus objek dari foto - seperti flamingo yang ada di sebelah kiri

Dia dapat menambah atau menghapus objek dari foto – seperti flamingo yang terlihat di foto pertama, dan hilang di foto kedua

Memuaskan bahkan pelanggan terberat sekalipun, dengan permintaan ulasan yang tak ada habisnya, AI dapat memompa beberapa versi setiap gambar dari satu kalimat.

Salah satu fitur khusus DALL-E 2 memungkinkan untuk ‘lukisan dalam ruangan’, di mana foto yang ada dapat diambil dan fitur lain ditambahkan – seperti flamingo ke kolam.

Itu dapat secara otomatis mengisi detail, seperti bayangan, saat objek ditambahkan, atau bahkan menyesuaikan latar belakang agar sesuai, jika objek dipindahkan atau dihapus.

DALL E 2 menjelaskan hubungan antara gambar dan teks yang digunakan untuk menggambarkannya.

“Ini menggunakan proses yang disebut ‘menyebar’, yang dimulai dengan pola titik acak dan secara bertahap mengubah pola itu ke arah gambar saat mempelajari aspek tertentu dari gambar itu.

Versi baru ini mampu membuat gambar dari teks sederhana, menambahkan objek ke gambar yang ada, atau bahkan memberikan perspektif berbeda pada gambar yang sudah ada

Versi baru ini mampu membuat gambar dari teks sederhana, menambahkan objek ke gambar yang ada, atau bahkan memberikan perspektif berbeda pada gambar yang sudah ada

Versi pertama DALL-E terbatas cakupannya

Versi baru mampu membuat gambar yang lebih detail

Versi pertama DALL-E terbatas dalam cakupannya (kiri), dengan versi baru dapat membuat gambar yang lebih detail (kanan)

DALL-E 2 dibangun di atas sistem visi komputer yang disebut CLIP, yang dikembangkan oleh OpenAI dan diumumkan tahun lalu.

Pravola Dhariwal, ilmuwan peneliti di OpenAI, mengatakan kepada The Verge.

Sayangnya, proses ini membatasi realisme gambar, karena tidak selalu menangkap kualitas yang dianggap begitu penting oleh manusia.

CLIP melihat gambar dan merangkum isinya dengan cara yang sama seperti yang dilakukan manusia, dan mereka membalikkan ini – unCLIP – untuk DALL-E 2.

Versi aslinya, dinamai seniman surealis Spanyol Salvador Dali, robot Pixar WALL-E, dirilis pada Januari 2021 sebagai tes terbatas tentang cara kecerdasan buatan dapat digunakan untuk mewakili konsep — mulai dari deskripsi membosankan hingga penerbangan mewah.

Versi aslinya, dinamai seniman surealis Spanyol Salvador Dali, robot Pixar WALL-E, dirilis pada Januari 2021 sebagai tes terbatas tentang cara kecerdasan buatan dapat digunakan untuk mewakili konsep — mulai dari deskripsi membosankan hingga penerbangan mewah.

OpenAI melatih model menggunakan gambar, dan mereka menghapus beberapa materi yang tidak pantas, membatasi kemampuannya untuk menghasilkan konten yang menyinggung.

Setiap foto juga menyertakan tanda air, untuk menunjukkan dengan jelas bahwa itu diproduksi oleh AI, bukan orang, atau bahwa itu adalah foto yang sebenarnya – mengurangi risiko kesalahan informasi.

Juga tidak dapat membuat wajah yang dapat dikenali berdasarkan nama, bahkan wajah yang dapat dikenali hanya dari karya seni seperti Mona Lisa – menciptakan bentuk yang berbeda.

Menurut peneliti OpenAI, kami telah menentukan kemampuan DALL E 2 untuk menghasilkan gambar kekerasan, kebencian, atau dewasa.

Dengan menghapus konten yang lebih eksplisit dari data pelatihan, kami mengurangi keterpaparan DALL E 2 terhadap konsep-konsep ini.

Beberapa karya seni awal yang dibuat oleh AI termasuk model dalam kemeja flanel, ilustrasi lobak berjalan dengan anjing, dan emoji bayi penguin – atau astronot yang santai.

Beberapa karya seni awal yang dibuat oleh AI termasuk model dalam kemeja flanel, ilustrasi lobak berjalan dengan anjing, dan emoji bayi penguin – atau astronot yang santai.

Girl in the Pearl Earring, juga dikenal sebagai Girl in a Turban oleh pelukis Zaman Keemasan Belanda Johannes Vermeer.  sekitar 1665

Kecerdasan buatan telah dibatasi untuk menghindari penyalinan wajah secara langsung, bahkan yang ada dalam karya seni

Kecerdasan buatan telah dibatasi untuk menghindari meniru wajah secara langsung, bahkan dalam karya seni seperti anting-anting mutiara oleh pelukis Zaman Keemasan Belanda Johannes Vermeer. Ditampilkan di sebelah kanan adalah versi AI dari panel yang sama, yang telah diubah untuk tidak secara langsung mensimulasikan wajah

Kecerdasan buatan dapat membuat karya seni yang realistis dari deskripsi sederhana, seperti

AI dapat membuat karya seni fotorealistik dari deskripsi sederhana, seperti “foto Times Square berkualitas tinggi” (bawah) atau foto anjing berkualitas tinggi yang bermain di lapangan hijau di tepi danau (atas) dengan beberapa versi masing-masing. foto sedang diproduksi

“Kami juga telah menggunakan teknik-teknik canggih untuk menghalangi generasi kehidupan nyata dari individu-individu yang nyata, termasuk wajah-wajah tokoh masyarakat.”

Meskipun tidak akan tersedia untuk umum, beberapa peneliti akan diberikan akses, dan di masa mendatang dapat disertakan dalam aplikasi lain – yang memerlukan kebijakan konten yang ketat.

READ  iPhone 13 baru? Inilah yang harus Anda ketahui jika Anda berada di pasar

Ini tidak mengizinkan pengguna untuk membuat konten kekerasan, dewasa, atau politik, di antara kategori lainnya.

Kami tidak akan membuat gambar jika filter kami mengidentifikasi klaim teks dan unggahan gambar yang mungkin melanggar kebijakan kami. Juru bicara menjelaskan bahwa kami juga memiliki sistem pemantauan otomatis dan manusia untuk menjaga dari penyalahgunaan.

“Kami telah bekerja dengan para ahli dari luar dan mempratinjau DALL E 2 untuk sejumlah pengguna tepercaya yang akan membantu kami mempelajari tentang kemampuan dan keterbatasan teknologi.

“Kami berencana untuk mengundang lebih banyak orang untuk melihat penelitian ini dari waktu ke waktu saat kami belajar dan sering meningkatkan sistem keselamatan kami.”

Bagaimana kecerdasan buatan belajar menggunakan jaringan saraf

Sistem kecerdasan buatan mengandalkan Jaringan Syaraf Tiruan (JST), yang mencoba mensimulasikan cara kerja otak untuk belajar.

Jaringan saraf tiruan dapat dilatih untuk mengenali pola informasi – termasuk ucapan, data teks, atau gambar visual – dan merupakan dasar dari sejumlah besar kemajuan dalam kecerdasan buatan dalam beberapa tahun terakhir.

AI tradisional menggunakan input untuk “mengajarkan” algoritme tentang topik tertentu dengan menyediakan sejumlah besar informasi.

Sistem kecerdasan buatan mengandalkan Jaringan Syaraf Tiruan (JST), yang mencoba mensimulasikan cara kerja otak untuk belajar.  Jaringan saraf tiruan dapat dilatih untuk mengenali pola dalam informasi - termasuk ucapan, data teks, atau gambar visual

Sistem kecerdasan buatan mengandalkan Jaringan Syaraf Tiruan (JST), yang mencoba mensimulasikan cara kerja otak untuk belajar. Jaringan saraf tiruan dapat dilatih untuk mengenali pola dalam informasi – termasuk ucapan, data teks, atau gambar visual

Aplikasi praktis termasuk layanan terjemahan bahasa Google, perangkat lunak pengenalan wajah Facebook, dan foto Snapchat yang mengubah filter langsung.

Proses memasukkan data ini bisa sangat memakan waktu, dan terbatas pada satu jenis pengetahuan.

Generasi baru ANN yang disebut Adversarial Neural Networks mengadu kecerdasan dua bot AI satu sama lain, memungkinkan mereka untuk belajar satu sama lain.

Pendekatan ini dirancang untuk mempercepat proses pembelajaran, serta meningkatkan output yang dihasilkan oleh sistem kecerdasan buatan.