- Source: Flux (model teks-ke-gambar)
Flux (juga dikenal sebagai FLUX.1) adalah sebuah model teks-ke-gambar yang dikembangkan oleh Black Forest Labs, yang berpusat di Freiburg, Jerman. Seperti halnya model teks-ke-gambar lainnya, Flux menghasilkan gambar dari deskripsi bahasa alami, yang dikenal sebagai perintah (prompt).
Sejarah
Black Forest Labs didirikan pada tahun 2024 oleh sejumlah mantan karyawan Stability AI.yang terdiri dari Robin Rombach, Andreas Blattmann, dan Patrick Esser. Ketiga pendiri sebelumnya terlibat dalam penelitian pembuatan gambar kecerdasan buatan di Universitas Ludwig Maximilian München sebagai asisten peneliti di bawah Björn Ommer. Mereka menerbitkan hasil penelitiannya tentang pembuatan gambar pada tahun 2022, yang menghasilkan Stable Diffusion. Pada bulan Agustus 2024, Flux diintegrasikan ke dalam chatbot Grok yang dikembangkan oleh xAI dan tersedia sebagai bagian dari fitur berbayar di X (sebelumnya dikenal sebagai Twitter). Investor yang terlibat dalam Black Forest Labs diantaranya Andrerssen Horowitz, Brendan Iribe, Michael Ovitz, dan Garry Tan. Perusahaan menerima pendanaan awal sebesar US$ juta.
Model
Flux adalah serangkaian model teks-ke-gambar yang digunakan dalam seni kecerdasan buatan. Model ini didasarkan pada arsitektur campuran yang terdiri dari kombinasi blok transformator difusi multimodal dan paralel yang memiliki 12 miliar parameter. Varian model tersebut dirilis dengan lisensi yang berbeda-beda, mulai dari Schnell (secara harfiah berarti Cepat dalam bahasa Jerman) dirilis sebagai perangkat lunak sumber terbuka di bawah Lisensi Apache, Dev dirilis sebagai perangkat lunak sumber tersedia di bawah lisensi non-komersial, dan Pro dirilis sebagai perangkat lunak milik perorangan dan hanya tersedia dalam bentuk API yang dapat dilisensikan oleh pihak ketiga. Pengguna tetap memiliki kepemilikan atas hasil keluaran terlepas dari varian model yang digunakan.
Model-model tersebut dapat digunakan secara daring atau lokal dengan menggunakan antarmuka pengguna kecerdasan buatan generatif seperti ComfyUI.
Sebuah model unggulan yang disempurnakan, Flux 1.1 Pro dirilis pada tanggal 2 Oktober 2024. Dua mode tambahan ditambahkan pada kemudian hari, yaitu Ultra yang dapat menghasilkan gambar dengan resolusi empat kali lebih tinggi dan hingga 4 megapiksel tanpa mempengaruhi kecepatan pembuatan dan Raw yang dapat menghasilkan gambar hiper-realistis dalam gaya fotografi kejutan pada tanggal 6 November 2024.
Masih terkait dengan Flux yaitu model teks-ke-video SOTA, yang pada saat ini sedang dalam pengembangan.
Kritik
Flux dikritik karena gambar yang dihasilkannya sangat realistis seperti foto yang dapat digunakan untuk pemalsuan dalam. Menurut laporan sejumlah media, penggambaran tersebut berkisar dari gambar Donald Trump berpose dengan senjata hingga adegan-adegan yang tidak layak, yang memicu diskusi tentang implikasi etis dari penggunaan Flux dan teknologi serupa.
Setelah model tersebut dirilis, media sosial X dibanjiri gambar yang dihasilkan Flux. Black Forest Labs belum memberikan rincian pasti mengenai data yang digunakan untuk melatih Flux. Ars Technica menduga bahwa Flux didasarkan pada kumpulan gambar besar yang digali dari internet, sebuah praktik kontroversial dengan konsekuensi hukum yang potensial.
Referensi
Pranala luar
Situs web resmi
Kata Kunci Pencarian:
- Flux (model teks-ke-gambar)
- Kekristenan
- Luhman 16
- Seng
- Hidrogen
- Metabolisme
- Rihanna
- Garis waktu peristiwa jauh di masa depan
- Teori bentuk
- Itrium