Berita
Qwen-disage edit photoshop memberikan dana
Ingin lebih banyak visi yang cerdas dari kotak masuk Anda? Berlangganan buletin mingguan kami untuk mendapatkan apa yang hanya terkait dengan lembaga AI, data dan pemimpin keamanan. Berlangganan sekarang
Adobe Photoshop adalah salah satu program paling terkenal yang pernah dibuat, dan digunakan oleh lebih dari 90 % profesional kreatif di dunia, menurut Optik.
Jadi fakta bahwa a Bentuk Open Source Baru Kecerdasan Buatan – QWEN-DISE EditYang dirilis kemarin oleh tim raksasa Tiongkok Qwen untuk e-commerce, adalah seorang peneliti kecerdasan buatan Sekarang mampu mencapai sejumlah besar fungsi yang mirip dengan Photoshop dengan input teks sajaIni adalah pencapaian yang nyata.
Qwen-Center-IESMAGE, yang dibangun di atas 20 miliar parameter yang dirilis awal bulan ini, dan memperluas kekuatan unik sistem dalam menyediakan teks untuk mencakup berbagai tugas pembebasan, dari perubahan semantik yang lebih luas dalam penampilan.
Cukup unduh gambar awal – saya mencoba salah satu dari diri saya sendiri Konferensi Konversi Tahunan Terakhir untuk VentureBeat Di San Francisco-kemudian menulis instruksi untuk apa yang ingin Anda ubah, dan Qwen-Remitit akan mengembalikan gambar baru dengan menerapkan modifikasi ini.
Kecerdasan buatan membatasi batasnya
Tutup daya, biaya tinggi simbol, dan keterlambatan inferensi dibentuk kembali. Bergabunglah dengan salon eksklusif kami untuk menemukan bagaimana perbedaan besar:
- Mengubah energi menjadi keuntungan strategis
- Mengajar penalaran yang efektif untuk keuntungan produktivitas nyata
- Membuka Pengembalian Investasi Kompetitif dengan Sistem Kecerdasan Buatan Berkelanjutan
Mengamankan tempat Anda untuk tinggal di latar depan: https://bit.ly/4mwngngo
Contoh gambar input:
Contoh gambar penyutradaraan dengan gelombang: “Buat pria yang mengenakan malam.”
Model ini sekarang tersedia di beberapa platform, termasuk Obrolan qwenDan SulamanDan ModelDan GyrroupDan melalui Antarmuka Pemrograman Alibaba (API) (API)Yang terakhir, yang memungkinkan pengembang atau lembaga pihak ketiga untuk mengintegrasikan model baru ini ke dalam aplikasinya dan alur kerjanya.
Saya telah membuat contoh saya di atas Obrolan qwenPesaing Tim Qwen di OpenAI, bagaimanapun, perlu dicatat pengguna ambisius mana yang terbatas pada sekitar 8 pekerjaan gratis (input/output) dalam periode 12 jam sebelum mengatur ulang mereka. Pengguna dapat membayar akses ke lebih banyak pekerjaan.
Dengan dukungan dari input bahasa Inggris dan Cina, dan fokus ganda pada makna semantik dan loyalitas visual, Qwen-Center-Edit bertujuan untuk mengurangi hambatan untuk membuat konten konten visual.
Mengingat bahwa model tersedia sebagai simbol open source Di bawah lisensi Apache 2.0Aman bagi lembaga untuk mengambil, mengunduh, dan menyiapkannya secara gratis di perangkat mereka sendiri atau awan/mesin virtual, yang dapat menyebabkan penghematan biaya besar dari program kerajaan seperti Photoshop.
menyukai Junyang Lin, seorang peneliti tim Qwen di X, menulis, “Dia dapat menghilangkan helai rambut dan memodifikasi gambar yang sangat sensitif.”
Iklan tim mencerminkan perasaan ini, karena Qwen-Went-Edit menawarkan bukan sebagai sistem yang sama sekali baru, tetapi sebagai perpanjangan alami dari gambar QWEN yang menerapkan teks uniknya dan pendekatan pengkodean ganda langsung ke tugas pengeditan.
Simbol ganda memungkinkan pengeditan untuk menjaga pola dan konten gambar asli
Qwen-Dise-edit dibangun berdasarkan penciptaannya Qwen-destItu disajikan awal tahun ini sebagai model skala besar yang berspesialisasi dalam generasi gambar dan presentasi teks.
Laporan teknis yang tinggi dari Qwen-Taige memiliki kemampuannya untuk menangani tugas-tugas kompleks seperti menampilkan teks pada tingkat paragraf, huruf Cina dan Inggris, dan banyak baris dengan secara akurat.
Laporan itu juga mengkonfirmasi a Mekanisme pengkodean gandaDemikian pula gambar memberi makan di QWEN2.5-VL untuk kontrol semantik dan variabel enkripsi otomatis (VAE) untuk detail restoratif. Pendekatan ini memberikan penyesuaian yang masih tulus untuk niat dan penampilan gambar asli.
Opsi arsitektur ini sendiri mendukung qwen-image-edit. Dengan memanfaatkan kode ganda, formulir dapat disesuaikan ke dua level: Amandemen semantik Yang mengubah makna atau struktur adegan, dan Amandemen penampilan Yang menyediakan atau menghapus elemen sambil mempertahankan sisanya tanpa menyentuh.
Semantik Ini termasuk penciptaan kepemilikan intelektual baru, objek berputar 90 atau 180 -degree untuk mendeteksi berbagai pandangan, atau mengubah input menjadi gaya lain seperti studio Ghibli. Penyesuaian ini biasanya menyesuaikan banyak piksel tetapi mereka mempertahankan identitas dasar organisme.
Di Sini Contoh pembebasan semantik Dari Shridhar Athinarayanan, seorang insinyur di platform aplikasi AI, yang menggunakan aplikasi host atau “deduksi” untuk Qwen untuk memotret gambar Manhattan agar terlihat seperti permainan Lego.
Penampilan Editing Ini berfokus pada perubahan lokal yang akurat. Dalam kasus ini, sebagian besar gambar tetap tidak berubah saat mengubah objek tertentu. Demonstrasi termasuk spanduk luar biasa yang menghasilkan refleksi di dalam air, menghilangkan helai rambut longgar dari suatu gambar, dan mengubah warna satu huruf dalam sebuah teks.
Salah satu contoh bagus dari pengeditan penampilan dengan pengeditan Qwen-taif berasal dari co-founder dan CEO Assywai Thomas Hill yang menerbitkan a Bersama dengan x Istrinya muncul di gaun pengantin di bawah koridor dan satu lagi dengan koridor yang sama ditutupi dengan grafiti:
Selain kekuatan qwen yang kuat dalam menyajikan teks Cina dan Inggris, sistem yang berfokus pada pembebasan ditempatkan sebagai alat yang fleksibel untuk pencipta yang membutuhkan lebih dari gambar kebidanan sederhana.
Kontrol ganda dari rentang semantik dan ketulusan penampilan berarti bahwa alat yang sama dapat melayani kebutuhan yang sama sekali berbeda, dari pengembangan IP kreatif hingga re -extexture gambar di tingkat produksi.
Tambahkan atau hapus teks ke gambar
Kemampuan lain yang menonjol adalah Mengedit teks bi -banguage. Qwen-wenent-edit memungkinkan pengguna untuk menambahkan teks, menghapus atau memodifikasi teks dalam bahasa Cina dan bahasa Inggris sambil mempertahankan garis, ukuran, dan keanggunan.
Ini memperluas reputasi gambar qwen-gambar untuk menyajikan teks yang kuat, terutama dalam skenario sulit seperti karakter Cina yang kompleks.
Dalam praktiknya, ini memungkinkan pengeditan poster, tanda, kemeja, atau karya seni kaligrafi yang akurat di mana detail teks kecil yang bersangkutan, seperti yang ditunjukkan Contoh lain dari salinan simetris di bawah ini.
Salah satu demonstrasi koreksi kesalahan termasuk bagian dari garis Cina yang dibuat melalui proses pengeditan langkah -langkah.
Pengguna dapat menyoroti area yang salah, mengarahkan sistem untuk memperbaikinya, kemudian meningkatkan detail sampai huruf yang benar disediakan. Pendekatan berulang ini menjelaskan bagaimana model dapat diterapkan pada tugas pelepasan risiko tinggi karena akurasinya diperlukan.
Aplikasi dan kasus penggunaan
Tim Qwen adalah set aplikasi yang paling menonjol:
- Desain Kreatif dan Ekspansi IPSeperti menghasilkan simbol maskotal berdasarkan.
- Mengiklankan dan Membuat KontenDi mana slogan, spanduk, dan visual tekstual yang berat dapat disesuaikan.
- Avatar Virtual dan SeniDengan transmisi gaya, mendukung representasi pribadi yang unik.
- Fotografi dan penggunaan pribadiTermasuk penyesuaian latar belakang, perubahan pakaian, dan melepas objek.
- Hafalan budayaItu muncul dengan mengoreksi karya font klasik.
Dengan menjembatani liberalisasi yang tepat dengan transformasi kreatif yang lebih luas, Qwen-Win-edit bertemu para profesional yang membutuhkan kendali sambil tetap ramah terhadap eksperimen informal.
Pengukuran dan kinerja
Menurut tim QWEN, penilaian melalui standar umum menunjukkan bahwa Qwen-image-edit disediakan Nanti Dalam pengeditan foto.
Ini diikuti oleh penilaian teknis yang lebih luas di Qwen-Hie, di mana model dasar telah mencapai hasil kepemimpinan dalam masing-masing tugas menghasilkan gambar publik dan tugas-tugas menyajikan teks.
Sementara angka pengeditan yang ditentukan dalam versi belum dirinci, gambar QWEN itu sendiri sebagian besar diklasifikasikan sebagai penilaian independen seperti AI Arena, karena penghuni manusia telah membandingkan output melalui model dari berbagai penyedia layanan.
Harga API dan ketersediaannya
selama Studio Studio Cloud AlibabaPengembang dapat mengakses qwen-image-edit sebagai antarmuka pemrograman aplikasi. Harga sudah ditetapkan 0,045 dolar per gambarDengan bagian gratis 100 gambar berlaku selama 180 hari Setelah aktivasi.
Layanan ini tersedia di awal Area SingapuraDengan batas tarif Lima permintaan per detik Bahkan Dua tugas simultan untuk setiap akun.
Untuk menggunakan API, pengembang harus mendapatkan model studio API dan dapat memanggil model melalui HTTP atau melalui SDK Dashscope di Python atau Java.
Gambar dapat disajikan sebagai format URL atau Base64, dengan keputusan yang didukung mulai dari 512 hingga 4.096 piksel dan ukuran file hingga 10 MB. Gambar output di -host pada penyimpanan objek Cloud Alibaba dengan tautan valid 24 jam, yang mengharuskan pengguna untuk mengunduh dan menyimpan hasilnya segera.
Apa berikut untuk Qwen?
Qwen menempatkan gambar sebagai langkahD Mengurangi hambatan untuk membuat konten visual. Dengan membuat pengeditan yang hati -hati dan harmonis lebih mudah, modelnya Aplikasi dapat didukung dari studio desain ke pengguna informal yang meningkatkan proyek pribadi.
Sistem ini juga menunjukkan tren yang lebih luas dalam mengembangkan kecerdasan buatan: melewati alat untuk tujuan individu terhadap alat yang menggabungkan pembebasan, koreksi, dan peningkatan.
Dengan fleksibilitas semantik dan akurasi pada tingkat penampilan, Qwen-wenent-edit mencerminkan pergeseran ini, mencampur kekuatan ginekologis model besar dengan keandalan yang diperlukan untuk pengeditan profesional.
Tautan sumber