
AI Gemini milik Google, kini memungkinkan pengguna untuk mengedit dan memodifikasi gambar yang dihasilkan AI dan gambar pribadi secara langsung di aplikasi maupun web Gemini.
Hal ini dimungkinkan setelah Google merilis resmi kemampuan pengeditan gambar natif (native image editing) di Gemini, belum lama ini.
Dalam posting blog resmi, Google mengatakan mulai menggelontorkan fitur native image editing di Gemini secara bertahap hari ini dan akan tersedia dalam lebih dari 45 bahasa di berbagai negara dalam beberapa minggu ke depan.
Pantauan KompasTekno, Kamis (8/4/2025), fitur native image editing sudah bisa dijajal oleh pengguna Gemini di Indonesia, baik di aplikasi seluler atau web Gemini.
Fitur native image editing ini memungkinkan pengguna untuk mengganti latar belakang, menambahkan atau mengganti objek, hingga menyisipkan elemen baru ke dalam gambar.
Misalnya, pengguna bisa mengunggah foto pribadi dan meminta Gemini untuk menunjukkan seperti apa penampilan mereka dengan warna rambut yang berbeda. Atau, bisa meminta AI Gemini menambahkan aksesori lucu seperti topi ke foto hewan peliharaan kita (lihat gambar di atas).
Pengeditan langsung di Gemini ini dapat dilakukan secara bertahap, sehingga pengguna bisa menumpuk perubahan tanpa harus mengulang dari awal jika ingin mengubah hasil sebelumnya.
Didukung model Gemini 2.0 Flash

Fitur native image editing ini didukung oleh Gemini 2.0 Flash, model AI multimodal terbaru dari Google yang dirancang untuk memahami konteks visual dan teks secara mendalam.
Google pertama kali memperkenalkan model bahasa kecerdasan buatan (artificial intelligence/AI) terbarunya, Gemini 2.0 Flash pada Desember 2024. Kemudian, model AI ini dirilis resmi ke banyak pengguna pada Februari 2025.
Model AI Gemini 2.0 Flash ini merupakan suksesor dari Gemini 1.5 Flash yang diperkenalkan pada Mei lalu. Sebagai suksesor, Gemini 2.0 Flash dilengkapi dengan kemampuan baru. Gemini 2.0 Flash sudah menggabungkan input multimodal, penalaran yang disempurnakan, dan pemahaman bahasa alami untuk membuat gambar.
Dengan perpaduan pemahaman bahasa alami, penalaran tingkat lanjut, dan kemampuan visual yang realistis, Gemini disebut dapat menjaga konsistensi tekstur, pencahayaan, dan perspektif saat melakukan banyak perubahan dalam satu gambar.
Model ini juga unggul dalam menjaga konsistensi elemen visual, memahami konteks dunia nyata (misalnya, saat menggambarkan resep makanan), serta mampu merender teks dalam gambar dengan lebih akurat dibanding model lain.
Ini menjadikannya cocok untuk membuat konten visual seperti poster, undangan, atau unggahan media sosial.
Google menyebut fitur ini akan berguna bagi berbagai kalangan. Misalnya, guru bisa membuat storyboard ilustratif secara instan, desainer bisa menyusun portofolio produk, dan arsitek bisa memvisualisasikan revisi desain bangunan secara real-time dalam rapat.
Untuk menjaga keamanan dan etika penggunaan, setiap gambar hasil editan AI akan diberi dua watermark, yakni satu yang terlihat dan satu lagi yang tak kasat mata menggunakan teknologi SynthID, sebagaimana dihimpun KompasTekno dari TechCrunch, Rabu (7/5/2025).