Apple telah mengeluarkan 
Projek ini bertujuan untuk menyelesaikan cabaran utama bagi penyelidik dengan menyediakan sumber terbuka dan pelbagai untuk latihan model generasi akan datang. Mereka memanfaatkan editor imej”Nano-Banana”untuk menghasilkan pengeditan dan model Gemini 2.5 Pro untuk memastikan kualiti dan ketepatan. Dataset penuh kini boleh didapati di GitHub untuk penyelidikan bukan komersial.
 
 
Dalam paparan kerjasama silang industri yang mengejutkan, Apple berpaling kepada teknologi saingannya untuk membina alat penyelidikan terbarunya.
Dengan kesesakan yang berterusan dalam pembangunan AI: ketiadaan dataset yang besar, berkualiti tinggi, dan boleh diakses secara terbuka berdasarkan imej sebenar. Banyak sumber yang sedia ada sama ada sepenuhnya sintetik, terhad dalam skop yang dikendalikan oleh manusia, atau dibina dengan model proprietari, menghalang kemajuan komuniti yang luas. Pendekatan sistematik kami terhadap kualiti dan kepelbagaian.”Seluruh proses kos kira-kira $ 100,000.
Di dalam dataset: lebih daripada sekadar suntingan tunggal
penggerudian ke dalam struktur dataset mendedahkan sumber yang direka untuk senario penyelidikan yang kompleks. Walaupun dinamakan”400K,”koleksi itu sebenarnya terdiri daripada 386,000 contoh yang dikendalikan ke dalam taksonomi terperinci sebanyak 35 jenis edit di seluruh lapan kategori utama. Subset kedua menyediakan 72,000 contoh multi-giliran, yang membolehkan penyelidikan ke dalam pengeditan pengeditan dan konteks yang menyedari konteks di mana model mesti menjejaki perubahan dalam beberapa langkah.
Akhirnya, subset keutamaan 56,000 termasuk pasangan pengeditan yang berjaya dan gagal. Ini penting untuk penyelidikan penjajaran dan untuk model ganjaran latihan yang boleh belajar untuk membezakan output berkualiti tinggi dari yang cacat. Penyelidik boleh mengakses dataset lengkap pada portal penyelidikan Apple di bawah lesen bukan komersil. Komuniti, pelepasan ini lebih daripada sekadar data baru; Ia adalah penunjuk yang jelas di mana teknologi cemerlang dan di mana ia masih berjuang. Walau bagaimanapun, pengeditan yang memerlukan kawalan spatial yang tepat dan pemahaman geometri tetap menjadi cabaran yang signifikan. Model Nano-Banana yang mendasari Google menjadi editor imej tertinggi di papan pendahulu awam walaupun sebelum pelancaran rasminya. Nicole Brichtova, sebuah produk utama di Google DeepMind, berkata,”Kami meletakkan keupayaan yang digunakan untuk memerlukan alat khusus ke tangan pencipta sehari-hari, dan ia telah memberi inspirasi untuk melihat letupan kreativiti yang telah mencetuskan.”Andrew Carr, pengasas bersama AI Startup Cartwheel, mendapati ia tidak mampu, menyatakan,”Model imej Flash Gemini 2.5 yang baru adalah yang pertama yang dapat menyediakan kedua-duanya.”Ini adalah proses di mana model yang besar dan kuat (nano-barana) digunakan untuk menghasilkan dataset latihan besar-besaran.
Penyelidik lain kemudian boleh menggunakan data awam ini untuk melatih model yang lebih kecil, lebih cekap, dan berpotensi terbuka yang meniru keupayaan sistem proprietari asal. Dengan membuat output berkualiti tinggi ini, Apple secara berkesan membantu mendemokrasikan akses kepada AI yang canggih, memupuk landskap penyelidikan yang lebih terbuka dan kolaboratif.
“`