Amazon Memperkenalkan Model AI Multimodal Nova Untuk Teks, Imej dan Video

Perkhidmatan Web Amazon (AWS) memperkenalkan keluarga model Nova AI yang sangat dinanti-nantikan pada persidangan re:Inventnya. Direka bentuk untuk disepadukan dengan lancar dengan AWS Bedrock, Nova memperkenalkan enam model yang disesuaikan dengan penjanaan teks, imej dan video, menekankan keterjangkauan, kebolehskalaan dan kebolehaksesan.

Dengan menangani keperluan unik perniagaan dan profesional kreatif, Nova mewujudkan AWS sebagai pembekal serius model AI generatif.

Dengan Nova, AWS bertujuan untuk mencabar penguasaan OpenAI, Google dan pemain baru muncul seperti Mistral AI. Ketua Pegawai Eksekutif Amazon Andy Jassy berkata mengenai keluaran:”Model Nova adalah 75% lebih murah daripada model terkemuka lain di Bedrock. Ia pantas laser, sangat menjimatkan kos dan ia adalah model terpantas yang akan anda temui.”

[kandungan terbenam]

Memperkenalkan Keluarga Nova: AI Serbaguna Ekosistem

Suit Amazon Nova baharu terdiri daripada empat model berorientasikan teks—Micro, Lite, Pro dan Premier—dan dua alatan kreatif, Canvas dan Reel Setiap model menangani aplikasi tertentu, menawarkan fleksibiliti dan kecekapan kos merentas industri.

Nova Micro ialah model teks sahaja yang dioptimumkan untuk kelajuan dan kemampuan, menjadikannya sesuai untuk tugasan seperti ringkasan, terjemahan dan penjanaan kandungan. Nova Lite dan Nova Pro memperluaskan keupayaan kepada pemprosesan data berbilang mod, mengendalikan teks, imej dan video dengan lebih serba boleh.

Berkaitan: Amazon Mencabar Penguasaan AI Nvidia dengan Superkomputer Ultracluster

Nova Pro, khususnya, memberikan ketepatan yang dipertingkatkan, sesuai untuk aplikasi kompleks seperti analisis dokumen lanjutan dan multimedia ringkasan.

Model Nova Premier, ditetapkan untuk dilancarkan pada awal 2025, memfokuskan pada tugas penaakulan lanjutan dan berfungsi sebagai model”guru”untuk menyaring dan memperhalusi yang lebih kecil, khusus sistem.

Dari segi kreatif, Nova Canvas menjana imej berkualiti tinggi dengan parameter boleh laras.

[kandungan terbenam]

Nova Reel membolehkan pengguna menghasilkan klip video pendek dengan penyesuaian lanjutan seperti pergerakan kamera dan kesan visual.

[kandungan terbenam]

AWS merancang untuk memanjangkan keupayaan Reel menjelang pertengahan 2025, membolehkan penciptaan urutan video yang lebih panjang, satu langkah penting dalam bersaing dengan alatan seperti Adobe Firefly dan Gemini Imagen Google 3.

[kandungan terbenam]

Hasil penanda aras menyerlahkan prestasi pelbagai model AI merentas pelbagai tugasan perisikan teks, dengan Nova Pro menunjukkan hasil yang kompetitif dalam beberapa bidang. Ia mencapai markah yang ketara dalam Penaakulan Akal Sehat (94.8%), Matematik menggunakan GSM8K (94.8%) dan Penjanaan Kod Python (89.0%), mempamerkan kekuatannya dalam tugasan berasaskan logik dan pengiraan.

Dalam Pelbagai-step Reasoning, Nova Pro mendapat markah 86.9%, sejajar dengan pesaingnya. Walau bagaimanapun, prestasinya dalam Penaakulan Dalam (46.9%) dan tugas Terjemahan (43.4% dan 44.4%) menunjukkan ruang untuk penambahbaikan, terutamanya jika dibandingkan dengan model seperti Claude dan Gemini yang berprestasi lebih baik dalam bidang ini. Keputusan ini menunjukkan bahawa Nova Pro mencapai keseimbangan yang baik antara penaakulan, kecekapan matematik dan keupayaan pengekodan.

Inovasi Teknikal dalam Suite Nova

Model Nova memperkenalkan beberapa ciri lanjutan yang membezakannya daripada pesaing. Salah satu yang paling ketara ialah penggunaan tetingkap konteks token lanjutan.

Model Lite dan Pro boleh memproses sehingga 300,000 token, membolehkan mereka menganalisis 30 minit video atau 225,000 perkataan teks. Mikro, direka untuk tugas yang lebih pendek, menyokong 128,000 token, menjadikannya ideal untuk operasi volum tinggi yang pantas.

Berkaitan: AWS Melancarkan Cip Trainium2 AI untuk LLM; Set Trainium3 untuk 2025

Satu lagi ciri utama ialah penyulingan, proses di mana pengetahuan daripada model”guru”yang lebih besar dipindahkan ke sistem yang lebih kecil dan lebih cekap. Ini membolehkan perniagaan menggunakan penyelesaian AI tersuai tanpa menanggung kos pengiraan yang tinggi. keupayaan model Nova membolehkan penyepaduan yang lancar merentas data teks, imej dan video, menjadikannya alat serba boleh untuk industri daripada pemasaran dan pendidikan kepada penjagaan kesihatan dan kewangan.

Etika dan Keselamatan dalam Penerapan AI

strong>

AWS telah menekankan perlindungan etika yang terbina dalam reka bentuk Nova Ciri-ciri seperti penanda air dan penyederhanaan kandungan bertujuan untuk mengelakkan penyalahgunaan yang dihasilkan oleh AI output, menangani kebimbangan yang semakin meningkat tentang pemalsuan mendalam dan maklumat salah.

Walaupun langkah-langkah ini, AWS tidak mendedahkan butiran tentang set data yang digunakan untuk melatih model Nova. Ini berbeza dengan pesaing seperti Adobe, yang secara eksklusif melatih model Fireflynya pada data berlesen. Kekurangan ketelusan telah mencetuskan persoalan tentang komitmen AWS terhadap amalan AI yang beretika, satu isu kritikal apabila pemeriksaan kawal selia AI semakin meningkat di peringkat global.

Kedudukan AWS dalam Pasaran Berdaya Saing

Pelancaran Nova datang pada masa persaingan sengit dalam sektor AI generatif, di mana pemain yang mapan dan baru muncul sedang berinovasi dengan pantas. Tumpuan AWS pada keterjangkauan dan skalabiliti meletakkannya sebagai alternatif yang berdaya maju untuk perniagaan yang ingin menggunakan AI tanpa kos yang terlalu tinggi atau perubahan infrastruktur yang kompleks.

OpenAI baru-baru ini menghadapi tindak balas yang ketara berikutan kebocoran API Sora API, perdananya Alat penjanaan video AI. Penguji, yang kecewa dengan syarat kerjasama yang ketat, menjadikan API tersedia secara terbuka.

OpenAI kemudiannya mengakui kelewatan dalam pembangunan Sora, memetik keperluan untuk peningkatan keselamatan dan infrastruktur pengiraan yang dipertingkatkan. Kontroversi itu menggariskan cabaran mengimbangi inovasi dengan kerjasama beretika.

Model Flux AI, yang dibangunkan oleh Black Forest Labs Jerman, ialah penjana imej termaju yang mendapat perhatian kerana keupayaannya yang luar biasa untuk menghasilkan figura manusia. xAI telah menyepadukan Flux dengan kemas kini Grok terbaharunya. Walaupun ia sedikit ketinggalan berbanding Midjourney v6.1 dalam kualiti tekstur kulit, reka bentuk sumber terbuka dan keserasian dengan komputer riba berprestasi tinggi menjadikannya pilihan yang menarik dan mudah diakses untuk pencipta.

Google terus mengembangkan AI Gemininya. suite, menyepadukan ciri seperti penjanaan teks ke imej dalam Dokumen Google dan penjadualan berkuasa AI dalam Gmail. Model Gemini Imagen 3, yang terkenal dengan visual fotorealistiknya, bersaing secara langsung dengan Nova Canvas.

Walau bagaimanapun, penekanan AWS pada keterjangkauan dan penyelesaian tertumpu kepada perusahaan mungkin memberikannya kelebihan dalam pasaran yang kos dan penyesuaian adalah kritikal.

Pada bulan Oktober Stability AI melancarkan yang terbaru dalam barisan moel AI penjana imej mereka, dengan keluarga Stable Diffusion 3.5. Stable Diffusion 3.5 Large, model parameter 8 bilion, menonjol bagi pengguna yang mencari imej berkualiti tinggi yang mematuhi gesaan.

Mistral AI, pesaing Eropah yang semakin meningkat, baru-baru ini mendapat perhatian dengan Pixtral Largenya model, sistem multimodal 124 bilion parameter. Digabungkan dengan kemas kini pada platform Le Chatnya, termasuk carian web masa nyata dan alatan kerjasama, Mistral menyasarkan untuk menawarkan AI yang boleh diakses dan berprestasi tinggi sebagai alternatif kepada platform yang berpangkalan di A.S..

Implikasi yang Lebih Luas of Nova for AI Adoption

Pengenalan Nova mencerminkan trend yang lebih luas dalam industri AI, di mana syarikat semakin tertumpu pada penyampaian yang boleh diakses, alat berprestasi tinggi untuk pelbagai aplikasi. Bagi AWS, Nova bukan sahaja pelancaran produk tetapi juga langkah strategik untuk mengukuhkan kedudukannya dalam pasaran perkhidmatan awan.

AWS sudah memegang 31% bahagian pasaran infrastruktur awan, mendahului Microsoft Azure dan Google Cloud dan penyepaduan Nova dengan AWS Bedrock boleh mengukuhkan lagi penguasaannya.

Pilihan skalabiliti dan penyesuaian Nova menjadikannya sangat menarik untuk perusahaan kecil dan sederhana (PKS), yang sering menghadapi halangan kepada penggunaan AI disebabkan oleh kos dan kerumitan. Dengan menawarkan alatan yang memenuhi kedua-dua operasi berkelajuan tinggi, kos rendah dan aplikasi multimodal lanjutan, AWS memastikan Nova menarik spektrum pengguna yang luas.

Pelan Hala Tuju Masa Depan

AWS merancang untuk memperkenalkan dua model terobosan pada tahun 2025 untuk mengembangkan lagi fungsi Nova. Model AI pertuturan ke pertuturan, yang dijadualkan untuk Q1, akan mentafsir nada dan irama, menyampaikan interaksi semula jadi seperti manusia.

Menjelang pertengahan tahun, AWS akan mengeluarkan”mana-mana-mana-mana”model multimodal yang mampu mengubah input merentas format teks, imej, audio dan video Kemajuan ini bertujuan untuk meletakkan Nova sebagai penyelesaian utama untuk aliran kerja AI hujung ke hujung.

Amazon Memperkenalkan Model AI Multimodal Nova Untuk Teks, Imej dan Video

Published by All Things Windows on December 12, 2024

Memperkenalkan Keluarga Nova: AI Serbaguna Ekosistem

Inovasi Teknikal dalam Suite Nova

Etika dan Keselamatan dalam Penerapan AI

strong>

Kedudukan AWS dalam Pasaran Berdaya Saing

Implikasi yang Lebih Luas of Nova for AI Adoption

Pelan Hala Tuju Masa Depan

IT Info

AMD FSR 3: Berapa banyak peningkatan prestasi yang anda harapkan?

IT Info

Apple Menolak Pembangunan Cip Pelayan AI, Mensasarkan Penguasaan Pusat Data

IT Info

Project Nimbus: Peranan Google dan Amazon dalam Pengawasan AI Israel Dibakar

Amazon Memperkenalkan Model AI Multimodal Nova Untuk Teks, Imej dan Video

Published by All Things Windows on December 12, 2024

Memperkenalkan Keluarga Nova: AI Serbaguna Ekosistem

Inovasi Teknikal dalam Suite Nova

Etika dan Keselamatan dalam Penerapan AI strong>

Kedudukan AWS dalam Pasaran Berdaya Saing

Implikasi yang Lebih Luas of Nova for AI Adoption

Pelan Hala Tuju Masa Depan

Related Posts

IT Info

AMD FSR 3: Berapa banyak peningkatan prestasi yang anda harapkan?

IT Info

Apple Menolak Pembangunan Cip Pelayan AI, Mensasarkan Penguasaan Pusat Data

IT Info

Project Nimbus: Peranan Google dan Amazon dalam Pengawasan AI Israel Dibakar

Etika dan Keselamatan dalam Penerapan AI

strong>