Ang

Microsoft ay opisyal na inilunsad ang Copilot Vision para sa Windows, na inilalabas ang katulong na pagbabahagi ng screen na AI-powered na libre sa lahat ng mga gumagamit sa Estados Unidos sa parehong Windows 10 at Windows 11. Ang paglabas ng panimula ay nagbabago sa AI mula sa isang simpleng chatbot sa isang malalim na pinagsama-samang tool na maaaring biswal na pag-aralan at ito ay nakikipag-ugnay sa mga posisyon na ito ay may mga aktibong gabay, kasama ang dalawang gabay para sa mga gumagamit. Ang kumpanya na nagsasabi sa opisyal na anunsyo “Araw-araw na kasama.”Sa pamamagitan ng pagpapahintulot sa katulong na makita kung ano ang nakikita ng gumagamit, maaari itong mag-alok ng real-time, tulong sa konteksto. Sa isang mahalagang pag-update na nagpapalawak ng pag-access nito, ang tampok na ito ay libre ngayon, isang pagbabago mula sa mas maaga, mas limitadong yugto ng pagsubok. Ang isang subscription sa Copilot Pro, na dati nang kinakailangan para sa ilang mga tester, ay hindi na kinakailangan.

Ang kahalagahan para sa mga gumagamit ay namamalagi sa bagong layer ng interactive na tulong. Kasama sa tampok na ito ang on-screen na”mga highlight”na maaaring biswal na magdidirekta ng isang gumagamit kung saan mag-click upang makumpleto ang isang gawain, na epektibong nagbibigay ng hakbang-hakbang na gabay sa loob ng software. Ang pagbabagong ito mula sa passive AI hanggang sa isang aktibo, kasosyo sa cross-application ay nagmamarka ng isang pangunahing hakbang sa diskarte ng Microsoft upang mai-embed ang artipisyal na katalinuhan sa core ng operating system ng Windows.

Mula sa bayad na preview hanggang sa libre para sa lahat

Ang paglalakbay ay nagsimula sa huling bahagi ng 2024 na may mga paunang pagsubok na limitado sa gilid ng browser at hiniling ang mga gumagamit na magkaroon ng isang bayad na subscription sa Copilot Pro. Ang maagang bersyon na ito, na detalyado sa isang naunang ulat, ay isang sulyap sa potensyal ngunit nanatiling nakakulong sa browser. Ang preview na ito, na unang ipinahayag sa isang anunsyo sa Windows Insider Blog, ay isang malinaw na indikasyon ng hangarin ng Microsoft na i-embed ang AI nang mas malalim sa operating system mismo. Ang buong pampublikong paglabas ay nagwawakas sa paglipat na ito, na ginagawa ang advanced na pag-andar ng cross-application na magagamit sa lahat sa US at pinapatibay ang katayuan nito bilang isang pangunahing tampok na bintana. app. Mula doon, maaaring piliin ng mga gumagamit na ibahagi ang kanilang pananaw sa isa o kahit na dalawang aplikasyon nang sabay-sabay, na nagpapahintulot sa AI na makakuha ng konteksto at ikonekta ang impormasyon sa pagitan nila. Ang Copilot Vision ay may praktikal na utility dahil ang AI ay maaaring gabayan ang isang gumagamit upang alisin ang mga pagmuni-muni ng larawan sa software sa pag-edit ng imahe at gabayan ang gumagamit sa pamamagitan ng interface ng mga sikat na aplikasyon ng software. Ang pag-andar na ito ay bahagi ng isang naka-refresh na interface ng copilot na pantalan sa gilid ng screen. Sa tabi ng Vision, sinubukan din ng Microsoft ang isang kakayahan ng”File Search”, na nagbibigay kapangyarihan sa copilot upang hanapin at sagutin ang mga katanungan tungkol sa impormasyon na nilalaman sa loob ng mga lokal na file tulad ng mga PDF, spreadsheet, at mga dokumento. Matugunan ang mga potensyal na alalahanin sa pagtatapos ng kontrobersya na nakapalibot sa tampok na Windows Recall. Ang gumagamit ay dapat na aktibong pumili upang magbahagi ng isang tukoy na window sa katulong para makita o pag-aralan kung ano ang nasa iyong screen. Ang modelong opt-in na ito ay nakatayo sa kaibahan ng mas pasibo, palaging-sa pagkuha ng data ng iba pang mga sistema ng AI. Binigyang diin ng kumpanya na ang lahat ng nasuri na nilalaman ay ephemeral, na may isang tagapagsalita na nagpapatunay na wala sa nilalaman na kinasasangkutan ng katulong ay nakaimbak o ginagamit para sa pagsasanay at na ito ay permanenteng tinanggal sa sandaling matapos ang session. 

Ang Copilot Vision ay pino pa rin sa loob ng eksperimentong copilot lab Ang mga modelo ng wikang pangitain na binuo ng Microsoft nang maraming taon. Ang pundasyon para sa mga nasabing tool ay na-preview sa anunsyo ng modelo ng Florence-2 noong Hunyo 2024. Ang teknolohiyang ito ay kumakatawan sa isang makabuluhang paglukso sa kahusayan, ang pinag-isang, prompt na batay sa arkitektura ay nagbibigay-daan sa isang solong, magaan na modelo upang mahawakan ang magkakaibang mga gawain tulad ng captioning at object detection na dati nang hinihiling ng maraming dalubhasang mga sistema.

Gayunpaman, ang teknolohiya ay hindi walang mga limitasyon. Ang mas malawak na larangan ng Vision AI ay nahaharap pa rin sa mga makabuluhang hurdles, na may isang kamakailang pag-aaral mula Oktubre 2024 na naglalantad ng mga malubhang bahid sa mga nangungunang modelo, na nakipagbaka sa mga visual puzzle na nangangailangan ng pangunahing pagkilala sa pattern at pangangatuwiran. Ang kontekstong ito ay binibigyang diin na habang ang Copilot Vision ay kumakatawan sa isang pangunahing hakbang sa pasulong sa praktikal na tulong ng AI, ang pinagbabatayan na teknolohiya ay nasa isang landas ng aktibong pag-unlad at pagpipino. Ito ay isang madiskarteng pag-repose ng AI bilang isang pangunahing utility ng Windows operating system. Sa pamamagitan ng paggawa ng isang malakas, katulong na cross-application na malawak at malayang magagamit, ang Microsoft ay pumusta sa pangitain nito para sa hinaharap ng personal na computing. Ang tagumpay nito ay malamang na nakasalalay sa kung ang mga gumagamit ay yakapin ang bagong paradigma ng isang”pang-araw-araw na kasama”at pinagkakatiwalaan ang privacy-first, opt-in na disenyo sa mas integrated ngunit hindi gaanong transparent na mga modelo ng mga katunggali nito.