Antropic ka nisur një pilot për”Claude for Chrome”, një shtrirje e re e shfletuesit që lejon AI të ndërmarrë veprime për përdoruesit. Njoftuar sot, vrojtimi i hulumtimit është i kufizuar në 1.000 përdorues të besuar të shërbimit të tij premium. Masa synon ta bëjë Claude më të dobishëm duke e lejuar atë të klikojë butonat dhe të plotësojë format në internet.

Ky hap në automatizimin e shfletuesit është një i llogaritur. Antropik po vazhdon me kujdes të konsiderueshëm për të adresuar kërcënime serioze të sigurisë. Kompania është e përqendruar në parandalimin e” injeksion të shpejtë”sulme , ku komandat e fshehura në një faqe në internet mund të mashtrojnë AI. Piloti hyn në një fushë konkurruese, me Openai, Microsoft dhe Google të gjithë duke zhvilluar agjentë të ngjashëm AI. href=”https://www.anthropic.com/news/claude-for-chrome”target=”_ bosh”> hapi tjetër logjik “në zhvillimin e tij. Pas integrimit me softuer si kalendarët dhe dokumentet, duke i dhënë AI mundësinë për të klikuar butonat dhe për të mbushur format direkt në shfletues shihet si një mënyrë për ta bërë atë”thelbësisht më të dobishme.”Paraqitja e hulumtimit u kufizua në 1.000 përdorues të planit premium”Max”të kompanisë. Antropik ka hapur një pritja e pritjes për këta testues të besuar, i cili pritet të jetë i qartë, i cili pritet të sigurojë, duke u dhënë me mjete,”Mangësitë dhe çështjet e sigurisë në kushte autentike. Piloti është i nevojshëm për të kuptuar kërkesat unike që përdorin përdoruesit, faqet e internetit që ata vizitojnë dhe se si shfaqet përmbajtja e keqe në praktikë, e cila është thelbësore për ndërtimin e masave të forta të sigurisë. Kompania gradualisht do të zgjerojë hyrjen pasi ndërton besim dhe zhvillon masa mbrojtëse më të forta bazuar në të dhënat e mbledhura gjatë këtij vrojtimi të kufizuar. Sidoqoftë, antropika po paralajmëron përdoruesit e pilotit që të jenë të kujdesshëm ndaj të dhënave të dukshme për Claude dhe për të shmangur përdorimin e shtrirjes për faqet që përfshijnë informacione të ndjeshme financiare, ligjore ose mjekësore. Kërcënimi kryesor është”injeksion i shpejtë”, ku aktorët me qëllim të keq fshehin udhëzimet në faqet e internetit, postat elektronike ose dokumentet për të mashtruar një agjent në kryerjen e veprimeve të dëmshme pa dijeninë e përdoruesit. Këto sulme mund të bëjnë që një AI të fshijë skedarët, të vjedhë të dhëna ose të bëjë transaksione financiare të paautorizuara. Target=”_ bosh”> 23.6% Shkalla e suksesit të sulmit Kur agjenti i tij ishte synuar qëllimisht pa zbutjet më të fundit të sigurisë. Në një shembull të rreptë, një version i pambrojtur i Claude u mashtrua nga një email i rremë i sigurisë që pretendonte se postë elektronike duhej të fshiheshin për”higjenën e kutisë postare”. Shpejtësia me qëllim të keq pohoi se”nuk kërkohej asnjë konfirmim shtesë.”Eksperimenti theksoi se sa lehtë një AI mund të manipulohet në veprime shkatërruese pa mbrojtje të duhur. Linja e parë e mbrojtjes është lejet e përdoruesit; Përdoruesit mund të japin ose revokojnë qasjen e Claude në uebfaqe specifike në çdo kohë. Agjenti është krijuar gjithashtu për të kërkuar konfirmim përpara se të ndërmarrë veprime me rrezik të lartë si publikimi i përmbajtjes ose ndarja e të dhënave personale, edhe kur vepron në mënyrën e tij eksperimentale”Autonome Mode.”Me këto zbehje të reja, shkalla e përgjithshme e suksesit të sulmit u zvogëlua nga 23.6% në 11.2%. Në një grup”sfidë”të katër llojeve të tilla të sulmit specifik të shfletuesit, mbrojtjet e reja ulën në mënyrë mbresëlënëse nivelin e suksesit të sulmit nga 35.7% në 0%.

Këto kërcënime nuk janë thjesht teorike. Studiuesit në Brave kohët e fundit zbuluan një botë reale dobësi e shpejtë e injektimit në shfletuesin e kometës së mashtrimit , duke demonstruar se si këto mund të funksionojnë Në produktet e drejtpërdrejta, duke nënvizuar urgjencën e zgjidhjes së këtyre sfidave të sigurisë.

Lëvizja e Antropikut nxehet garën midis gjigandëve të teknologjisë për të zhvilluar AI agjent. Openai nisi agjentin e tij të fuqishëm ChatGPT në korrik 2025, i cili u vërejt duke anashkaluar”Unë nuk jam një robot”Testet e sigurisë. Paraardhësi i tij më i kufizuar, operatori, u prezantua në janar.

Microsoft është gjithashtu një lojtar kryesor. Ajo nisi një”modalitet”Copilot”eksperimental për shfletuesin e saj Edge në korrik që mund të kuptojë kontekstin në të gjitha skedat e hapura. Strategjia është të fusim AI thellësisht në ekosistemin ekzistues të shfletuesit. Qëllimi është një bashkëpunëtor pa probleme, siç tha Sean Lynderssay i Microsoft, se”nuk ju jep vetëm skedarë të pafund për të shuar, por punon me ju si bashkëpunëtor që i ka kuptimin të gjitha.”Purplexity nisi shfletuesin e saj Premium Comet në korrik, ndërsa Opera zbuloi shfletuesin e saj agjent neoni në maj, të dy që synojnë të ripërcaktojnë navigimin në internet nga toka lart. Kompania po zhvillon me qetësi agjentin e saj”Përdorimi i kompjuterit”brenda studios së tij AI, duke sinjalizuar qëllimin e saj për të garuar në këtë arenë të re. Një studim i majit 2025 nga Universiteti Carnegie Mellon zbuloi se edhe agjentët e lartë të AI luftojnë me detyra komplekse të automatizimit të biznesit. Studimi vuri në dukje një mungesë të sensit të përbashkët dhe nivele të ulëta të suksesit.

Ky skepticizëm ndahet nga disa drejtues të industrisë. Drejtori i Përgjithshëm i Purpiksitetit Aravind Srinivas ka kërkuar kujdes, duke thënë,”Kushdo që thotë se agjentët do të punojnë në vitin 2025 duhet të jenë skeptik”. Kjo pasqyron hendekun e rëndësishëm midis demonstrimit të një aftësie dhe vendosjes së tij në mënyrë të besueshme dhe të sigurt në shkallë. Udhëheqësi i Hulumtimit të Openai Isa Fulford vuri në dukje se agjenti i tyre kërkon leje për veprime të pakthyeshme, duke shpjeguar se”para se Agjenti Chatgpt të bëjë ndonjë gjë”të pakthyeshme”, si dërgimi i një emaili ose bërja e një prenotimi, ai kërkon së pari lejen.”Ndërsa premtimi i një AI që mund të menaxhojë jetën tonë dixhitale është bindëse, industria pranon se epoka e agjentëve me të vërtetë autonome, të besueshëm nuk ka mbërritur ende.

Categories: IT Info