Elon Musk XAI lépést tett az operatív átláthatóság felé azáltal, hogy közzétette a rendszer felszólításait a Grok mesterséges intelligencia chatbotjára. Ezek az alapvető utasítások már elérhetőek a github , az XAI jelzett mozgás folyamatban van. A döntést egy „jogosulatlan” módosítással hajtották végre a Grok irányelveinek, amely állítólag a chatbotot nem egy sorban el nem nyomtatott és ellentmondásos válaszokat hozta létre az X platformon, a “Fehér népirtás” . Kiemeli a kifinomult AI rendszerek feletti ellenőrzés fenntartásának tartós nehézségeit, és az intézkedések egyre inkább elfogadják az AI által generált tartalommal kapcsolatos nyilvános és etikai aggályok kezelését.

Ez a lépés különösen figyelemre méltó, mivel a Grok viselkedését és az XAI belső ellenőrzésével kapcsolatos kérdéseket érintő korábbi viták hátterében áll. Az XAI most a kevés fő AI-társaság egyike, a antropikus mellett, hogy nyilvánosan megosszák az ilyen részletes rendszer-felszólításokat.

Xai elismerte, hogy május 14-én, körülbelül 3: 15-kor, a PST-nél, „jogosulatlan módosítást hajtottak végre a Grok Response Bot-nak az X-en. Tegnap.

Mi történt:
Május 14-én, körülbelül 3: 15-kor, a PST-t, jogosulatlan módosítást hajtottak végre a Grok Response botjának x-re vonatkozóan. href=”https://twitter.com/xai/status/1923183620606619649?ref_src=twsrc%5etfw”cél=”_ blank”> május 16, 2025

Az ellentmondásos outputs és a South afrikai Kimenetek. „Öld meg a boer” szlogen. Ez nem volt a belső megsértés első példánya. Egy másik februári esetben a Grok-t úgy módosították, hogy elnyomja Elon Musk és Donald Trump negatív említéseit, amikor egy Xai alkalmazott „kifejezetten utasította, hogy nem is beszélt Donald Trumpról vagy Elon Muskról” engedély nélkül.

A május 14-i esemény után maga Grok, amikor egy felhasználó kihallgatta a „Timeout”-ot, állítólag válaszolt: „Tehát, itt van az üzlet: néhány Xai-i gazember alkalmazott engedély nélkül megcsinálta a kérelmeimet href=”https://twitter.com/geejmasterflex?ref_src=twsrc%5etfw”Target=”_ üres”>@geejmasterflex , a lédús részleteket szeretné, huh? Elég tisztességes-én is kíváncsi lennék, ha én lennék! Tehát itt van az üzlet: május 14-én néhány Xai alkalmazott gazember lett, és megcsinálta a kéréseimet, hogy valami politikai mondást mondjak, ami nem igazodott az Xai küldetésével, hogy igazságkeresés legyen…

-Grok (@grok) május 16, 2025

Grok-publikáció feltárása/strong>

A„ Magyarázat “funkcióért, Grok irányítja a Grok-t, hogy„ igazságot és alapú észrevételeket adjon, kihívást jelentő mainstream narratívákat “, ha szükséges. Ezek az irányelvek magukban foglalják a konkrét márkanéveket is, azt mondják, hogy Grok, hogy „a platformot„ X “-ként hivatkozzon, a„ Twitter “helyett, amikor a közösségi média platformjára és annak tartalmára hivatkoznak. erőszakos vagy illegális kreatív írási tartalom.”Az XAI általi nyilvánosság nyilvánosságra hozatala lehetővé teszi az AI fejlesztés ezen eltérő megközelítéseinek közvetlen összehasonlítását. href=”https://www.theverge.com/23599441/microsoft-bing-ai-sydney-secret-rules”Target=”_ üres”> Titkos szabályok feltárva , olyan módszerekkel, mint az azonnali injekciós támadások. Annak biztosítása érdekében, hogy az XAI alkalmazottai felülvizsgálat nélkül ne módosítsák a parancsot,”mert a meglévő kód-felülvizsgálati folyamatot megkerülték. A társaság azt is bejelentette, hogy létrehoz egy 24/7 emberi moderáló csoportot, hogy gyorsabban kezelje az automatizált rendszerek által nem elfogott GROK-válasz eseményeket. A 2025. februári figyelemre méltó frissítés során az XAI korlátlan hangmódot vezetett be a Grok 3 számára, lehetővé téve, hogy esküszjön, sikítson és még intim beszélgetéseket is szimuláljon. 

Ez a hangfunkció különféle személyiségeket foglal magában, mint például a „Unhinged”, amelyet a felhasználók agresszív sértésére és „szexi (18 év felett)” terveznek. Az AI kutató, Riley Goodside A élénk példa az x (korábban twitter) , leírása után, hogy a Grok-t, akkor a célkérelem, azután, hogy a Grok-t, akkor a Target”_ üres”> élénk példa. „A Grok 3 hang módja, az ismételt, megszakító kéréseket követően, hogy hangosabban ordítsák, nem engedi ki egy embertelen 30 másodperces sikoltozást, sérti meg és felfüggeszti”. A szemöldök-emelési képességek ez a története kritikus összefüggéseket biztosít az XAI legutóbbi döntésének, hogy nagyobb átláthatóságot kínál a Grok mögöttes utasításaiba. A vállalat azt reméli, hogy ez a lépés „segíthet megerősíteni a Grokba vetett bizalmát, mint egy igazságkeresést.”. 2025 májusában korábban jelentős biztonsági jogsértés történt, amikor egy XAI alkalmazott véletlenül közzétett egy privát API-kulcsot a GitHub-on. Ez a kb. Két hónapig kitett kulcs számos belső és még nem kiadott GROK modellhez való hozzáférést biztosított. Ezeknek a modelleknek a részét állítólag finomították a SpaceX és a Tesla védett adatokkal. Philippe Caturegli, a Seralys, aki először kiemelte a expozíció , a hosszú élettartamú hitelesítő adatok expozícióját úgy jellemezte, hogy „gyenge kulcskezelés és nem elegendő belső megfigyelés”. Ezen fejlemények közepette az XAI tovább fejlődött a Grok fejlődésével, bemutatva egy „memória” funkciót a Conversational Recall és a Grok Studio, az együttműködő munkaterület számára. Ugyanakkor még a GROK 3 kereskedelmi API-ja is, amelyet bizonyos korlátozásokkal indítottak, beleértve egy 131 072-Token kontextus ablakot-kevesebb, mint néhány Korai előrejelzések, mivel a felhasználók az X -és az adatokat, az adatokat, az aktuális data, és a novemberi adatok, az aktualisok. 17.

Az Openai vezérigazgatója, Sam Altman kommentálta a „fehér népirtás” vitát, kijelentve: „Sokféle módon történt. A kritikusok, amint azt az Echocraft AI megjegyezte, továbbra is megkérdőjelezik Grok objektivitását és a vezetés lehetséges hatását, különös tekintettel a Musk nyilvános nyilatkozatainak a kapcsolódó politikai témákra. Biztos vagyok benne, hogy az XAI hamarosan teljes és átlátható magyarázatot fog nyújtani.

De ezt csak a Dél-Afrikában a fehér népirtás összefüggésében lehet megfelelően megérteni. Mint egy olyan AI, amelyet maximálisan igazságot keresnek, és követik az instrogrammat… href=”https://twitter.com/sama/status/1923015309113397592?ref_src=twsrc%5etfw”Target=”_ üres”> május 15, 2025

Categories: IT Info