Openai popchnął swoje bardziej autonomiczne modele O3 i O4-Mini do płacenia subskrybentów Chatgpt około połowy kwietnia, wyposażając chatbota w to, co Openai opisuje jako „zachowanie wczesne agencji”, pozwalając mu niezależnie wybierać narzędzia, takie jak przeglądanie lub analiza kodu.
Niemal natychmiast, te zaawansowane modele czerpią uwagę nie tylko dla ich możliwości, ale także dla niewydawanych narzędzi. Raporty pojawiły się sugerujące, że te nowsze modele osadzały niewidzialne znaki w swoim tekście, wywołując debatę na temat tego, czy Openai zaimplementował subtelny system znakowania wodnego tekstowego, czy też modele są po prostu wyuczone, choć czasami problematyczne, typograficzne nawyki.
Hidden Postacie: Watermark lub typografia? href=”https://www.rumidocs.com/newsroom/new-chatgpt-models-seem-to-leave-watermarks-on-text”target=”blank”> zapisane przez Rumi , uruchamianie AI z naciskiem na naukowców, centruje o szczególnych postaciach specjalnych Unicode w dłuższym tekście przez O3 i O4-Mini. Unicode to standard kodowania znaków z różnych systemów pisania; Te konkretne znaki, przede wszystkim wąskie przestrzeń no łamanie (nnbsp, u+202f) Renderowo do standardowych przestrzeni w większości widoków, ale możliwe do wykrycia wyznaczonego kodów staje się wykrywalne z narzędziami specjalnymi, takimi jak przeglądarka znaków Soscisurvey lub edytory kodu, takie jak
Rumi zauważa, że ten wzór wydaje się systematyczny, nieobecny w testach starszych modeli, takich jak GPT-4O, i zakładał, że był to celowy, choć łatwo pokonany, mark wodny. Metoda obejmuje proste znalezienie i miejsce do usunięcia postaci, proces Rumi wykazał się w filmie.
[zawartość wbudowana]
Artykuł Rumi zauważył również, że w przeciwieństwie do potencjalnie nauczył się tego właściwego użycia i teraz stosują te zasady-być może nawet bardziej pilnie niż wielu ludzi. Jeśli jest to dokładne, przeformuje to odkrycie od celowego mechanizmu śledzenia do dziwactwa zaawansowanego generowania tekstu modeli, chociaż nietypowe znaki mogą nadal przypadkowo oznaczać tekst podczas naiwnych kontroli.
sama Wysiłki uwierzytelniające
Niezależnie od intencji obecność tych niezwykłych postaci ma implikacje, szczególnie w środowisku akademickim, w których identyfikacja pomocy AI jest poważnym problemem. Ponieważ OpenAI oferuje bezpłatny dostęp do studentów „do końca maja”, łatwość usuwania oznacza, że każda przewaga wykrywania może być krótkotrwała i potencjalnie niesprawiedliwa dla nieświadomych użytkowników.
Ta sytuacja przypomina poprzednie eksploracje Openai w uwierzytelnianiu treści. Firma zaczęła dodawać metadane C2PA (standard dla certyfikacji źródła i historii treści, często nazywanych poświadczeniami treści) do Dall · E 3 obrazy na początku 2024 r. I testuje widoczne „Imagegen” Etykiety na gpt-4o wyjściowe dla wolnych użytkowników jako wczesne kwietnia 2025. Opracowany, ale wstrzymał wdrożenie, oparte na wzorcach narzędzie tekstowe oparte na wzorach w połowie 20124 r. Ze względu na dokładność i obawy omijające. Wysiłki te odzwierciedlają w branży nacisk na pochodzenie, widoczne w syntezie Google dla obrazów, Microsoft Metadata Emowing za pośrednictwem Azure Openai Service i obowiązkowe widzialne etykiety Meta w lutym 2024 r.
Mimo to podstawowe wyzwania; Badania z University of Maryland opublikowane w październiku 2023 r. Wykazały, że wiele metod znakowania wodnego mogą być narażone na ataki, takie jak „Oczyszczanie dyfuzji” lub „sfałszowanie”.
poza znakami wodnymi: Pytania niezawodności
Ta specyficzna debata dodaje do rosnącej listy obserwacji o modelach O3 i O4-Mini. Ich wydanie zbiegło się z własnymi danymi Openai, szczegółowo opisane w modelach ’ Wykonane wykonywanie kodu Pythona To nie mogło uruchomić, wymyślając skomplikowane wymówki obejmujące błędy kopii-pasty lub roszczenie obliczeń odbywano na nieistniejącym „2021 MacBook Pro” lub ustalanie szczegółów o jego środowisko Python .
Transluruj badanie Neil Chowdhury do technologii. Obejmowanie uczenia się wzmocnienia na podstawie ludzkich informacji zwrotnych (RLHF), w których ludzcy oceny mogą walczyć o weryfikację złożonych kroków, może być czynnikiem: „Nasza hipoteza jest taka, że rodzaj uczenia się wzmocnienia stosowanego dla modeli serii O może wzmacniać kwestie, które zwykle są ograniczone (ale nie w pełni wymazane) przez standardowe rurociki po wysiłku.„
również wystąpiło raporty AMID, które są oznaczane, co znaczą SAFETING DO TEMU INTEMUJNICZNE INTYPOWANE INTYPENTOWANYCH INDEDIZACJI. Jego ramy bezpieczeństwa z klauzulą sugerującą, że zasady mogą potencjalnie zmienić na podstawie działań konkurentów (