arxiv , szeroko stosowana platforma otwartego dostępu do przedruków naukowych hostowanych przez Cornell University, przesuwa całą swoją działalność z projektu wirtualnego z uniwersytetu do platformy w chmurze Google (GCP).
Ruch Anchors A Multi-Year TEGELINE TEALINE (Cloud Edition), zaprojektowany w celu wzmocnienia pojemności i stabilności platformy, ponieważ zmaga się ona wraz ze wzrostem użytkowania i dąży do zrzucenia starszego kodu.
Ta zmiana pojawia się jako ARXIV, która obsługuje ponad 2,6 miliona artykułów i obsługuje około pięciu milionów użytkowników co miesiąc, nawiguje zarówno wewnętrzne zadłużenie techniczne, jak i zewnętrzne presję finansową. Inicjatywa otrzymuje wsparcie od Fundacji Simonsa i wskazówek strategicznych Invest in Otwarta infrastruktura, która rozpoczęła się na początku 2023 r..
Modernizing A Modernits Platforma
dla wielu badań, dla wielu badań, dla wielu badań. Szczególnie w fizyce i matematyce ARXIV jest codziennym zasobem. „Wszyscy w matematyce i fizyce go używają”, informatyk Scott Aaronson powiedział Wired w marcu. „Skanuję to każdej nocy.”
Założone przez Paula Ginsparga w 1991 r. W Los Alamos National Laboratory, ARXIV ominął tradycyjne, powolne czasopisma recenzji, zanim przeniosły się na e-mail/później, umożliwiając szybkie dzielenie się przedprintami. Jego sukces wykazał, według fizyka Paula Fendleya: „że możesz rozwieść faktyczne przekazanie wyników z procesu sędziowania.”
Jednak techniczne podstawy platformy starzeją się. Projekt ARXIV CE bezpośrednio kieruje tę starszą infrastrukturę. Podstawowy cel szczegółowo opisany na temat Strona kariery Arxiv Czy zastąpienie pozostałych komponentów backendowych Perla i PHP, standardowe na Python. usługi. Aplikacje pakietów konteneralnych do spójnego wdrażania, a ARXIV planuje korzystać z technologii takich jak Kubernetes (system open source do automatyzacji zarządzania kontenerami) lub Google Cloud Run (zarządzana platforma kontenerowa bez serwera).
Ulepszone monitorowanie, rejestrowanie oraz ciągłe integrację/ciągłe wdrażanie (CI/CD) rurociąg-automatyzowanie kod-są również kluczowymi celami technicznymi. Te wysiłki uzupełniają istniejące wybory infrastruktury, takie jak użycie Sieć dostarczania treści szybko (cdn) .
Strategiczne recenzje i przyszłość
Przeniesienie do GCP jest przedstawiane jako niezbędny krok dla szerszych ulepszeń usług. ARXIV ma na celu łatwiejsze rozszerzenie na nowe obszary tematyczne, zwiększyć kolekcję metadanych (w tym identyfikatory funduszy i niejednoznaczność autora) oraz poprawić dostępność i ogólną użyteczność dla globalnej społeczności badawczej.
Jest to zgodne z planowaniem strategicznym, które trwają od co najmniej na początku 2023 r. href=”https://investinopen.org/blog/ioi-partners-with-arxiv-to-develop-its-ew-strateic-blueprint/”target=”_ blank”> Inwestuj w otwartą infrastrukturę (IOI) . Ivan Oransky z Fundacji Simonsa zauważył „obszerne doświadczenie IOI w otwartej przestrzeni infrastrukturalnej i ich wiedzy w zakresie zrównoważonego rozwoju i zarządzania, pomoże arxiv kurs przez dziesięciolecia.”
Reakcja społeczności i kontekstu Cornella
Wiadomości o przeprowadzce do GCP, które wywołały dyskusję w społeczności technicznej, zauważone na forums, takie jak
href=”https://news.ycombinator.com/item?id=43726640″target=”_ blank”> Hacker News . Komentatorzy podnieśli obawy dotyczące potencjalnego długoterminowego wzrostu kosztów wraz z wydatkami operacyjnymi w chmurze w porównaniu z lokalnymi kosztami kapitałowymi, ryzykiem blokady dostawcy oraz potencjalnym ograniczeniami dostępu użytkowników w niektórych regionach, takich jak Iran, ze względu na politykę platformy. Jeden użytkownik wyraził sceptycyzm, przewidując „pożegnanie prostoty i stabilność, cześć wygórowane koszty miesięczne dla tej samej/mniejszej jakości usługi.”
inni wskazali na rosnące wymagania dotyczące ARXIV, szczególnie zwiększone obciążenie od krawarów AI uzyskujących dostęp do jego repozytorium, wymagające zwiększonej skalowalności. Użytkownik twierdzący, że bliskie powiązania stwierdził, że obecna platforma „stabilność wynika po prostu z wyjątkowego wysiłku, jaki podejmują, aby go kontynuować.”
Korzystanie z ustalonych usług w chmurze było postrzegane przez niektórych jako praktyczny sposób zarządzania skalowaniem i długiem technicznym. Z Google wymienione już jako sponsor złota , pojawiły się spekulacja na temat potencjalnych kredytów wpływających na wybór. Czas zbiega się również z wyzwaniami finansowymi na Cornell University. Ostatnie Nastąpiło to na uniwersytecie Zatrudnienie Freeze ogłoszone w marcu powołując się na niepewność finansową. Chociaż ARXIV oficjalnie nie powiązał GCP z tymi problemami budżetowymi, ten kontekst zwiększa dyskusję na temat motywacji migracji.
Długoletnia platforma ewoluuje
Od czasu jej powstania, ARXIV stał się centralny dla komunikacji naukowej. Migracja do GCP jest najnowszym krokiem w dostosowaniu platformy, która przetwarza dokumenty często zapisane w LaTex (standardowy system przygotowywania dokumentów w wielu dziedzinach naukowych), do nowoczesnych wymagań technicznych.
Projekt ARXIV CE, ogłoszony już w 2023 r. Za pośrednictwem A Post Patching Progemerów stanowi istotne zaangażowanie w remont systemu. Podczas gdy Ginsparg, który kiedyś opisał ARXIV jako „dziecko, które wysłałem na studia, ale które wciąż wraca do obozu w moim salonie, zachowując się,„ jest mniej zaangażowany na co dzień, platforma pod nowym przywództwem i wraz z niedawnym wsparciem fundamentów podejmuje tę zmianę, aby zapewnić dalszą obsługę świata badań.