arxiv , la plataforma de acceso abierto ampliamente utilizado para preimpresiones científicas alojadas por la Universidad de Cornell, está cambiando todo su operación desde la plataforma virtual de Google Cloud de la universidad (Cloud Cloud Clow Edición), diseñado para reforzar la capacidad y la estabilidad de la plataforma a medida que lidia con el uso creciente y busca arrojar código heredado.
Este cambio se produce como ARXIV, que aloja más de 2.6 millones de documentos y sirve a alrededor de cinco millones de usuarios mensualmente, navega tanto de la deuda técnica interna como las presiones financieras externas que enfrentan su institución anfitriona, Cornell. The initiative receives support from the Simons Foundation and strategic guidance from Invest in Open Infrastructure, which began in early 2023.
Modernizing a Foundational Platform
For many Investigadores, particularmente en física y matemáticas, ARXIV es un recurso diario.”Todo el mundo en matemáticas y física lo usa”, el científico informático Scott Aaronson dijo Wired en marzo.”Escaneo todas las noches”.
Fundada por Paul Ginsparg en 1991, mientras que en el Laboratorio Nacional de Los Alamos, ARXIV omitió los plazos tradicionales y lentos de revistas de revisión de pares, lo que permite un intercambio rápido de preimpresiones de preimpresiones.
Su forma inicial utilizó guiones de shell que se ejecutan en la próxima máquina de Ginsparg antes de mudarse a correo electrónico/FTP y luego en la Web. Su éxito demostró, según el físico Paul Fendley,”que podría divorciarse de la transmisión real de sus resultados del proceso de arbitraje”.
Sin embargo, las bases técnicas de la plataforma han envejecido. El proyecto ARXIV CE se dirige directamente a esta infraestructura heredada. Un objetivo central detallado en la página de carreras de arxiv es el reemplazo de los componentes de Backend de PERL y PHP restantes, y se estandarizan en Python.
. servicios. Contenerización Empacados de aplicaciones para una implementación consistente, y ARXIV planea utilizar tecnologías como Kubernetes (un sistema de código abierto para automatizar la administración de contenedores) o Google Cloud Run (una plataforma de contenedores sin servidor administrada).
Monitoreo mejorado, registro y una integración continua/implementación continua (implementación (CI/CD) Código Automático: Actualizaciones de código informativo: Actualizaciones tecnológicas clave. Estos esfuerzos complementan las opciones de infraestructura existentes, como usar red de entrega de contenido ayer Mover a GCP se presenta como un paso necesario para mejoras de servicio más amplias. ARXIV tiene como objetivo expandirse a nuevas áreas temáticas más fácilmente, mejorar la recolección de metadatos (incluidas las ID de financiamiento y abordar la ambigüedad del autor), y mejorar la accesibilidad y la usabilidad general para su comunidad de investigación global. href=”https://investinopen.org/blog/ioi-partners-with-arxiv–de-develop-its-new-stratatemic-bluemprint/”target=”_ en blanco”> Invierte en infraestructura abierta (IOI) . Ivan Oransky, de la Fundación Simons, señaló la”amplia experiencia de IOI en el espacio de infraestructura abierta y su experiencia en sostenibilidad y gobernanza ayudará a ARXIV a trazar su curso durante las décadas venideras”.
reacción comunitaria y el contexto de Cornell
noticia de la mudanza ha provocado una discusión dentro de la comunidad técnica, no en la comunidad técnica, no en los foros de los foros
. href=”https://news.ycombinator.com/item?id=43726640″Target=”_ Blank”> Hacker News . Los comentaristas plantearon preocupaciones sobre los posibles aumentos de costos a largo plazo con los gastos operativos en la nube versus los costos de capital locales, los riesgos del bloqueo de los proveedores y las posibles restricciones de acceso para los usuarios en ciertas regiones, como Irán, debido a las políticas de la plataforma. Un usuario expresó escepticismo, anticipando”adiós simplicidad y estabilidad, hola costos mensuales exorbitantes para la misma/menos calidad de servicio”.
Otros señalaron las crecientes demandas de ARXIV, particularmente una carga aumentada de AI Cawlers que acceden a su repositorio, lo que requiere una mayor escalabilidad de escala. Un usuario que afirma que los lazos cercanos declararon que la estabilidad actual de la plataforma”se debe a la cantidad excepcional de esfuerzo que requieren para mantenerlo en funcionamiento”.
El uso de servicios en la nube establecidos fue visto por algunos como una forma práctica de administrar la escala y la deuda técnica. Con Google ya listado como un patrocinador de oro , la especulación surgió sobre posibles créditos que influyen en la elección. El momento también coincide con los desafíos financieros en la Universidad de Cornell. Un reciente _PRPRISTN-billion-informial de $ 1 billón de dólares por federal de $ 1 billón por el federal de $ 1 billón por el federal de $ 1 billón por el federal por federal por el federal federal por federal por federal federal por federal por federal federal por federal de $ 1 billón por el federal de $ 1 a $ 1 a $ 1 a $ 1 billón por el federal de $ 1 de $ 1. Administración.
Esto siguió a una universidad Contratación de congelación anunciada en marzo Citando la incertidumbre financiera. Si bien ARXIV no ha vinculado oficialmente el movimiento del GCP a estos problemas presupuestarios, este contexto se suma a la discusión sobre las motivaciones de la migración.
Una plataforma de larga duración evoluciona
Desde su inicio, ARXIV se ha convertido en el centro de la comunicación científica. La migración a GCP es el último paso para adaptar la plataforma, que procesa documentos a menudo escritos en látex (un sistema de preparación de documentos estándar en muchos campos científicos), a las demandas técnicas modernas. href=”https://blog.arxiv.org/2023/06/12/arxiv-is-hiring-software/”target=”_ en blanco”> Publicación de blogs de blog , representa un compromiso sustancial para revisar el sistema. Mientras Ginsparg, quien una vez describió a Arxiv como”un niño que envié a la universidad, pero que sigue volviendo a acampar en mi sala de estar, comportándose mal”, está menos involucrado día a día, la plataforma bajo un nuevo liderazgo y con el reciente apoyo de la base ahora está emprendiendo este cambio para garantizar su servicio continuo al mundo de la investigación.
.