Google Colab umożliwia uruchamianie notatników w języku Python w przeglądarce bez konieczności konfiguracji, z darmowymi procesorami graficznymi na poziomie podstawowym i łatwym udostępnianiem. Jeśli nie masz doświadczenia z notatnikami, limitami sesji ani wprowadzaniem własnych danych, ten przewodnik zapewnia przejrzystą, powtarzalną konfigurację, która działa zarówno w planach Free, jak i Pro.
Zanim zaczniesz
Konto Google, którego możesz używać do przechowywania miejsca na Dysku. Aktualna przeglądarka oparta na Chromium lub Safari. Stabilny internet; Colab działa na zdalnych maszynach wirtualnych, które mogą się rozłączyć w przypadku bezczynności. Opcjonalnie: mały zbiór danych na Dysku (CSV/Parquet/obrazy) do ćwiczeń. Opcjonalnie: budżet na Pro/Pro+, jeśli potrzebujesz szybszych procesorów graficznych, dłuższych sesji i obliczeń o wyższym priorytecie.
1) Utwórz swój pierwszy notatnik
Przejdź do Colab i kliknij Nowy notatnik. Zobaczysz komórkę z kodem i komórkę tekstową (Markdown). Kliknij komórkę z kodem i naciśnij Shift+Enter, aby ją uruchomić. Dodaj komórkę tekstową na notatki, naciskając Ctrl+M, a potem B (Mac: Cmd+M, potem B).
2) Wybierz swój sprzęt (CPU, GPU lub TPU)
Otwórz środowisko wykonawcze → Zmień typ środowiska wykonawczego i wybierz Akcelerator sprzętowy: Brak (CPU), GPU lub TPU. Bezpłatni użytkownicy uzyskują zmienną dostępność; Poziomy Pro oferują wyższy priorytet. Po przełączeniu środowisko uruchamia się ponownie.
Wskazówka dla profesjonalistów: Jeśli potrzebujesz CUDA, zweryfikuj to za pomocą !nvidia-smi zaraz po wybraniu procesora graficznego. W przypadku TPU użyj obsługujących ją kompilacji TensorFlow lub JAX.
3) Omówienie komórek i wykonania
Każdy notatnik to liniowa lista komórek. Komórki kodu działają od góry do dołu i mają ten sam stan jądra Pythona. Użyj Shift+Enter, aby uruchomić komórkę i ją przenieść, lub kliknij ikonę odtwarzania. Uruchom ponownie środowisko wykonawcze w dowolnym momencie, wybierając opcję Środowisko wykonawcze → Uruchom ponownie sesję, aby wyczyścić pamięć i zmienne.
4) Zainstaluj potrzebne pakiety
Colab jest dostarczany z wieloma bibliotekami, ale możesz dodać ich więcej w ramach sesji. Aby wywołać polecenia powłoki z komórek, użyj wykrzyknika początkowego:
!pip install polars scikit-learn plotly !apt-get-qq update && apt-get-qq install-y libspatialindex-dev
Uwaga: Instalacje są przechowywane w tymczasowej maszynie wirtualnej i znikają po zakończeniu sesji. Zapisz plik requirements.txt na Dysku i zainstaluj ponownie na górze notatnika, aby zapewnić powtarzalność przebiegów.
5) Niezawodne zapisywanie swojej pracy
Colab automatycznie zapisuje notatki na Twoim Dysku. Użyj opcji Plik → Zapisz kopię na Dysku, aby powielić, lub Plik → Zapisz kopię w GitHubie, aby utworzyć kopię zapasową w repozytorium. Eksportuj za pomocą pliku → Pobierz, aby uzyskać .ipynb, .py lub .html.
Dlaczego tego używać: Zachowujesz czystą, wersjonowaną kopię i unikasz utraty kodu podczas ponownego przetwarzania sesji.
6) Przenieś swoje dane
Możesz przesyłać pliki, montować Dysk Google lub pobierać z Internetu. W przypadku Dysku uruchom:
z google.colab import drive drive.mount(‘/content/drive’) # Przyznaje dostęp do Twojego Dysku importuj pandy jako pd df=pd.read_csv(‘/content/drive/MyDrive/data/sample.csv’) df.head()
Wskazówka dla profesjonalistów: Zachowaj folder/dane w MyDrive/
7) Utrzymuj porządek w plikach projektu
Utwórz na Dysku minimalny układ folderów: dane/, notebooki/, modele/, wyjścia/. Zapisuj modele i artefakty bezpośrednio na Dysku, aby pozostały zachowane po wyłączeniu maszyny wirtualnej.
8) Obserwuj swoją pamięć RAM, dysk i czas
Kliknij miernik RAM/dysku, aby zobaczyć zasoby. Sesje w warstwie bezpłatnej są ograniczone czasowo i mogą zostać rozłączone w przypadku bezczynności lub ograniczonych zasobów. Poziomy Pro wydłużają czas działania i poprawiają stabilność, ale długotrwałe zadania powinny nadal często sprawdzać dane wyjściowe na Dysku.
9) Udostępniaj i współpracuj
Użyj przycisku Udostępnij, aby dodać przeglądających, komentatorów i redaktorów. Komentarze działają jak Dokumenty. Aby zapewnić bezpieczniejszą współpracę, utwórz kopię „wykonywczą” dla każdego członka zespołu, aby uniknąć wzajemnego zakłócania stanu.
10) Używaj formularzy i parametrów
Zamień komórki w mini interfejsy użytkownika z polami formularzy. Dodaj linię np. #@param {type:”slider”, min:1, max:128, step:1} nad zmienną, aby udostępnić kontrolę. Pomaga to nietechnicznym członkom zespołu zmieniać dane wejściowe bez dotykania kodu.
11) Połącz się z Gitem i zbiorami danych
Możesz klonować repozytoria za pomocą !git clone, pobierać aktualizacje za pomocą !git pull i wypychać ponownie, korzystając z osobistego tokena dostępu. W przypadku publicznych zbiorów danych pobierz za pomocą żądań !wget lub Python. Zawsze zapisuj ostateczną kopię na Dysku, a nie tylko na maszynie wirtualnej.
12) Eksportuj wyniki w przejrzysty sposób
Zapisuj ważne wyniki: wykresy w formacie.png, tabele w formacie CSV/Parquet, wyszkolone modele na Dysku. Następnie wyeksportuj notatnik jako .ipynb do przyszłej edycji i migawkę .html do udostępnienia.
13) Rozwiąż typowe problemy
„Sesja uległa awarii” po instalacji lub intensywnym szkoleniu: Uruchom ponownie środowisko wykonawcze, zmień kolejność instalacji na górze i przeprowadź kontrolę danych wyjściowych na Dysku. Nie można uzyskać procesora graficznego: Przełącz tymczasowo na opcję Brak, spróbuj ponownie później lub przejdź na poziom płatny, aby uzyskać wyższy priorytet. Pliki znikają po ponownym połączeniu: wszystko poza Dyskiem jest efemeryczne. Zawsze pisz na /content/drive/…. Powolna instalacja przy każdym uruchomieniu: Przechowuj koła w pamięci podręcznej na Dysku i stamtąd instaluj lub utwórz komórkę konfiguracyjną, która zainstaluje wszystko na raz.
Wskazówki
Wskazówka dla profesjonalistów: używaj magii %pip i %conda, jeśli jest dostępna, aby instalacje były powiązane z jądrem. Wskazówka: dla powtarzalności wersje z pinami: pandy==2.2.3. Bezpieczeństwo: uruchamiaj tylko zaufane notatniki; komórki kodu mogą wykonywać polecenia powłoki. Szybkość: Przenieś ciężkie przetwarzanie wstępne do GPU/TPU lub wektoryzuj za pomocą NumPy/Polars, aby zredukować pętle Pythona. Organizacja: nadawaj notatkom nazwy, takie jak YYYY-MM-DD_topic.ipynb , aby Dysk sortował je automatycznie.
Często zadawane pytania
Czy Colab jest naprawdę darmowy? Tak, warstwa bezpłatna obejmuje procesor i oportunistyczny dostęp do procesorów graficznych/TPU przy krótszych sesjach. W przypadku płatnych poziomów priorytetem jest szybszy sprzęt i dłuższy czas działania.
Jak długo trwają sesje? Różni się to w zależności od poziomu i aktywności. Spodziewaj się automatycznych rozłączeń po okresach bezczynności lub bardzo długich biegach. Często kontroluj przejazdy.
Czy mogę używać języka R lub innych języków? Python jest najwyższej klasy. Możesz wywoływać narzędzia systemowe przez !, a niektóre jądra społeczności obsługują R, ale obsługa koncentruje się głównie na Pythonie.
Czy mogę uruchamiać zadania w tle? Brak trwałych zadań w tle; maszyna wirtualna wstrzymuje się po zakończeniu sesji. Użyj Dysku, aby zapisać wyniki, a gdy przerośniesz Colab, rozważ przeniesienie zadań produkcyjnych do usługi zarządzanej.
Jaka jest różnica między procesorem graficznym a TPU? Układy graficzne to akceleratory ogólnego przeznaczenia, idealne do zastosowań PyTorch i TensorFlow. TPU obsługują TensorFlow/JAX z ogromną przepustowością matematyczną macierzy w przypadku niektórych modeli.
Podsumowanie
Utwórz nowy notatnik i poznaj podstawy komórek. Wybierz CPU/GPU/TPU w obszarze Runtime. Zainstaluj wymagane pakiety na górze. Zamontuj dysk i załaduj swoje zbiory danych. Organizuj dane wyjściowe w folderach na Dysku. Monitoruj pamięć RAM/dysk; uruchom ponownie, jeśli zajdzie taka potrzeba. Udostępniaj bezpiecznie i korzystaj z formularzy parametrów. Eksportuj do plików.ipynb,.py i.html w celu ponownego użycia i udostępnienia.
Wnioski
Uruchom w przeglądarce, wybierz odpowiedni akcelerator, zamontuj Dysk i przypnij wersje pakietu. Dzięki tej bazie możesz trenować modele, analizować dane i udostępniać wyniki bez konieczności konfiguracji lokalnej. Spodziewaj się sporadycznych ponownych uruchomień; Twój przepływ pracy pozostanie bezpieczny, jeśli konsekwentnie będziesz zapisywać dane i artefakty na Dysku. Jeśli potrzebujesz bardziej stabilnych obliczeń lub zaawansowanych procesorów graficznych, przejdź na warstwę płatną lub przenieś dojrzałe obciążenia do dedykowanej usługi.