Google Colab membolehkan anda menjalankan buku nota Python dalam penyemak imbas dengan persediaan sifar, GPU percuma pada peringkat kemasukan, dan perkongsian mudah. Jika anda baru untuk buku nota, had sesi, atau membawa data anda sendiri, panduan ini memberi anda persediaan yang bersih dan berulang yang berfungsi pada kedua-dua pelan percuma dan pro.

Sebelum anda memulakan

akaun Google yang boleh anda gunakan untuk penyimpanan pemacu. Penyemak imbas atau safari berasaskan kromium yang terkini. Internet yang stabil; Colab berjalan pada VM jauh yang boleh putus jika terbiar. Pilihan: Dataset kecil dalam pemacu (CSV/Parquet/Images) untuk berlatih dengan. Pilihan: Bajet untuk Pro/Pro+ jika anda mahu GPU lebih cepat, sesi yang lebih lama, dan pengiraan keutamaan yang lebih tinggi.

1) Buat buku nota pertama anda

Pergi ke Colab, klik Notebook Baru. Anda akan melihat sel kod dan sel teks (markdown). Klik sel kod dan tekan Shift+ENTER untuk menjalankannya. Tambah sel teks untuk nota dengan ctrl+m kemudian b (mac: cmd+m, kemudian b).

2) Pilih perkakasan anda (cpu, gpu, atau tpu)

Pengguna percuma mendapat ketersediaan berubah; Pro peringkat menawarkan keutamaan yang lebih tinggi. Selepas beralih, persekitaran dimulakan semula. GPU. Untuk TPU, gunakan TensorFlow atau Jax membina yang menyokongnya.

3) Memahami sel dan pelaksanaan

Setiap buku nota adalah senarai sel linear. Sel-sel kod berjalan di atas ke bawah dan berkongsi keadaan kernel python yang sama. Gunakan Shift+Enter untuk menjalankan sel dan bergerak, atau klik ikon Play. Mulakan semula runtime pada bila-bila masa melalui Runtime → Restart sesi untuk membersihkan memori dan pembolehubah.

4) Pasang pakej yang anda perlukan

kapal colab dengan banyak perpustakaan, tetapi anda boleh menambah lebih banyak per-ression. Gunakan titik seruan terkemuka untuk memanggil arahan shell dari sel:

! Pip pemasangan polar scikit-learn plotly! Apt-get-qq update && apt-get-qq install-y libspatialindex-dev

Nota: Simpan keperluan anda.txt untuk memandu dan memasang semula di bahagian atas buku nota untuk berjalan semula. Gunakan Fail → Simpan salinan dalam pemacu untuk menduplikasi, atau fail → simpan salinan ke github untuk disandarkan dalam repo. Eksport dengan Fail → Muat turun untuk mendapatkan.ipynb,.py, atau.html. Untuk memandu, jalankan:

dari Google.Colab Import Drive Drive.Mount (‘/Content/Drive’) # memberikan akses kepada panda import pemacu anda sebagai pd df=pd.read_csv (‘/content/drive/myDrive/data/sampel.csv’) df.head ()

Oleh itu, rakan sepasukan boleh menjalankan buku nota anda tanpa suntingan.

7) Simpan fail projek yang dianjurkan

Buat susun atur folder minimum dalam pemacu: data/, buku nota/, model/, output/. Simpan model dan artifak secara eksplisit untuk memandu supaya mereka berterusan selepas VM dimatikan.

8) Tonton ram, cakera, dan masa anda

Klik meter RAM/cakera untuk melihat sumber. Sesi peringkat percuma adalah terhad masa dan boleh putus jika terbiar atau terkawal sumber. Pro Tiers memanjangkan panjang runtime dan meningkatkan kestabilan, tetapi pekerjaan yang panjang masih perlu output pemeriksaan untuk memandu dengan kerap.

9) Kongsi dan bekerjasama

Gunakan butang SHARE untuk menambah penonton, pengulas, atau editor. Komen berfungsi seperti dokumen. Untuk kerjasama yang lebih selamat, buat salinan”pelaksanaan”setiap rakan sepasukan untuk mengelakkan clobbering antara satu sama lain. Tambah garis seperti#@param {type:”slider”, min: 1, max: 128, langkah: 1} di atas pembolehubah untuk mendedahkan kawalan. Ini membantu rakan sepasukan bukan teknologi menukar input tanpa menyentuh kod.

11) Sambung ke Git dan Dataset

Untuk dataset awam, muat turun dengan permintaan Wget atau Python. Sentiasa tulis salinan akhir untuk memandu, bukan hanya VM.

12) Hasil eksport bersih

Simpan output yang penting: carta sebagai.png, jadual ke CSV/parket, model terlatih untuk memandu. Kemudian eksport buku nota anda sebagai.iPynb untuk penyuntingan masa depan dan snapshot.html untuk perkongsian. Tidak boleh mendapatkan GPU: beralih ke tidak sementara, cuba lagi kemudian, atau naik taraf ke peringkat berbayar untuk keutamaan yang lebih tinggi. Fail hilang selepas menyambung semula: apa-apa di luar pemacu adalah tidak lama lagi. Sentiasa tulis ke/kandungan/drive/…. Pemasangan lambat setiap larian: roda cache dalam pemacu dan pasang dari sana, atau membina sel persediaan yang memasang semuanya sekaligus.

Petua

Tip Pro: Gunakan%PIP dan%Conda Magic di mana tersedia untuk terus memasang terikat dengan kernel. Tip Pro: Untuk reproducibility, versi pin: pandas==2.2.3. Keselamatan: Hanya menjalankan buku nota yang anda percayai; Sel-sel kod boleh melaksanakan arahan shell. Speed: Pindahkan preprocessing berat ke GPU/TPU atau vektori dengan numpy/polar untuk mengurangkan gelung python. Organisasi: Nama notebook seperti yyyy-mm-dd_topic.ipynb jadi memandu menyusunnya secara automatik.

FAQS

Adakah colab benar-benar percuma? Ya, peringkat percuma termasuk CPU dan akses oportunistik ke GPU/TPU dengan sesi yang lebih pendek. Tiers yang dibayar mengutamakan perkakasan yang lebih cepat dan runtime yang lebih panjang.

Berapa lama sesi terakhir? Ia bervariasi mengikut peringkat dan aktiviti. Jangkakan putus hubungan automatik selepas tempoh terbiar atau berjalan lancar. Checkpoint untuk memandu dengan kerap.

Bolehkah saya menggunakan r atau bahasa lain? Python adalah kelas pertama. Anda boleh memanggil Alat Sistem melalui !, dan beberapa Sokongan Kernel Komuniti R, tetapi sokongan terutamanya python-fokus.

Bolehkah saya menjalankan pekerjaan di latar belakang? Tiada pekerjaan latar belakang yang berterusan; VM berhenti apabila sesi berakhir. Gunakan pemacu untuk menjimatkan output dan pertimbangkan untuk menggerakkan beban kerja pengeluaran ke perkhidmatan yang diuruskan apabila anda melampaui colab.

Apakah perbezaan antara GPU dan TPU? TPUS TENSORFLOW/JAX dengan throughput matematik matriks besar untuk model tertentu.

Ringkasan

Buat buku nota baru dan pelajari asas sel. Pilih CPU/GPU/TPU di bawah runtime. Pasang pakej yang diperlukan di bahagian atas. Gunung pemacu dan muatkan dataset anda. Susun output dalam folder pemacu. Memantau ram/cakera; mulakan semula apabila diperlukan. Kongsi dengan selamat dan gunakan borang untuk parameter. Eksport ke.ipynb,.py, dan.html untuk penggunaan semula dan perkongsian.

Kesimpulan

Mulailah dalam penyemak imbas, pilih pemecut yang betul, pemacu gunung, dan pin versi pakej anda. Dengan pangkalan itu, anda boleh melatih model, menganalisis data, dan berkongsi hasil tanpa persediaan tempatan. Mengharapkan restart sekali-sekala; Aliran kerja anda tetap selamat jika anda secara konsisten menulis data dan artifak untuk memandu. Apabila anda memerlukan pengiraan yang lebih mantap atau GPU lanjutan, naik taraf ke peringkat berbayar atau berhijrah beban kerja matang ke perkhidmatan yang berdedikasi.

Categories: IT Info