Google Colab là gì? Lợi ích và Cách Sử Dụng Google Colab A – Z

Google Colab là gì? Google Colab dùng để làm gì? Lợi ích khi sử dụng Google Colab là gì? Sử dụng Google Colab như thế nào? Đọc ngay bài viết!

Google Colab là gì?

Google Colab hay còn được gọi là Google Colaboratory. Đây là một phiên bản lưu trữ trực tuyến trên đám mây được phát triển bởi Google Research, tương tự như Jupyter Notebook. Google Colab cho phép bạn thực hiện các tác vụ tính toán nặng về CPU/GPU trong Python mà không cần phải lo lắng về việc cài đặt hay nâng cấp phần cứng máy tính cá nhân.

Google Colab là gì? Lợi ích và Cách Sử Dụng Google Colab A - Z
Google Colab là gì?

Google Colab cung cấp quyền truy cập miễn phí đến các tài nguyên trên tiện ích đám mây bao gồm bộ nhớ, lưu trữ, CPU, GPU và TPU. Đáp ứng nhu cầu của các nhà nghiên cứu trí tuệ nhân tạo, lập trình viên máy học, nhà phân tích dữ liệu, nhà khoa học dữ liệu và những người học Python.

Google Colab còn cung cấp một môi trường làm việc toàn diện cho các dự án khoa học dữ liệu hoặc máy học. Bạn có thể tạo sổ ghi chú code (notebook) hoàn chỉnh, HTML, chứa mã thực thi, LaTeX, mã Python trực tiếp, hình ảnh, văn bản định dạng, biểu đồ, bảng,…

Sử dụng Google Colab để làm gì?

Google Colab chủ yếu để viết mã Python trên các trình duyệt Google Chrome hay Mozilla Firefox. Các mã có thể được thực thi trên trình duyệt mà không cần môi trường thời gian hay giao diện dòng lệnh. Google Colab cung cấp một giao diện chuyên nghiệp cho sổ ghi chép các dự án Python bằng các hình ảnh, đồ thị, phương trình toán học,…

Người dùng còn có thể dễ dàng mã hóa hình ảnh dữ liệu bằng các câu lệnh Python được hiển thị trong một tài sản trực quan. Các tệp Jupyter Notebook từ GifHub cũng được cho phép sử dụng lại trong Google Colab. Người dùng cũng có thể nhập từ nguồn khác dự án khoa học dữ liệu, máy học miễn là có sự tương thích. Google Colab sẽ xử lý nội dung vô cùng hiệu quả và hiển thị mã Python không mắc lỗi, rõ ràng nhất.

Lợi ích khi lựa chọn Google Colab

Lưu trữ trên tiện ích đám mây

Người dùng dễ dàng tiếp tục công việc dang dở từ bất kỳ máy tính nào miễn là truy cập được tài khoản Google Drive cá nhân. Toàn bộ các Colab Notebook của bạn đều được lưu trữ trong Google Drive giống như file Docs hay Sheets. Còn đối với Jupyter Notebook thì chỉ lưu trữ trên máy tính cá nhân, tuy bảo mật quyền riêng tư và thông tin nhưng nếu gặp trường hợp ngoài ý muốn thì rất khó xử lý.

Lưu trữ trên tiện ích đám mây Google Drive
Lợi ích khi lựa chọn Google Colab

Thư viện được cài đặt sẵn

Google Colab cung cấp các thư viện dữ liệu đã được cài đặt sẵn có thể kể đến như Pandas, Numpy, Matplotlib hoặc các thư viện học máy như Pytorch, Keras, Tensorflow.

Khả năng hợp tác

Khi sử dụng Google Colab, bạn có cơ hội hợp tác với nhiều nhà phát triển uy tín và chia sẻ dễ dàng các dự án công việc đã, đang thực hiện với họ. Bên cạnh đó bạn cũng có thể kết nối với các cộng tác viên từ khắp nơi và mời họ cùng làm việc với mình thông qua email Google.

Tổng quát

Google Colab là gì? Đây thực chất là phiên bản chuyên nghiệp và ứng dụng nhiều chức năng hơn của Jupyter Notebook. Người dùng cũng có thể lưu trữ tài liệu, dự án trên nền tảng đám mây và sử dụng tài nguyên điện toán miễn phí. Google Colab có mối liên hệ đặc biệt với Jupyter Notebook và iPython, Google Colab bao hàm toàn bộ tiện ích của 2 công cụ trên.

GPU và TPU miễn phí

GPU và TPU là hai yếu tố có khả năng tạo ra sự khác biệt lớn trong các dự án công việc,…Người sử dụng Google Colab được miễn phí truy cập vào thời gian chạy TPU và GPU tối đa là 12 giờ. Thời gian chạy GPU đi kèm RAM 13 GB, Tesla K80, CPU Intel Xeon @ 2,2 GHz, VRAM GDDR5 12 GB.

Đối với thời gian chạy TPU thì bao gồm RAM 13 GB, TPU 180 teraflop và CPU Intel Xeon @ 2,30 GHz. Nếu nâng cấp Google Colab lên Pro hay Pro+ thì bạn có thể chạy thử TPU, CPU hoặc GPU nhiều hơn 12 giờ.

Các thao tác với Google Colab

Thiết lập hữu ích

  • Ngôn ngữ hiển thị: Google Colab được mặc định ngôn ngữ tiếng Việt, nếu có nhu cầu đổi ngôn ngữ bạn có thể thay đổi trong menu Trợ giúp rồi chọn “Xem bằng tiếng Anh”.
  • Bật chế độ sáng/tối: Nhiều người thích làm việc với chế độ Darkmode (chế độ tối) cũng có thể dễ dàng bật lên bằng việc tìm Tools trên thanh menu rồi chọn “Settings” hoặc tìm biểu tượng bánh răng phía góc phải trên cùng cạnh avatar để mở cài đặt. Sau đó chọn “Dark” tại mục Theme rồi nhấn “Save”.
  • Hỗ trợ lập trình: Tại mục cài đặt chọn “Editor” rồi tích hết toàn bộ tùy chọn trong mục. Mục Show line numbers sẽ hiển thị số thứ tự các dòng code trong 1 cột duy nhất và Show line numbers hiển thị các căn thụt đầu dòng nhằm hạn chế các lỗi định dạng khoảng cách.

Thao tác File & Folder

Tạo, Mở hoặc Upload Notebook:

Sử dụng Ctrl + O (hoặc Command + O trên Macbook) để mở file.

Lưu Notebook đang làm việc

Google Colab tự động lưu công việc của bạn. Bạn có thể lựa chọn lưu thêm vào Google Drive hoặc Github từ Menu rồi chọn File.

Download Notebook

Download notebook về máy của bạn dưới dạng .ipynb hoặc .py thông qua Menu tìm và nhấn File chọn Download.

Upload Dữ liệu

Để tải dữ liệu vào Colab, chọn Folder và sau đó icon Upload dữ liệu như hướng dẫn. Nếu bạn sử dụng dữ liệu từ Google Drive, hãy tham khảo hướng dẫn tiếp theo.

Sao chép File Path

Để sao chép đường dẫn của một tệp hoặc thư mục khi bạn cần nó để mở hoặc lưu trữ tệp, bạn có thể thực hiện thao tác sau: chuột phải vào file/ folder trong trình duyệt và chọn “Copy Path“.

Soạn thảo trong Google Colab (Edit)

Ngoài việc sao chép văn bản thông thường, Google Colab còn cho phép bạn sao chép/cắt và dán vào các cột Code và cột Text một cách dễ dàng. Tính năng này rất tiện lợi và không có trên Jupyter Notebook, Jupyter Lab hay Visual Studio Code. Để thực hiện copy/paste các cột này, bạn chỉ cần nhấp chuột vào ô cần sao chép rồi nhấn tổ hợp phím tắt Ctrl + C và Ctrl + V quen thuộc.

Bạn cũng có thể bật tính năng Tìm (find)Thay thế (replace) bằng cách sử dụng tổ hợp phím Ctrl + H hoặc bằng cách nhấp vào biểu tượng kính lúp ở thanh công cụ bên cạnh phía trái màn hình.

Tùy chọn hiển thị (View)

Vào menu chọn View

  • Lịch sử mã đã chạy (Executed Code History): Xem các dòng lệnh đã được thực thi trước đây trong Notebook. 
  • Thu gọn phần (Collapse sections): Được sử dụng để ẩn các nội dung thuộc cấp độ heading thấp hơn (ví dụ, nếu bạn thu gọn một cell chứa heading cấp 1, các nội dung dưới heading cấp 2 trở đi và văn bản thông thường sẽ được ẩn). Bạn có thể chọn bất kỳ cell nào trong Notebook và sử dụng phím tắt Ctrl + ] để thu gọn. 
  • Mở rộng phần (Expand sections): Ngược lại với thu gọn, tính năng này cho phép bạn mở rộng nội dung ở cấp độ heading thấp hơn. Tổ hợp phím Ctrl + [ cung cấp kết quả tương tự.

Thêm nội dung (Insert)

  • Để thêm một Code cell (cột thực thi lệnh) hoặc một Text cell (cột văn bản), bạn có thể dễ dàng sử dụng chuột để chọn một cột sẵn có và sau đó chọn loại cell mà bạn muốn thêm. Nếu bạn đang làm việc trong một Notebook hoàn toàn mới, bạn cũng có thể thêm cell bằng cách nhấn vào một trong hai nút ở góc trái của màn hình. Ngoài ra cũng có thể sử dụng tổ hợp phím tắt mặc định Ctrl + M B để thêm Code cell.
  • Để thêm một Section header (tiêu đề phần), bạn có thể sử dụng tùy chọn tương ứng trong Menu nhấn “Insert” hoặc thêm một Text cell và sau đó tạo tiêu đề (Heading) bằng cách sử dụng định dạng markdown. Ví dụ: Để tạo một tiêu đề cấp 1, bạn chỉ cần viết “# I. GIỚI THIỆU” vào Text cell. Thêm dấu # vào trước các đầu mục cấp độ nhỏ hơn.
  • Để thêm một Scratch Code Cell (cột thực thi mã nguồn tạm thời), bạn có thể kích hoạt tùy chọn này. Điều này sẽ tạo một Code cell để bạn thực hiện thử nghiệm mã nguồn mà không ảnh hưởng đến mã chính trong Notebook của bạn.

Các thao tác Python trong Google Colab

Dưới đây là một số những thao tác Python trong Google Colab mà bạn nhất định nên biết:

Thực thi dòng lệnh Python

Để chạy mã trên Google Colab, bạn có thể nhấn vào nút “Play” ở đầu mỗi code cell. Chọn code cell và sử dụng tổ hợp phím Shift + Enter để chạy. Bên cạnh đó bạn cũng có thể sử dụng Menu Runtime với các tùy chọn:

  • Run all: Thực thi tất cả các code cell trong Colab.
  • Run before: Thực thi các code cell trước code cell bạn đang chọn.
  • Run the focus cell: Chạy mã trong code cell bạn đang chọn.
  • Run the selection: Ấn giữ tổ hợp phím Shift và chọn nhiều code cell để thực hiện chạy mã các code cell bạn đã chọn.
  • Run after: Thực thi các code cell từ cột bạn đang chọn trở đi.

Dừng thực thi và khởi động lại

Khi bạn gặp sự cố trong quá trình thực thi trên Google Colab, Runtime menu cung cấp các tùy chọn sau:

  • Interrupt execution: Dừng ngay lập tức việc thực thi các lệnh hiện đang chạy.
  • Restart runtime: Khởi động lại runtime để làm mới môi trường làm việc. Điều này hữu ích khi bạn muốn cài đặt thư viện mới hoặc khắc phục sự cố.
  • Restart and run all: Khởi động lại runtime và chạy lại toàn bộ các câu lệnh trong Colab từ đầu.
  • Factory reset runtime: Xoá toàn bộ trạng thái hiện tại của runtime, bao gồm biến và tệp đã khai báo, sau đó khởi động lại runtime.

Thay đổi Runtime

Khi bạn làm việc trên các dự án Machine Learning trong Colab, có thể bạn muốn khai thác sức mạnh của GPU hoặc TPU để thực hiện các tác vụ nhanh hơn.

Để thực hiện điều này, bạn có thể thay đổi cấu hình phần cứng của runtime bằng cách vào Menu chọn “Runtime” nhấn “Change runtime type”.

Thay đổi Runtime
Các thao tác Python trong Google Colab

Tạo thư viện mới

Để tạo một thư viện mới mà không sẵn có trong Google Colab, bạn có thể thực hiện câu lệnh:

pip install package_name

Trong đó, package_name là tên của thư viện bạn muốn cài đặt. Ví dụ: Bạn muốn cài đặt thư viện “facebook business sdk” bạn có thể chạy lệnh:

pip install facebook_business

Lưu ý: Bạn có thể cần phải cài đặt lại các thư viện không có sẵn sau một khoảng thời gian không hoạt động, ví dụ, sau khi session làm việc đã không hoạt động trong một khoảng thời gian (thời gian cụ thể có thể là 15-30 phút). Điều này có thể gây phiền toái và tốn thời gian nếu bạn sử dụng nhiều thư viện bên ngoài.

Import thư viện

Để thêm một thư viện vào Google Colab, bạn có thể nhập câu lệnh sau:

import package_name as something

Bạn cũng có thể đặt một tên ngắn gọn (alias) cho thư viện để tiện sử dụng trong quá trình làm việc. Sau khi import thư viện, bạn có thể thực hiện các lệnh và chức năng của thư viện đó trong các code cell tiếp theo.Hướng dẫn sử dụng Google Colab chi tiết

Để sử dụng Google Colab, trước tiên bạn cần truy cập trang web Colab tại: https://colab.research.google.com

#1. Tải tệp .ipynb lên Colab

Vào File => Upload notebook.

Gg Colab
Tải tệp .ipynb lên Colab

Nhấp vào nút màu xanh browse để tải lên tệp .ipynb.

Gg Colab 1
Tải tệp .ipynb lên Colab

#2. Kết nối với runtime được lưu trữ

Di chuyển chuột đến Edit => Notebook Settings.

Chọn GPU trong mục Hardware accelerator. Sau đó, chọn “SAVE

Tải tệp .ipynb lên Colab
Tải tệp .ipynb lên Colab

#3. Thực thi mã từng bước một

Chọn từng ô mã -> Nhấn vào nút ▶ ở góc trên bên trái để chạy. Đảm bảo rằng mỗi đoạn mã đã được chạy bằng cách kiểm tra số trong [ ]. Nếu không có số, bạn cần chạy lại đoạn mã đó.

#4. Work on the assignment

Viết mã của bạn trong các đoạn mã đã được chú thích.

Không sao chép mã từ nguồn khác.

#5.Tải file .ipynb file

Vào File chọn Downloade .ipynb của bạn.

Đảm bảo giữ lại tất cả outputs trong .ipynb (Vui lòng KHÔNG xóa outputs).

#6. Nén tất cả các tệp .ipynb thành một tệp .zip và đưa lên Canvas

Nén tất cả các tệp .ipynb thành uniqueid.zip (ví dụ: justincj.zip).
Vui lòng KHÔNG thay đổi tên từng tệp.

Kết luận

Hy vọng bài viết trên đã giúp các bạn hiểu rõ hơn Google Colab là gì cũng như các mẹo sử dụng hiệu quả cho cả người mới làm quen với Python và những người đã có kinh nghiệm sử dụng Google Colab. Hãy theo dõi LANIT để cập nhật thêm nhiều nội dung hữu ích nhé!

LANIT JSC

Được thành lập năm 2017, Công ty cổ phần công nghệ và truyền thông LANIT (LANIT JSC) đã sớm khẳng định được vị trí của mình là một trong những đơn vị cung cấp dịch vụ lưu trữ dữ liệu hàng đầu với chất lượng tốt nhất, cùng chi phí hợp lý nhất.

Chat với chúng tôi qua Zalo!
Chat với chúng tôi qua Zalo!