Veo 3 là mô hình AI của Google có thể tạo video từ văn bản hoặc hình ảnh, kèm âm thanh và hiệu ứng sống động. Sử dụng qua API Vertex AI giúp bạn tự động hóa quy trình, tiết kiệm thời gian và linh hoạt hơn. Dưới đây là cách sử dụng Veo 3 qua API Vertex AI để khai thác hiệu quả Veo 3.

Tổng Quan Về Veo 3 Và Vertex AI
Giới Thiệu Veo 3 Là Gì?
Veo 3 là mô hình generative video mới nhất của Google, tích hợp trực tiếp trong hệ sinh thái Vertex AI. Đây là mô hình có khả năng tạo video chất lượng cao từ văn bản hoặc hình ảnh, giúp người dùng biến ý tưởng thành thước phim ngắn chỉ bằng mô tả ngôn ngữ tự nhiên.
Các phiên bản của Veo 3:
| Tiêu chí | veo-3.0-generate-001 | veo-3.0-fast-generate-001 |
| Tốc độ xử lý | Trung bình – tập trung vào chất lượng hình ảnh và hiệu ứng điện ảnh; thời gian render dài hơn nhưng chi tiết hơn. | Nhanh hơn gấp ~2 lần, phù hợp tạo bản nháp hoặc preview ý tưởng nhanh. |
| Độ phân giải | 1080p (Full HD) – chi tiết cao, hỗ trợ hiệu ứng ánh sáng và độ sâu trường ảnh (DOF). | 1080p (Full HD) – tối ưu hóa cho tốc độ, hình ảnh hơi giảm chi tiết so với bản chuẩn. |
| Hỗ trợ âm thanh | Có – đồng bộ âm thanh tự động hoặc tạo từ prompt mô tả. | Có – nhưng giới hạn hơn, ít tùy chỉnh và đôi khi không đồng bộ hoàn hảo. |
Các Giới Hạn Kỹ Thuật
Thời lượng video: 4–8 giây mỗi video.
Tỉ lệ khung hình (Aspect ratio): 16:9 hoặc 9:16.
Số lượng video tối đa mỗi request: 4 video.
Hạn mức sử dụng (Quota): Phân bổ theo từng dự án trong Vertex AI.
Dung lượng input:
- Hình ảnh ≤ 5 MB.
- Prompt ≤ 1.000 ký tự.
Định dạng đầu ra: MP4 (mặc định), có thể xuất vertical hoặc horizontal.
Giới hạn API: Số request/giờ phụ thuộc vào quota dự án.
Thiết Lập Môi Trường Và Xác Thực API
Bước 1– Khởi tạo một dự án trên Google Cloud
- Khởi tạo một dự án mới trong giao diện quản lý Google Cloud Console.
- Bật API Vertex AI: vào “APIs & Services” → “Enable APIs” → tìm “Vertex AI API”.
- Cài Google Cloud CLI (gcloud) hoặc SDK để quản lý và gọi lệnh từ terminal.
Bước 2 – Xác thực tài khoản dịch vụ (Service Account)
- Tạo Service Account có quyền aiplatform.models.predict.
- Tải file JSON key về máy.
- Thiết lập biến môi trường: export GOOGLE_APPLICATION_CREDENTIALS="path/to/your-key.json"
- Lệnh này giúp SDK và API biết bạn đang dùng tài khoản nào để xác thực request.
Bước 3 – Chọn vùng (region)
- Giải thích tại sao phải chọn region (liên quan đến latency and data storage).
- Các region phổ biến: us-central1, europe-west1.
Cách Gọi Veo 3 API
Cấu Trúc Request Cơ Bản
Endpoint:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predictLongRunning
Tham số chính:
- Prompt: Mô tả nội dung video cần tạo (text input).
- aspectRatio: Tỉ lệ khung hình: "16:9" hoặc "9:16".
- generateAudio: True/False – có tạo âm thanh hay không.
- sampleCount: Số video cần tạo trong 1 request (tối đa 4).
- seed: Giúp tái tạo lại video giống nhau giữa các lần chạy.
- storageUri: Đường dẫn lưu output video trong Google Cloud Storage (GCS).
Ví Dụ Mã (Python SDK And Curl)
- Ví dụ Python: Gọi client.models.generate_videos(...).
from google.cloud import aiplatform
client = aiplatform.gapic.VideoGenerationServiceClient()
request = {
"model": "projects/demo/locations/us-central1/publishers/google/models/veo-3.0-generate-001",
"prompt": "A cinematic shot of a futuristic city skyline at sunrise",
"aspect_ratio": "16:9",
"generate_audio": True,
"sample_count": 1,
"seed": 42,
"storage_uri": "gs://your-bucket/outputs/"
}
operation = client.generate_video(request=request)
print("Operation:", operation.operation.name)
- Ví dụ Curl: Gửi request JSON.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-3.0-generate-001:predictLongRunning" \
-d '{
"instances": [{
"prompt": "A cinematic shot of a futuristic city skyline at sunrise",
"aspectRatio": "16:9",
"generateAudio": true,
"sampleCount": 1,
"seed": 42,
"storageUri": "gs://your-bucket/outputs/"
}]
}'
- Prompt: Văn bản mô tả nội dung video muốn tạo (Text-to-Video).
Ví dụ: "A cinematic shot of a futuristic city skyline at sunrise".
- Image (tùy chọn): Ảnh đầu vào làm khung hoặc keyframe để tạo chuyển động (Image-to-Video).
Có thể truyền dạng base64 hoặc đường dẫn GCS (ví dụ: "gs://your-bucket/input.jpg").
- storageUri (output GCS path): Đường dẫn thư mục Google Cloud Storage (GCS) nơi video đầu ra sẽ được lưu.
Ví dụ: "gs://your-bucket/outputs/".
Xử Lý Tác Vụ Bất Đồng Bộ
Cơ chế polling:
- Khi gọi API Veo 3, video không được tạo ngay mà xử lý dưới dạng tác vụ bất đồng bộ.
- Server trả về một operation ID để bạn kiểm tra trạng thái định kỳ (polling) cho đến khi hoàn tất (done: true).
Ví dụ mã Python:
from google.cloud import aiplatform
import time
client = aiplatform.gapic.VideoGenerationServiceClient()
req = aiplatform.gapic.GenerateVideoRequest(
model="projects/demo/models/veo-3.0-generate-001",
prompt="A cinematic shot of sunrise over a futuristic city"
)
op = client.generate_video(request=req)
while not op.done():
time.sleep(5)
print("Video hoàn tất:", op.result())
Lấy link video output từ Google Cloud Storage
- Sau khi hoàn thành, API trả về liên kết: "outputUri": "gs://your-bucket/outputs/video.mp4"
- Tải file bằng lệnh: gsutil cp gs://your-bucket/outputs/video.mp4 .
Tối Ưu Prompt Và Tham Số Cho Video Chất Lượng Cao
Kỹ Thuật Viết Prompt Hiệu Quả
- Để tạo video đạt chất lượng điện ảnh, prompt cần mô tả rõ 4 yếu tố chính:
- Hành động: Diễn biến cụ thể, tự nhiên.
Ví dụ: “a person slowly walking through the neon-lit alley at night.” - Ánh sáng: Loại nguồn sáng, thời điểm, cường độ.
Ví dụ: “soft golden sunlight, cinematic shadows.” - Góc quay / chuyển động máy: Mô tả camera shot.
Ví dụ: “drone shot, slow pan, close-up on face.” - Phong cách hình ảnh: Thể loại và chất liệu.
Ví dụ: “realistic 3D animation, cinematic style, 50mm lens.”
- Sử dụng Negative Prompt: Dùng negativePrompt để loại trừ yếu tố không mong muốn, giúp video rõ ràng và chuyên nghiệp hơn.
Ví dụ: "negativePrompt": "blurry, distorted, extra limbs, flickering light, low quality"
- Ví dụ so sánh prompt tốt và kém:
| Loại prompt | Ví dụ | Kết quả dự kiến |
| Prompt kém | “A man walking in a city.” | Hình ảnh chung chung, thiếu chiều sâu và ánh sáng. |
| Prompt tốt | “A cinematic drone shot of a man walking through a rainy neon city at night, reflections on wet pavement, soft backlight, 50mm lens.” | Video có bố cục, ánh sáng, và chuyển động camera rõ ràng – mang phong cách điện ảnh. |
Tham Số Quan Trọng Cần Lưu Ý
| Tham số | Ý nghĩa | Gợi ý sử dụng |
| aspectRatio | Tỷ lệ khung hình | 16:9 cho desktop, 9:16 cho social |
| sampleCount | Số video tạo | Tối đa 4 |
| generateAudio | Có tạo âm thanh không | Nên bật để tự động đồng bộ |
| seed | Tái tạo video giống nhau | Giữ cố định để so sánh |
| negativePrompt | Loại bỏ yếu tố | Ví dụ: “no text overlay, no watermark” |
Xử Lý Lỗi Và Giới Hạn API
Lỗi Phổ Biến
Dưới đây là 4 lỗi phổ biến khi sử dụng Veo 3 qua Vertex AI API:
| Mã lỗi | Nguyên nhân | Cách khắc phục |
| 401 | Sai token / xác thực | Kiểm tra gcloud auth print-access-token |
| 404 | Sai region / model | Kiểm tra endpoint |
| 429 | Quota vượt giới hạn | Giảm số request / sampleCount |
| 400 | Dữ liệu đầu vào sai | Kiểm tra prompt / hình ảnh |
Cách Debug Hiệu Quả
- In log chi tiết request và response: Khi gọi API, luôn bật logging để ghi lại toàn bộ nội dung gửi đi (prompt, tham số, seed, aspect ratio, v.v.) và phản hồi từ server (status code, error message, operation name). Điều này giúp bạn biết lỗi nằm ở bước nào – gửi request hay nhận kết quả.
- Ghi lại seed và prompt để tái tạo lỗi: Seed cố định giúp bạn tái hiện cùng một kết quả. Nếu lỗi xảy ra, lưu lại seed + prompt + config để gửi lại request y hệt nhằm xác định lỗi có lặp lại hay không.
- Thử request tối giản để khoanh vùng lỗi: Khi gặp lỗi 400/500, hãy giảm prompt về mô tả cơ bản (“A cat walking”), bỏ các trường tùy chọn (audio, seed, sampleCount…), kiểm tra xem API phản hồi được không. Sau đó thêm dần từng tham số để xác định yếu tố gây lỗi.
Giới Hạn Kỹ Thuật
- Tối đa 4 video mỗi request: Mỗi lần gọi predictLongRunning, bạn có thể sinh tối đa 4 video (sampleCount ≤ 4).
- Thời lượng tối đa 8 giây: Các giá trị hợp lệ: 4, 6 hoặc 8 giây — nếu vượt quá sẽ trả lỗi INVALID_ARGUMENT.
- Độ phân giải 1080p với model Veo 3: Model Veo 3 hỗ trợ tối đa Full HD (1920×1080). Không có tùy chọn 2K/4K hiện tại. Với Veo 2 hoặc các bản preview, chỉ 720p được chấp nhận.
Mẹo Và Cách Thực Hành
- Dùng model “fast” để test nhanh, chuyển sang “standard” khi cần chất lượng cao hơn.
- Lưu cache cho những prompt đã dùng để tiết kiệm chi phí và thời gian xử lý.
- Chọn tỷ lệ khung hình đúng nền tảng: 9:16 cho nội dung dọc, 16:9 cho video ngang.
- Chia nhỏ batch (4 video/request) để tránh nghẽn hoặc lỗi quota khi tạo hàng loạt.
- Rà soát nội dung đầu ra đảm bảo tuân thủ quy định về an toàn và đạo đức AI trước khi xuất bản.
Với Veo 3, bạn có thể tự động hóa quy trình sáng tạo video, từ ý tưởng đến sản phẩm hoàn chỉnh chỉ bằng vài dòng lệnh. Hãy bắt đầu thử ngay Veo 3 trên Vertex AI Studio hoặc liên hệ HVMO để được hỗ trợ tích hợp API.
Thông tin liên hệ:
Học Viện Marketing Online
Hotline/Zalo: 0878 779 111
Trụ sở 1: CT5- X2 KĐT Linh Đàm- Hoàng Mai- Hà Nội
Trụ sở 2: 67 Nam Dư- Hoàng Mai- Hà Nội
Trụ sở 3: Số 139 Ngũ Nhạc- Hoàng Mai- Hà Nội
Website: https://hocvienmarketingonline.com/
Youtube: https://www.youtube.com/c/H%E1%BB%8DcVi%E1%BB%87nMarketingOnlineNo1
Fanpage: https://www.facebook.com/HocVienMarketingOnline89?locale=vi_VN