Hướng Dẫn Cách Sử Dụng Veo 3 Qua API Vertex AI Chi Tiết

2025-10-31 20:19:02

Veo 3 là mô hình AI của Google có thể tạo video từ văn bản hoặc hình ảnh, kèm âm thanh và hiệu ứng sống động. Sử dụng qua API Vertex AI giúp bạn tự động hóa quy trình, tiết kiệm thời gian và linh hoạt hơn. Dưới đây là cách sử dụng Veo 3 qua API Vertex AI để khai thác hiệu quả Veo 3.

Hướng Dẫn Cách Sử Dụng Veo 3 Qua API Vertex AI Chi Tiết

Tổng Quan Về Veo 3 Và Vertex AI

Giới Thiệu Veo 3 Là Gì?

Veo 3 là mô hình generative video mới nhất của Google, tích hợp trực tiếp trong hệ sinh thái Vertex AI. Đây là mô hình có khả năng tạo video chất lượng cao từ văn bản hoặc hình ảnh, giúp người dùng biến ý tưởng thành thước phim ngắn chỉ bằng mô tả ngôn ngữ tự nhiên.

Các phiên bản của Veo 3:

Tiêu chí

veo-3.0-generate-001

veo-3.0-fast-generate-001

Tốc độ xử lý

Trung bình – tập trung vào chất lượng hình ảnh và hiệu ứng điện ảnh; thời gian render dài hơn nhưng chi tiết hơn.

Nhanh hơn gấp ~2 lần, phù hợp tạo bản nháp hoặc preview ý tưởng nhanh.

Độ phân giải

1080p (Full HD) – chi tiết cao, hỗ trợ hiệu ứng ánh sáng và độ sâu trường ảnh (DOF).

1080p (Full HD) – tối ưu hóa cho tốc độ, hình ảnh hơi giảm chi tiết so với bản chuẩn.

Hỗ trợ âm thanh

Có – đồng bộ âm thanh tự động hoặc tạo từ prompt mô tả.

Có – nhưng giới hạn hơn, ít tùy chỉnh và đôi khi không đồng bộ hoàn hảo.

Các Giới Hạn Kỹ Thuật

Thời lượng video: 4–8 giây mỗi video.

Tỉ lệ khung hình (Aspect ratio): 16:9 hoặc 9:16.

Số lượng video tối đa mỗi request: 4 video.

Hạn mức sử dụng (Quota): Phân bổ theo từng dự án trong Vertex AI.

 

Dung lượng input:

 

  • Hình ảnh ≤ 5 MB.
  • Prompt ≤ 1.000 ký tự.

Định dạng đầu ra: MP4 (mặc định), có thể xuất vertical hoặc horizontal.

Giới hạn API: Số request/giờ phụ thuộc vào quota dự án.

Thiết Lập Môi Trường Và Xác Thực API

Bước 1– Khởi tạo một dự án trên Google Cloud

  • Khởi tạo một dự án mới trong giao diện quản lý Google Cloud Console.
  • Bật API Vertex AI: vào “APIs & Services” → “Enable APIs” → tìm “Vertex AI API”.
  • Cài Google Cloud CLI (gcloud) hoặc SDK để quản lý và gọi lệnh từ terminal.

Bước 2 – Xác thực tài khoản dịch vụ (Service Account)

  • Tạo Service Account có quyền aiplatform.models.predict.
  • Tải file JSON key về máy.
  • Thiết lập biến môi trường: export GOOGLE_APPLICATION_CREDENTIALS="path/to/your-key.json"
  • Lệnh này giúp SDK và API biết bạn đang dùng tài khoản nào để xác thực request.

Bước 3 – Chọn vùng (region)

  • Giải thích tại sao phải chọn region (liên quan đến latency and data storage).
  • Các region phổ biến: us-central1, europe-west1.

Cách Gọi Veo 3 API

Cấu Trúc Request Cơ Bản

Endpoint:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predictLongRunning

Tham số chính: 

  • Prompt: Mô tả nội dung video cần tạo (text input).
  • aspectRatio: Tỉ lệ khung hình: "16:9" hoặc "9:16".
  • generateAudio: True/False – có tạo âm thanh hay không.
  • sampleCount: Số video cần tạo trong 1 request (tối đa 4).
  • seed: Giúp tái tạo lại video giống nhau giữa các lần chạy.
  • storageUri: Đường dẫn lưu output video trong Google Cloud Storage (GCS).

Ví Dụ Mã (Python SDK And Curl)

  • Ví dụ Python: Gọi client.models.generate_videos(...).

from google.cloud import aiplatform

client = aiplatform.gapic.VideoGenerationServiceClient()

request = {

"model": "projects/demo/locations/us-central1/publishers/google/models/veo-3.0-generate-001",

"prompt": "A cinematic shot of a futuristic city skyline at sunrise",

"aspect_ratio": "16:9",

"generate_audio": True,

"sample_count": 1,

"seed": 42,

"storage_uri": "gs://your-bucket/outputs/"

}

operation = client.generate_video(request=request)

print("Operation:", operation.operation.name)

 

  • Ví dụ Curl: Gửi request JSON.

 

curl -X POST \

  -H "Authorization: Bearer $(gcloud auth print-access-token)" \

  -H "Content-Type: application/json" \

  "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/veo-3.0-generate-001:predictLongRunning" \

  -d '{

        "instances": [{

          "prompt": "A cinematic shot of a futuristic city skyline at sunrise",

          "aspectRatio": "16:9",

          "generateAudio": true,

          "sampleCount": 1,

          "seed": 42,

          "storageUri": "gs://your-bucket/outputs/"

        }]

      }'

  • Prompt: Văn bản mô tả nội dung video muốn tạo (Text-to-Video).

Ví dụ: "A cinematic shot of a futuristic city skyline at sunrise".

  • Image (tùy chọn): Ảnh đầu vào làm khung hoặc keyframe để tạo chuyển động (Image-to-Video).

Có thể truyền dạng base64 hoặc đường dẫn GCS (ví dụ: "gs://your-bucket/input.jpg").

  • storageUri (output GCS path): Đường dẫn thư mục Google Cloud Storage (GCS) nơi video đầu ra sẽ được lưu.

Ví dụ: "gs://your-bucket/outputs/".

Xử Lý Tác Vụ Bất Đồng Bộ 

Cơ chế polling: 

  • Khi gọi API Veo 3, video không được tạo ngay mà xử lý dưới dạng tác vụ bất đồng bộ.
  • Server trả về một operation ID để bạn kiểm tra trạng thái định kỳ (polling) cho đến khi hoàn tất (done: true).

Ví dụ mã Python:

from google.cloud import aiplatform

import time

client = aiplatform.gapic.VideoGenerationServiceClient()

req = aiplatform.gapic.GenerateVideoRequest(

    model="projects/demo/models/veo-3.0-generate-001",

    prompt="A cinematic shot of sunrise over a futuristic city"

)

op = client.generate_video(request=req)

while not op.done():

    time.sleep(5)

print("Video hoàn tất:", op.result())

Lấy link video output từ Google Cloud Storage

  • Sau khi hoàn thành, API trả về liên kết: "outputUri": "gs://your-bucket/outputs/video.mp4"
  • Tải file bằng lệnh: gsutil cp gs://your-bucket/outputs/video.mp4 .

Tối Ưu Prompt Và Tham Số Cho Video Chất Lượng Cao

Kỹ Thuật Viết Prompt Hiệu Quả

 

  • Để tạo video đạt chất lượng điện ảnh, prompt cần mô tả rõ 4 yếu tố chính:

 

  • Hành động: Diễn biến cụ thể, tự nhiên.
    Ví dụ: “a person slowly walking through the neon-lit alley at night.”
  • Ánh sáng: Loại nguồn sáng, thời điểm, cường độ.
    Ví dụ: “soft golden sunlight, cinematic shadows.”
  • Góc quay / chuyển động máy: Mô tả camera shot.
    Ví dụ: “drone shot, slow pan, close-up on face.”
  • Phong cách hình ảnh: Thể loại và chất liệu.
    Ví dụ: “realistic 3D animation, cinematic style, 50mm lens.”
  • Sử dụng Negative Prompt: Dùng negativePrompt để loại trừ yếu tố không mong muốn, giúp video rõ ràng và chuyên nghiệp hơn.

Ví dụ: "negativePrompt": "blurry, distorted, extra limbs, flickering light, low quality"

 

  • Ví dụ so sánh prompt tốt và kém:

 

Loại prompt

Ví dụ

Kết quả dự kiến

Prompt kém

“A man walking in a city.”

Hình ảnh chung chung, thiếu chiều sâu và ánh sáng.

Prompt tốt

“A cinematic drone shot of a man walking through a rainy neon city at night, reflections on wet pavement, soft backlight, 50mm lens.”

Video có bố cục, ánh sáng, và chuyển động camera rõ ràng – mang phong cách điện ảnh.

Tham Số Quan Trọng Cần Lưu Ý

Tham số

Ý nghĩa

Gợi ý sử dụng

aspectRatio

Tỷ lệ khung hình

16:9 cho desktop, 9:16 cho social

sampleCount

Số video tạo

Tối đa 4

generateAudio

Có tạo âm thanh không

Nên bật để tự động đồng bộ

seed

Tái tạo video giống nhau

Giữ cố định để so sánh

negativePrompt

Loại bỏ yếu tố

Ví dụ: “no text overlay, no watermark”

Xử Lý Lỗi Và Giới Hạn API

Lỗi Phổ Biến

Dưới đây là 4 lỗi phổ biến khi sử dụng Veo 3 qua Vertex AI API:

Mã lỗi

Nguyên nhân

Cách khắc phục

401

Sai token / xác thực

Kiểm tra gcloud auth print-access-token

404

Sai region / model

Kiểm tra endpoint

429

Quota vượt giới hạn

Giảm số request / sampleCount

400

Dữ liệu đầu vào sai

Kiểm tra prompt / hình ảnh

Cách Debug Hiệu Quả

  • In log chi tiết request và response: Khi gọi API, luôn bật logging để ghi lại toàn bộ nội dung gửi đi (prompt, tham số, seed, aspect ratio, v.v.) và phản hồi từ server (status code, error message, operation name). Điều này giúp bạn biết lỗi nằm ở bước nào – gửi request hay nhận kết quả.
  • Ghi lại seed và prompt để tái tạo lỗi: Seed cố định giúp bạn tái hiện cùng một kết quả. Nếu lỗi xảy ra, lưu lại seed + prompt + config để gửi lại request y hệt nhằm xác định lỗi có lặp lại hay không.
  • Thử request tối giản để khoanh vùng lỗi: Khi gặp lỗi 400/500, hãy giảm prompt về mô tả cơ bản (“A cat walking”), bỏ các trường tùy chọn (audio, seed, sampleCount…), kiểm tra xem API phản hồi được không. Sau đó thêm dần từng tham số để xác định yếu tố gây lỗi.

Giới Hạn Kỹ Thuật

  • Tối đa 4 video mỗi request: Mỗi lần gọi predictLongRunning, bạn có thể sinh tối đa 4 video (sampleCount ≤ 4).
  • Thời lượng tối đa 8 giây: Các giá trị hợp lệ: 4, 6 hoặc 8 giây — nếu vượt quá sẽ trả lỗi INVALID_ARGUMENT.
  • Độ phân giải 1080p với model Veo 3: Model Veo 3 hỗ trợ tối đa Full HD (1920×1080). Không có tùy chọn 2K/4K hiện tại. Với Veo 2 hoặc các bản preview, chỉ 720p được chấp nhận.

Mẹo Và Cách Thực Hành

  • Dùng model “fast” để test nhanh, chuyển sang “standard” khi cần chất lượng cao hơn.
  • Lưu cache cho những prompt đã dùng để tiết kiệm chi phí và thời gian xử lý.
  • Chọn tỷ lệ khung hình đúng nền tảng: 9:16 cho nội dung dọc, 16:9 cho video ngang.
  • Chia nhỏ batch (4 video/request) để tránh nghẽn hoặc lỗi quota khi tạo hàng loạt.
  • Rà soát nội dung đầu ra đảm bảo tuân thủ quy định về an toàn và đạo đức AI trước khi xuất bản.

Với Veo 3, bạn có thể tự động hóa quy trình sáng tạo video, từ ý tưởng đến sản phẩm hoàn chỉnh chỉ bằng vài dòng lệnh. Hãy bắt đầu thử ngay Veo 3 trên Vertex AI Studio hoặc liên hệ HVMO để được hỗ trợ tích hợp API.

Thông tin liên hệ:

Học Viện Marketing Online

Hotline/Zalo: 0878 779 111

Trụ sở 1: CT5- X2 KĐT Linh Đàm- Hoàng Mai- Hà Nội

Trụ sở 2: 67 Nam Dư- Hoàng Mai- Hà Nội

Trụ sở 3: Số 139 Ngũ Nhạc- Hoàng Mai- Hà Nội

Websitehttps://hocvienmarketingonline.com/

Youtubehttps://www.youtube.com/c/H%E1%BB%8DcVi%E1%BB%87nMarketingOnlineNo1

Fanpagehttps://www.facebook.com/HocVienMarketingOnline89?locale=vi_VN

Bình luận:

Liên hệ tư vấn

Chat ngay với chúng tôi tại đây!

Tác giả
Tác giả

Phố Tổng là Chủ Tịch tại Học Viện Marketing Online, là một chuyên gia tư vấn và đào tạo trong lĩnh vực Trí tuệ Nhân tạo (AI) và Marketing Online.

Với hơn 9 năm kinh nghiệm, Phố Tổng đã đóng vai trò quan trọng trong việc giúp các doanh nghiệp và cá nhân tận dụng sức mạnh của AI để nâng cao chiến lược Marketing số của mình. Sự hiểu biết sâu rộng của ông về các ứng dụng AI và xu hướng Marketing trực tuyến đã giúp ông trở thành một nhà lãnh đạo tiên phong trong ngành.