Google ra mắt TPU thế hệ thứ 8, chuyển hướng sang AI đại lý tại Google Cloud Next nhằm thúc đẩy tăng trưởng

TradingKey

Tác giảJane Zhang

24 Th04 2026 08:21

Podcast AI

Xem tất cả bình luận（0）



Tại hội nghị Google Cloud Next, Google đã giới thiệu TPU thế hệ thứ 8 (TPU 8t cho đào tạo, TPU 8i cho suy luận), ra mắt Gemini Enterprise Agent Platform và cam kết chi tiêu vốn 175-185 tỷ USD. JPMorgan, BofA và Citi duy trì xếp hạng "Mua" cho Alphabet, nhấn mạnh lợi thế cạnh tranh từ Gemini, TPU và nền tảng Agent. TPU 8i giải quyết "bức tường bộ nhớ" với HBM 288GB và SRAM 384MB, hoạt động trên máy chủ CPU Axion. Gemini Enterprise Agent Platform trên Vertex AI giúp doanh nghiệp triển khai AI tác nhân dễ dàng. Tuy nhiên, chi tiêu vốn cao gây áp lực lên biên lợi nhuận và dòng tiền tự do, đặt ra thách thức về khả năng tăng trưởng và biên lợi nhuận của Google Cloud.

Tóm tắt do AI tạo

TradingKey - Google (GOOG) (GOOGL) Sự kiện thường niên 'Google Cloud Next 26' đã diễn ra tại Mỹ từ ngày 22 đến 24 tháng 4 năm nay. Tại hội nghị, Google đã công bố TPU thế hệ thứ 8, ra mắt ngăn xếp công nghệ Agentic Enterprise và tái khẳng định mức tăng mạnh mẽ trong chi tiêu vốn, với kế hoạch đầu tư từ 175 tỷ USD đến 185 tỷ USD trong năm nay.

Sau hội nghị, JPMorgan (JPM), BofA Securities (BAC) và Citi Research (C) tất cả đều duy trì xếp hạng 'Mua' đối với Alphabet, lưu ý rằng khả năng cạnh tranh cốt lõi của Google nằm ở sự cộng hưởng sâu sắc giữa mô hình Gemini, các TPU độc quyền và nền tảng Agent cho doanh nghiệp, điều này sẽ đóng vai trò là động lực trực tiếp cho giá cổ phiếu.

Sự phân nhánh Silicon: TPU 8i và TPU 8t

Thị trường vốn hiện đang theo dõi sát sao tiến trình phát triển chip tự thiết kế của Google. Với lần ra mắt này, dòng TPU thế hệ thứ 8 của Google lần đầu tiên được chia thành hai dòng sản phẩm độc lập: TPU 8t, được thiết kế để đào tạo mô hình AI, và TPU 8i, được định vị là chip chuyên dụng cho suy luận.

Amin Vahdat, Phó Chủ tịch của Google, cho biết chip đào tạo TPU 8t sử dụng cấu trúc mạng Virgo mới để mở rộng các cụm máy chủ lên hơn một triệu chip trên mỗi cụm đơn lẻ. Hiệu suất tính toán của mảng TPU 8t cao gần gấp ba lần so với thế hệ Ironwood trước đó, với hiệu suất trên mỗi watt được cải thiện lên tới hai lần.

Các dòng chip truyền thống thường gặp phải vấn đề "bức tường bộ nhớ" (memory wall) – một nút thắt cổ chai xảy ra khi chip không thể truy cập dữ liệu đủ nhanh, buộc người dùng phải chịu thời gian phản hồi lâu hơn. TPU 8i là giải pháp của Google để "phá vỡ bức tường bộ nhớ", xử lý lượng dữ liệu khổng lồ ở tốc độ cực cao với độ trễ tối thiểu. Điều này đạt được nhờ bộ nhớ băng thông cao (HBM) 288GB và SRAM trên chip 384MB – thông số sau cao gấp ba lần so với phiên bản tiền nhiệm – cho phép tập hợp hoạt động của mô hình chạy ngay trong chip và loại bỏ nhu cầu truyền dữ liệu khoảng cách xa giữa bộ xử lý và bộ nhớ.

Hai loại chip này lần đầu tiên được vận hành trên các nền tảng dựa trên cấu trúc Arm của riêng Google là (ARM) máy chủ CPU Axion, cho phép Google tối ưu hóa toàn bộ hệ thống để cải thiện hiệu suất và hiệu quả. Cả hai loại chip đều sử dụng công nghệ làm mát bằng chất lỏng thế hệ thứ tư của Google, duy trì mật độ hiệu suất mà hệ thống làm mát bằng không khí không thể đạt được.

JPMorgan cho biết trong một báo cáo nghiên cứu rằng việc Google chia TPU thành hai dòng sản phẩm độc lập cho suy luận và đào tạo, thay vì sử dụng chip đào tạo để suy luận, cho thấy Google tin rằng nhu cầu về sức mạnh tính toán suy luận đã tăng đủ lớn để đầu tư vào silicon chuyên dụng và phân bổ vốn riêng biệt. Nhìn về tương lai, cần chú ý đến những thay đổi trong cấu trúc doanh thu của Google trong lĩnh vực này – doanh thu có thể không còn chỉ đến từ việc đào tạo, mà ngày càng tăng từ việc tiêu thụ liên tục ở phía suy luận, hình thành một đường cong tăng trưởng độc lập.

Do ban lãnh đạo không đề cập đến khả năng bán TPU ra bên ngoài trong cuộc họp, các tổ chức hiện tin rằng TPU thế hệ thứ 8 đang được sử dụng cho nhu cầu nội bộ của Google và được cung cấp thông qua các dịch vụ đám mây của hãng.

Triển khai AI tác nhân tại doanh nghiệp

Ngoài các nâng cấp về phần cứng, Google cũng công bố tái cấu trúc lớp nền tảng của mình tại hội nghị, ra mắt Gemini Enterprise Agent Platform trên nền tảng Vertex AI.

Vertex AI là nền tảng học máy (ML) được Google ra mắt vào năm 2021, tích hợp các công cụ như AutoML và AI Platform, cung cấp dịch vụ toàn quy trình từ chuẩn bị dữ liệu đến triển khai mô hình. Nền tảng này chủ yếu hướng đến khách hàng doanh nghiệp; ví dụ, ứng dụng ModiFace của L'Oréal sử dụng Vertex AI để huấn luyện AI chẩn đoán da.

Trong một báo cáo nghiên cứu, J.P. Morgan mô tả đây thực chất là việc "thay thế Vertex AI", tích hợp các chức năng xây dựng doanh nghiệp, điều phối, quản trị và bảo mật vào một điểm truy cập duy nhất thay vì các mô-đun chức năng phân tán.

Citi lưu ý rằng giá trị cốt lõi của nền tảng này nằm ở việc cho phép doanh nghiệp vận hành các quy trình công việc bằng cách đặt nhiều tác nhân (agent) trong cùng một hệ thống quản lý. Đối với các công ty, việc triển khai AI không còn rào cản kỹ thuật cao; một khi nền tảng tiêu chuẩn hóa các ứng dụng, doanh nghiệp có thể đạt được tính năng "cắm và chạy" (plug-and-play) và tiến thẳng vào giai đoạn vận hành thực tế.

Áp lực biên lợi nhuận với mức chi tiêu vốn 175 tỷ USD – 185 tỷ USD

Trong bài phát biểu chính tại hội nghị, CEO Google Sundar Pichai đã tái khẳng định rằng chi phí vốn cho cả năm 2026 dự kiến sẽ nằm trong khoảng từ 175 tỷ USD đến 185 tỷ USD, đây cũng là tuyên bố duy nhất liên quan đến quy mô tài chính tại sự kiện này. Ba tổ chức đã đưa ra những quan điểm khác nhau về vấn đề này.

JPMorgan lưu ý rằng từ góc nhìn ngắn hạn, điều này làm tăng khả năng báo cáo kết quả kinh doanh vào tuần tới sẽ "giữ nguyên dự báo hiện tại". Tuy nhiên, xét trên cơ sở cả năm, Giám đốc Công nghệ (CTO) hạ tầng AI của Google Amin Vahdat và Nhà khoa học AI trưởng Jeff Dean đều nhấn mạnh rằng AI vẫn đang bị hạn chế về nguồn cung, cho thấy lộ trình chi phí vốn vẫn có khả năng tăng thêm.

BofA Securities đã chỉ trực tiếp vào các rủi ro: khi các khoản đầu tư vào AI đẩy chi phí vốn lên cao và thu hẹp dòng tiền tự do, chúng trở thành một trong những yếu tố trực tiếp nhất gây áp lực lên biên lợi nhuận.

Trong các quý tới, trọng tâm sẽ là mức độ mà Google có thể giảm thiểu tác động đến dòng tiền trong khi vẫn có khả năng tăng mạnh chi tiêu cho AI, và liệu công ty có thể đáp ứng được kỳ vọng cao của thị trường về tăng trưởng và biên lợi nhuận của Google Cloud hay không.

Nội dung này được dịch bằng trí tuệ nhân tạo và đã được hiệu đính cho dễ hiểu hơn. Chỉ mang tính chất tham khảo.

Đọc bản gốc

Tuyên bố miễn trừ trách nhiệm: Nội dung của bài viết này chỉ phản ánh quan điểm cá nhân của tác giả và không đại diện cho lập trường chính thức của TradingKey. Bài viết không được xem là lời khuyên đầu tư. Nội dung chỉ mang tính tham khảo, và độc giả không nên đưa ra quyết định đầu tư chỉ dựa trên bài viết này. TradingKey không chịu trách nhiệm đối với bất kỳ kết quả giao dịch nào phát sinh từ việc dựa trên nội dung bài viết. Ngoài ra, TradingKey không thể đảm bảo tính chính xác của nội dung bài viết. Trước khi đưa ra bất kỳ quyết định đầu tư nào, bạn nên tham khảo ý kiến của một chuyên gia tài chính độc lập để nắm rõ các rủi ro liên quan.

Thích