Khi Mô hình Định giá theo Người dùng SaaS Sụp đổ, Hoạt động Suy luận Vượt qua Huấn luyện: Giải mã Những Số phận Khác biệt của các Gã khổng lồ Neocloud CoreWeave, Nebius, và IREN
Báo cáo SemiAnalysis ngày 5/2026 cho thấy doanh thu định kỳ hàng năm (ARR) của Anthropic tăng mạnh lên 44 tỷ USD, với biên lợi nhuận gộp hạ tầng suy luận hơn 70%. Nhu cầu tính toán AI phân rã cấu trúc, với suy luận vượt qua đào tạo. Mô hình kinh doanh SaaS chuyển dịch từ số lượng người dùng sang thanh toán theo mức sử dụng token. Các nhà cung cấp đám mây quy mô lớn (hyperscaler) gặp khó khăn trong việc đáp ứng nhu cầu tràn, tạo cơ hội cho các đơn vị Neocloud như CoreWeave, Nebius, IREN. CoreWeave tập trung vào đào tạo, Nebius vào suy luận, còn IREN là chủ đất GPU. Nút thắt chuỗi cung ứng điện năng đang định hình lại cục diện cạnh tranh.

1. Sự phân rã cấu trúc của nhu cầu tính toán AI: Những tác động công nghiệp từ hiện tượng Anthropic
Theo báo cáo nghiên cứu mới nhất được SemiAnalysis công bố vào đầu tháng 5/2026, doanh thu định kỳ hàng năm (ARR) của Anthropic chỉ ở mức xấp xỉ 1 tỷ USD vào tháng 12/2024, đạt 9 tỷ USD vào tháng 12/2025 và kể từ đó đã tăng vọt lên 44 tỷ USD tính đến tháng 5/2026. Nói cách khác, nền tảng doanh thu của công ty đã tăng gần gấp 5 lần trong 5 tháng qua, bổ sung trung bình 96 triệu USD ARR ròng mỗi ngày. Alex Clayton, đối tác tại Meritech Capital, đã lưu ý trong các bình luận công khai rằng ông đã nghiên cứu hồ sơ IPO của hơn 200 công ty phần mềm đại chúng và chưa bao giờ thấy một đường cong tăng trưởng như vậy; đáng chú ý, ARR của Anthropic chỉ vừa mới nhảy vọt từ 1 tỷ USD lên 3 tỷ USD khi ông đưa ra nhận xét đó, và tốc độ tăng trưởng kể từ đó đã tăng tốc chứ không hề chậm lại.
Đáng chú ý hơn nữa là các chỉ số biên được tiết lộ trong cùng báo cáo: biên lợi nhuận gộp của hạ tầng suy luận tự vận hành của Anthropic đã nhảy vọt từ 38% cách đây một năm lên hơn 70% hiện nay. Điều này có nghĩa là công ty không chỉ đang nhanh chóng mở rộng nền tảng doanh thu mà còn cải thiện hiệu quả kinh tế trên mỗi đơn vị sản phẩm (unit economics), trái ngược với định kiến cho rằng "các công ty AI chỉ biết đốt tiền thông qua huy động vốn".
Tuy nhiên, hạ tầng riêng của Anthropic đơn giản là không thể gánh vác quy mô năng lượng tính toán cần thiết đằng sau sự tăng trưởng bùng nổ này. Một quan niệm sai lầm phổ biến trên thị trường là năng lượng tính toán của Anthropic đến từ Amazon Web Services và Google Cloud và không có mối quan hệ trực tiếp với các đơn vị gọi là "Neocloud". Quan sát này không hoàn toàn chính xác. Cấu trúc tính toán của Anthropic là một mô hình thu nhỏ của ngành AI hiện nay: Amazon và Google xử lý các tải trọng đào tạo hàng đầu, nhưng nhu cầu tràn ra khỏi năng lực độc quyền của các nhà cung cấp đám mây quy mô lớn (hyperscaler) sẽ tự nhiên chảy sang các nhà cung cấp bên thứ ba. Hợp đồng tính toán dài hạn của Anthropic với CoreWeave vào tháng 4/2026 và các báo cáo về những cuộc đàm phán với Nebius vào tháng 5 là những biểu hiện trực tiếp của cơ chế tràn (spillover) này.
Hiểu được logic tràn này là rất quan trọng để đánh giá lĩnh vực Neocloud. Nền tảng kinh doanh của "Bộ ba Neocloud" — CoreWeave, Nebius và IREN — không bắt nguồn từ việc phục vụ trực tiếp các phòng thí nghiệm AI hàng đầu như Anthropic, mà từ việc nắm bắt khoảng cách tính toán được tạo ra bởi sự tăng trưởng bùng nổ của toàn bộ ngành AI. Bài viết này sẽ phân tích một cách hệ thống hai thay đổi cấu trúc thúc đẩy việc định giá lại các Neocloud, vị thế khác biệt của ba công ty trong chuỗi ngành và vai trò của các điểm nghẽn chuỗi cung ứng điện trong việc định hình lại bối cảnh cạnh tranh, cuối cùng là tóm tắt một khung phân tích cho các nhà đầu tư dài hạn.
2. Thay đổi cấu trúc đầu tiên: Sự sụp đổ của mô hình kinh doanh SaaS dựa trên số lượng người dùng (Seat-based)
Trong hai thập kỷ qua, mô hình lợi nhuận cốt lõi của ngành SaaS đã được xây dựng dựa trên "số ghế" (seats). Logic khá đơn giản: nếu một công ty có 100 nhân viên cần sử dụng Salesforce, Salesforce sẽ tính phí hàng tháng dựa trên 100 người dùng này. Mô hình này cực kỳ hấp dẫn đối với các nhà đầu tư nhờ doanh thu ổn định và có thể dự đoán được, cho phép các công ty như Salesforce, ServiceNow và Workday xây dựng vốn hóa thị trường lên tới hàng chục, thậm chí hàng trăm tỷ USD.
Tuy nhiên, sự xuất hiện của AI tạo sinh đã phá vỡ hoàn toàn logic này. Một kịch bản cụ thể minh họa cho sự đứt gãy này: giả sử một công ty chỉ có một kỹ sư, nhưng anh ta sử dụng một công cụ lập trình AI như Cursor, cho phép anh ta hỗ trợ cấu trúc lại 5.000 dòng mã trong vòng một giờ, kích hoạt hàng trăm lượt gọi API và tiêu thụ hàng chục triệu token. Trong bối cảnh này, "số lượng người dùng" và "mức tiêu thụ tính toán thực tế" đã trở nên hoàn toàn tách biệt. Đối với các công ty SaaS, việc tiếp tục thu phí theo người dùng có nghĩa là một nhân viên trả phí đăng ký 20 USD hàng tháng, trong khi chi phí tính toán thực tế ở máy chủ tiêu tốn có thể lên tới 50 USD — đây là lý do cơ bản khiến các công cụ thuần AI như Cursor và Claude Code phải đối mặt với thua lỗ trong giai đoạn đầu.
Để giải quyết mâu thuẫn cấu trúc này, toàn ngành đang chuyển dịch sang mô hình kết hợp "phí đăng ký cơ bản + thanh toán theo mức sử dụng": các công ty trả một khoản phí cố định hàng tháng làm ngưỡng gia nhập, trong khi lượng tiêu thụ token vượt quá hạn mức sẽ được tính giá riêng. Hiện tại, các công ty hàng đầu như OpenAI, Anthropic, Microsoft và HubSpot đã hoàn thành hoặc đang trải qua quá trình chuyển đổi này. Gartner dự báo đến cuối năm 2026, 70% doanh nghiệp sẽ ưu tiên các mô hình thanh toán theo mức sử dụng hơn là các hệ thống thuần dựa trên số lượng người dùng.
Xu hướng này cũng giải thích cách Anthropic đạt được mức tăng trưởng ARR gấp 5 lần trong vòng 5 tháng. Động lực tăng trưởng của nó đến chủ yếu từ sự mở rộng theo cấp số nhân của mức tiêu thụ token bởi các khách hàng doanh nghiệp hiện hữu chứ không đơn thuần là việc thu hút khách hàng mới. Dữ liệu được Anthropic công bố công khai cho thấy số lượng khách hàng doanh nghiệp trả hơn 1 triệu USD mỗi năm đã tăng gấp đôi trong hai tháng qua; 8 trong số 10 công ty thuộc nhóm Fortune 10 là khách hàng trả phí của họ; và sản phẩm Claude Code của họ đã đạt ARR 2,5 tỷ USD vào tháng 2/2026, với người dùng doanh nghiệp chiếm hơn 50%. Cùng với nhau, những con số này truyền tải một sự thật cốt lõi: mô hình kinh doanh của kỷ nguyên AI không còn bán số ghế người dùng, mà bán token — giá trị của một người dùng là cố định, nhưng nhu cầu về token về lý thuyết là vô hạn.
3. Thay đổi cấu trúc thứ hai: Tính toán suy luận vượt qua đào tạo về mặt lịch sử
Nếu sự sụp đổ của mô hình dựa trên người dùng là một sự chuyển dịch ở cấp độ mô hình kinh doanh, thì việc tính toán suy luận vượt qua đào tạo là sự định hình lại căn bản về cấu trúc nhu cầu hạ tầng.
Để giải thích ngắn gọn các khái niệm này: đào tạo (training) là quá trình dạy cho một mô hình lớn những kiến thức hiện có, trong khi suy luận (inference) là quá trình mô hình hỗ trợ người dùng giải quyết các vấn đề cụ thể sau khi triển khai. Trong hai năm qua, sự tập trung của thị trường vào năng lực tính toán AI chủ yếu tập trung vào phía đào tạo — việc OpenAI chi hàng trăm triệu USD để đào tạo các dòng GPT và việc Meta xây dựng các trung tâm dữ liệu AI quy mô lớn hàng gigawatt đều thuộc danh mục này. Tuy nhiên, bối cảnh công nghiệp đang thay đổi nhanh chóng.
Theo các dự báo mới nhất từ Gartner và Deloitte: năm 2023, đào tạo chiếm 67% năng lực tính toán AI trong khi suy luận chỉ chiếm 33%; đến năm 2025, cả hai sẽ chiếm một nửa; đến năm 2026, suy luận sẽ vượt đào tạo để đạt 67%; và đến năm 2030, tỷ trọng suy luận sẽ đạt 70%. Dữ liệu do chính NVIDIA công bố thậm chí còn trực diện hơn — hiện tại, 80% ngân sách AI của doanh nghiệp được chi cho suy luận, chỉ có 20% đầu tư vào đào tạo.
Tại sao sự đảo ngược này lại có ý nghĩa cấu trúc? Lý do cơ bản là đường cong tiêu thụ của cả hai hoàn toàn khác nhau. Đào tạo là một khoản chi phí R&D một lần — mức tiêu thụ tính toán kết thúc khi mô hình được đào tạo xong; tuy nhiên, suy luận là một khoản chi phí vận hành liên tục — miễn là người dùng vẫn đang gọi AI, năng lượng suy luận sẽ tiếp tục được tiêu thụ. Sự xuất hiện của kỷ nguyên Agent (đại lý AI) càng khuếch đại xu hướng này thêm nhiều bậc: trước đây, một người dùng đặt câu hỏi cho ChatGPT chỉ kích hoạt một lần gọi LLM; nhưng hiện nay, yêu cầu một Agent hỗ trợ phân tích báo cáo tài chính có thể tự động kích hoạt hàng chục lượt gọi tìm kiếm, đọc, xác minh và tóm tắt, mỗi bước đều tiêu thụ token. Đây là lý do căn bản khiến sản phẩm Claude Code mang tính định hướng Agent cao của Anthropic tiêu tốn năng lượng tính toán trên mỗi người dùng gấp hơn mười lần so với người dùng ChatGPT truyền thống.
Một câu hỏi quan trọng được đặt ra ở đây: vì nhu cầu suy luận quá lớn, tại sao các Neocloud lại được hưởng lợi thay vì các nhà cung cấp đám mây quy mô lớn (hyperscaler) như Amazon Web Services, Microsoft Azure và Google Cloud? Nếu câu hỏi này không được làm rõ, toàn bộ luận điểm lạc quan về Neocloud sẽ không đứng vững. Trên thực tế, logic của việc suy luận tràn ra từ các hyperscaler bao gồm ba lớp độc lập nhưng hỗ trợ lẫn nhau.
Lớp thứ nhất là sự mất cân đối cung-cầu trong ngắn hạn:Năng lực của các hyperscaler từ lâu đã được lấp đầy bởi các khách hàng chủ chốt của chính họ — Microsoft Azure phục vụ OpenAI và Anthropic, Amazon Web Services phục vụ Anthropic, và Google Cloud hỗ trợ cả Anthropic lẫn Gemini của chính họ. Ngay cả khi các gã khổng lồ này duy trì chi phí vốn hàng năm lên tới hàng trăm tỷ USD, tốc độ xây dựng vẫn không thể bắt kịp đà tăng trưởng nhu cầu. Hợp đồng trị giá 17,4 tỷ USD của Microsoft với Nebius và hợp đồng 9,7 tỷ USD với IREN là minh chứng trực tiếp cho nhu cầu tràn này — nếu các trung tâm dữ liệu của chính Microsoft đủ để đáp ứng nhu cầu, họ sẽ không cần phải mua từ bên thứ ba.
Lớp thứ hai là sự khác biệt về cấu trúc trong lợi thế giá cả:Báo cáo Tokenomics do Deloitte công bố vào tháng 1/2026 đã nêu rõ:Tokenomics (Kinh tế học Token)Báo cáo chỉ rõ rằng đối với các tải công việc token quy mô trung bình, giá của Neocloud rẻ hơn từ 30% đến 80% so với các hyperscaler truyền thống. Sự khác biệt này không đến từ các cuộc chiến giá cả mà từ sự khác biệt mang tính thế hệ trong hạ tầng. Các Neocloud không có gánh nặng di sản — trung tâm dữ liệu của họ được thiết kế ngay từ đầu với GPU là cốt lõi, không cần gánh các chi phí dư thừa để hỗ trợ dịch vụ đám mây đa dụng truyền thống. Amazon, Microsoft và Google đang bổ sung các cơ sở AI trên nền các đám mây hiện có, trong khi các Neocloud thuần túy là AI bản địa (AI-native); cấu trúc chi phí đơn vị của hai bên hoàn toàn khác nhau.
Lớp thứ ba là nhu cầu chủ động của khách hàng trong việc đa dạng hóa nhà cung cấp:Các khách hàng AI lớn như Anthropic lo ngại về việc quá phụ thuộc vào một nhà cung cấp đám mây duy nhất — một khi bị ràng buộc, các quân bài mặc cả sẽ bị mất. Do đó, họ chủ động đa dạng hóa nguồn năng lượng tính toán của mình, dành một phần nhu cầu cho các nhà cung cấp bên thứ ba trung lập như CoreWeave và Nebius. Mặc dù Anthropic đã ký một đơn hàng lịch sử 1 triệu TPU với Google, họ cũng đã tham gia với CoreWeave và Nebius; động lực cốt lõi không hẳn là thiếu hụt năng lực tính toán của Google, mà là đảm bảo luôn có các kênh cung ứng đa dạng.
Khi kết hợp ba lớp logic này, sự bùng nổ nhu cầu tính toán suy luận không phải là cơ hội ngẫu nhiên cho các Neocloud, mà là kết quả tất yếu của những thay đổi trong cấu trúc ngành.
4. Định vị khác biệt của ba gã khổng lồ Neocloud: Máy đào tạo, Nền tảng suy luận và Chủ đất GPU
4.1 CoreWeave: Người dẫn đầu về đào tạo dành riêng cho các phòng thí nghiệm AI hàng đầu
Định vị thị trường của CoreWeave (CRWV) rất khác biệt — đây là một trong số ít các nhà cung cấp hạ tầng đám mây GPU hiện có khả năng phục vụ đồng thời bốn gã khổng lồ R&D AI lớn nhất thế giới. Meta, Anthropic, OpenAI và Google đều đã ký các hợp đồng tính toán lớn với CoreWeave vào năm 2026, một cấu trúc khách hàng vốn khó có thể tưởng tượng vào đầu năm 2025 nhưng đã trở thành hiện thực vào năm 2026.
Về dữ liệu tài chính, Nghĩa vụ thực hiện còn lại (RPO) lũy kế của CoreWeave đạt 66,8 tỷ USD tính đến cuối tháng 12/2025, tăng đáng kể hơn 50 tỷ USD so với cuối năm 2024 (tăng trưởng hơn 4 lần so với cùng kỳ năm ngoái). Vào ngày 9/4/2026, CoreWeave đã bổ sung một hợp đồng mới trị giá 21 tỷ USD vào hợp đồng 14,2 tỷ USD đã ký với Meta vào tháng 9/2025, nâng tổng số tiền cam kết của Meta lên 35,2 tỷ USD, với thời hạn hợp đồng được kéo dài đến tháng 12/2032. Kết hợp với hợp đồng dài hạn ký với Anthropic trong cùng kỳ, Wells Fargo ước tính quy mô hợp đồng thực tế của CoreWeave đã vượt quá 90 tỷ USD.
Hướng dẫn doanh thu của công ty cho năm 2026 là 12 tỷ USD đến 13 tỷ USD, tương ứng với mức tăng trung bình hàng năm là 140%; ban lãnh đạo kỳ vọng doanh thu định kỳ sẽ đạt 17 tỷ USD đến 19 tỷ USD vào năm 2026 và phá vỡ mức 30 tỷ USD vào năm 2027. Để hỗ trợ mục tiêu tăng trưởng này, hướng dẫn Chi phí vốn (CapEx) năm 2026 đã nhảy vọt từ 14,9 tỷ USD năm 2025 lên 30 tỷ USD – 35 tỷ USD.
Một điểm đáng làm rõ là CoreWeave không "chỉ làm đào tạo". Ngăn xếp phần mềm của nó cũng đang tích cực tiến vào lĩnh vực suy luận, bao gồm CKS (CoreWeave Kubernetes Service), SUNK (Slurm on Kubernetes) và việc mua lại Weights & Biases — tất cả đều là các bước đi chiến lược nhằm củng cố khả năng suy luận. Tuy nhiên, cấu trúc khách hàng quyết định trọng tâm kinh doanh hiện tại vẫn là đào tạo — OpenAI, Anthropic và Meta thường sử dụng CoreWeave để đào tạo các mô hình tiên phong trước, sau đó tải trọng suy luận sẽ là phần mở rộng tự nhiên sau khi quá trình đào tạo hoàn tất. Giả định cốt lõi khi đầu tư vào CoreWeave về cơ bản là nhận định rằng "nhu cầu đào tạo sẽ tiếp tục tăng lên".
Về rủi ro tài chính, tổng nợ của CoreWeave tính đến cuối năm 2025 là xấp xỉ 21 tỷ USD, cộng với 34 tỷ USD nghĩa vụ thuê ngoài bảng cân đối kế toán, dẫn đến một cấu trúc vốn có đòn bẩy cao. Chi phí lãi vay trong một quý duy nhất (Quý 4) đạt 388 triệu USD, cao hơn gấp đôi mức 149 triệu USD cùng kỳ năm 2024. EBITDA điều chỉnh Quý 4 là 898 triệu USD, với biên EBITDA cao tới 57%, cho thấy hiệu quả kinh tế đơn vị mạnh mẽ trong mảng kinh doanh cốt lõi; tuy nhiên, lỗ ròng theo GAAP đã nới rộng lên 452 triệu USD, cho thấy áp lực đầu tư vốn lên lợi nhuận ngắn hạn vẫn chưa hạ nhiệt. Ban lãnh đạo kỳ vọng Quý 1/2026 sẽ là điểm thấp nhất về biên lợi nhuận (với lợi nhuận hoạt động điều chỉnh chỉ từ 0–40 triệu USD), dần phục hồi lên mức hai chữ số thấp cho cả năm 2026, với mục tiêu dài hạn được đặt trong khoảng 25%–30%.
Sự tập trung khách hàng là một yếu tố rủi ro khác không thể bỏ qua. Microsoft đã đóng góp 62% doanh thu của CoreWeave trong năm 2024 và vẫn chiếm 67% vào năm 2025, đạt mức cao nhất là 71% trong Quý 2. Mặc dù ban lãnh đạo kỳ vọng tỷ trọng của Microsoft sẽ giảm xuống dưới 50% khi các hợp đồng với OpenAI, Meta và Anthropic được thực hiện, các tính toán của Next Platform cho thấy trong lượng đơn hàng tồn đọng đã mở rộng lên 87,8 tỷ USD, Meta chiếm 40,1% và OpenAI chiếm 25,5%, tổng cộng chiếm gần 65%. Nói cách khác, sự tập trung khách hàng không hề biến mất; các nhân vật chính chỉ đơn giản là đã thay đổi. Vào đầu tháng 5/2026, Wall Street Journal đưa tin rằng dữ liệu người dùng và doanh thu nội bộ của OpenAI không đạt mục tiêu đề ra, khiến CoreWeave giảm gần 3% trong một ngày, minh họa cho sự nhạy cảm của thị trường đối với rủi ro này. Ngoài ra, nhà đầu tư tổ chức Magnetar đã bán 1,28 triệu cổ phiếu vào ngày 1/5/2026, thu về 154 triệu USD, đây cũng là một tín hiệu nội bộ đáng chú ý.
CoreWeave sẽ công bố báo cáo tài chính Quý 1/2026 sau khi thị trường đóng cửa vào ngày 7/5/2026. Theo đồng thuận thị trường của LSEG, doanh thu Quý 1 dự kiến đạt từ 1,9 tỷ USD đến 2 tỷ USD, với lợi nhuận hoạt động điều chỉnh dự kiến đạt 0–40 triệu USD. Ba chỉ số quan sát then chốt bao gồm: liệu tốc độ tăng trưởng hàng quý của RPO có thể vượt quá 50% hay không (thị trường kỳ vọng 35%–40%, sự đột phá bất ngờ sẽ là tín hiệu tăng giá mạnh mẽ); liệu hiệu quả kinh tế đơn vị có chuyển sang dương lần đầu tiên hay không; và liệu lịch trình bàn giao năng lực tính toán cho OpenAI có diễn ra đúng kế hoạch hay không.
4.2 Nebius: Nền tảng AI toàn diện ưu tiên suy luận
Định vị của Nebius Group (NBIS) hoàn toàn khác biệt so với CoreWeave. Nếu CoreWeave được ví như một "máy đào tạo", thì định vị cốt lõi của Nebius là một "nền tảng toàn diện ưu tiên suy luận". Sản phẩm chủ lực của nó, Token Factory, áp dụng mô hình thanh toán theo mức sử dụng trên mỗi token, phù hợp hoàn hảo với logic thu phí bên ngoài của các nhà sản xuất mô hình lớn như Anthropic và OpenAI.
Để củng cố định hướng chiến lược này, Nebius đã thông báo vào ngày 1/5/2026 rằng họ sẽ mua lại Eigen AI với giá 643 triệu USD — một công ty được ươm tạo bởi Phòng thí nghiệm Han Song của MIT, với công nghệ cốt lõi là Lượng tử hóa trọng số theo kích hoạt (Activation-aware Weight Quantization - AWQ), cho phép một GPU NVIDIA duy nhất xuất ra nhiều token hơn. Trong thời điểm khan hiếm năng lực tính toán cực độ, công nghệ này trực tiếp quyết định hiệu quả thu nhập trên mỗi đơn vị của mảng kinh doanh suy luận của Nebius.
Ở cấp độ hợp đồng, Nebius hiện đang nắm giữ lượng đơn đặt hàng tồn đọng trị giá gần 50 tỷ USD, chủ yếu từ ba đơn hàng lớn: hợp đồng 17,4 tỷ USD ký với Microsoft vào tháng 9/2025 (theo hồ sơ 13-F gửi SEC của Nebius, Microsoft đã cam kết khoảng 6,96 tỷ USD thanh toán trước, với hợp đồng được giao thành chín đợt, hai đợt đầu tiên đã được giao đúng hạn vào tháng 11/2025 và tháng 2/2026); một sự mở rộng của hợp đồng Meta 3 tỷ USD ban đầu lên 270 tỷ USD vào tháng 3/2026; và khoản đầu tư 2 tỷ USD của NVIDIA với tư cách là nhà đầu tư chiến lược vào tháng 3/2026.Một chi tiết trong hợp đồng Meta trị giá 270 tỷ USD rất dễ bị hiểu lầm: chỉ có 120 tỷ USD thuộc về hoạt động thu mua độc quyền của Meta, trong khi 150 tỷ USD còn lại là cam kết từ Meta với tư cách là "người mua dự phòng" (backstop buyer) — Nebius trước tiên sẽ cố gắng bán năng lực này cho các khách hàng bên thứ ba khác, và Meta sẽ chỉ chi trả cho phần không bán được. Cấu trúc này làm cho sự tập trung khách hàng thực tế của Nebius phân tán hơn so với những con số bề nổi.Về hướng dẫn doanh thu, doanh thu cả năm 2026 của Nebius dự kiến đạt từ 3 tỷ USD đến 3,4 tỷ USD, tăng trưởng xấp xỉ 600% so với nền tảng 530 triệu USD của năm 2025; mục tiêu ARR hàng năm cho năm 2026 được đặt trong khoảng từ 7 tỷ USD đến 9 tỷ USD. Kỳ vọng doanh thu đồng thuận Quý 1/2026 là 389 triệu USD, tăng 600% so với cùng kỳ năm ngoái.
Trong toàn bộ luận điểm lạc quan về Neocloud, định vị quan trọng nhất là sản phẩm cụ thể duy nhất hiện có thể xác minh bằng dữ liệu tài chính cho việc "thu phí token theo mức sử dụng" là Token Factory của Nebius. Tuy nhiên, công ty vẫn chưa công bố công khai đóng góp doanh thu cụ thể, số lượng khách hàng hoặc tỷ trọng ARR của Token Factory. Điều này có nghĩa là đợt công bố lợi nhuận Quý 1 của Nebius trước khi thị trường mở cửa vào ngày 13/5/2026 sẽ là một phép thử đối với toàn bộ câu chuyện của ngành Neocloud — nếu số lượng khách hàng và tỷ trọng ARR của Token Factory không cho thấy bước nhảy vọt đáng kể, nó sẽ làm lung lay không chỉ logic tăng giá của riêng Nebius mà còn là nền tảng của toàn bộ câu chuyện thu phí token theo mức sử dụng.
Về phía rủi ro, hệ số beta cổ phiếu của Nebius lên tới 2,97, nghĩa là cổ phiếu có thể giảm 3% khi thị trường chung giảm 1%; đây là một cổ phiếu tăng trưởng có lợi nhuận cao, biến động mạnh, không phải là mã cổ phiếu mà người ta có thể nắm giữ dài hạn mà không phải lo lắng.
Ngoài ra, Nebius tiếp tục huy động vốn thông qua các cơ chế chào bán tại thị trường (ATM), gây áp lực pha loãng liên tục lên các cổ đông hiện hữu.
Wolfe Research đã bắt đầu theo dõi cổ phiếu này vào cuối tháng 4/2026 với phạm vi giá trị hợp lý từ 80 USD đến 170 USD — một phạm vi rộng gần 100%, phản ánh trực tiếp sự không chắc chắn cao của thị trường về giá trị tương lai của nó.
Hơn nữa, dữ liệu cho thấy Nebius đã không đạt kỳ vọng doanh thu trong ba trên bốn quý vừa qua; báo cáo kết quả kinh doanh ngày 13/5 phải thực hiện được những lời hứa của mình, nếu không phản ứng của giá cổ phiếu sẽ khá dữ dội.
Bên cạnh tỷ trọng doanh thu của Token Factory, trọng tâm quan sát kết quả kinh doanh còn bao gồm việc liệu cấu trúc khách hàng có đa dạng hóa hơn nữa hay không và tiến độ nâng cấp nền tảng Aether. Aether là nền tảng quản lý đám mây toàn diện của Nebius — về cơ bản là "hệ điều hành" cơ bản của nó — và là một sản phẩm cốt lõi độc lập nhưng bổ trợ cho Token Factory. Việc Goldman Sachs nâng giá mục tiêu lên 205 USD nằm ở sự tin tưởng vào khả năng thực thi của Aether và Token Factory.
4.3 IREN: Chủ đất GPU tập trung vào hạ tầng vật lý
Định vị thị trường của IREN (IREN) là độc đáo nhất. Nếu CoreWeave nhắm vào đào tạo và Nebius nhắm vào suy luận, IREN đại diện cho một mô hình kinh doanh khác — chủ cho thuê thiết bị vật lý (bare-metal landlord), hay còn gọi là "chủ đất GPU". Không giống như hai cái tên trước, nó không đi sâu vào ngăn xếp phần mềm mà tập trung vào việc sở hữu hạ tầng vật lý như đất đai, điện năng và tài sản năng lượng tái tạo.
Khách hàng chính của IREN là Microsoft — vào tháng 11/2025, hai bên đã ký hợp đồng 5 năm trị giá 9,7 tỷ USD, khi hoàn tất triển khai sẽ mang lại doanh thu định kỳ hàng năm (ARR) xấp xỉ 1,94 tỷ USD, với biên EBITDA cao tới 85%, mức hàng đầu trong số các đồng nghiệp Neocloud.
Tuy nhiên, hợp đồng này chứa đựng một cấu trúc con số thường bị hiểu lầm. Từ góc độ năng lực, hợp đồng chỉ chiếm 10% tổng năng lực tính toán của IREN — nhưng từ góc độ doanh thu, mức ARR 1,94 tỷ USD của nó chiếm khoảng 57% mục tiêu ARR 3,4 tỷ USD hàng năm cho mảng đám mây AI của công ty vào năm 2026. Cùng một hợp đồng nhưng dẫn đến những kết luận rất khác nhau từ hai góc độ: nó phân tán về mặt năng lực (IREN vẫn còn 90% năng lực có sẵn để bán), nhưng từ góc độ doanh thu, mảng đám mây AI hiện tại của IREN tập trung cao độ vào một khách hàng duy nhất là Microsoft. Sự tương phản giữa năng lực và doanh thu này bắt nguồn từ sự khác biệt trong hiệu quả kinh tế đơn vị của các mảng kinh doanh nội bộ của IREN. 10% năng lực mà Microsoft sử dụng được lắp đặt các GPU GB300 cao cấp nhất của NVIDIA và sử dụng công nghệ làm mát bằng chất lỏng, đóng góp khoảng 9,7 triệu USD doanh thu hàng năm trên mỗi MW; tuy nhiên, hầu hết 90% năng lực còn lại vẫn đang chạy khai thác Bitcoin — sử dụng máy đào ASIC thay vì GPU, với doanh thu hàng năm trên mỗi MW chỉ từ 1 triệu USD đến 3 triệu USD. Hiệu quả thu nhập đơn vị của hai bên chênh lệch từ ba đến mười lần.
Lợi thế cạnh tranh của IREN rất hữu hình: công ty có đòn bẩy tài chính thấp nhất trong số ba cái tên được nhắc tới, sở hữu đất đai và quyền đấu nối lưới điện riêng, có các tài sản năng lượng tái tạo với khả năng tự phát điện, và có thể sử dụng dòng tiền từ việc đào Bitcoin để trợ giá cho chi phí đầu tư các trung tâm dữ liệu mới. Tuy nhiên, những điểm yếu cũng rõ ràng không kém: lớp phần mềm gần như không tồn tại, dẫn đến doanh thu trên mỗi MW chỉ bằng khoảng 1/4 so với CoreWeave (CoreWeave có thể đạt 10 triệu đến 12 triệu USD mỗi MW); vốn chủ sở hữu bị pha loãng nghiêm trọng—số lượng cổ phiếu lưu hành của IREN chỉ là 20,6 triệu vào tháng 6 năm 2021, nhưng đã tăng vọt lên gần 300 triệu trong vòng 5 năm, mức pha loãng hơn 14 lần. Quan trọng nhất, mảng kinh doanh AI cloud của công ty vẫn chưa thực sự thành hình, khiến họ có rất ít quyền thương lượng trong bối cảnh khan hiếm năng lượng tính toán cực độ như hiện nay.
Do đó, mặc dù việc chuyển dịch chiến lược của IREN là đúng đắn và đòn bẩy thấp cùng nguồn lực điện tự chủ tạo thành một con hào ngăn cách thực sự, nhưng thị trường vẫn cần một chất xúc tác rõ ràng để định giá lại công ty ở mức bội số của các đối thủ Neocloud—cụ thể là doanh thu AI cloud phải vượt qua doanh thu đào Bitcoin về mặt cấu trúc. Cho đến lúc đó, thị trường có khả năng sẽ tiếp tục định giá công ty như một "đơn vị đào Bitcoin có hoạt động AI".
5. Nút thắt chuỗi cung ứng điện năng đang tái định hình cục diện cạnh tranh
Việc phân tích lĩnh vực Neocloud sẽ thiếu sót nếu chỉ giới hạn ở định vị khác biệt của ba công ty này. Một biến số đang bị thị trường đánh giá thấp trên diện rộng là nút thắt chuỗi cung ứng điện năng, và tác động của nó không đồng nhất đối với ba doanh nghiệp.
Theo báo cáo từ Bloomberg, TechSpot và các cơ quan truyền thông khác, 1/3 đến 1/2 số trung tâm dữ liệu AI dự kiến xây dựng tại Mỹ vào năm 2026 có thể đối mặt với tình trạng trì hoãn hoặc hủy bỏ. Vấn đề cốt lõi không phải là thiếu vốn hay thiếu GPU, mà là bản thân hạ tầng điện không theo kịp đà tăng trưởng nhu cầu—thời gian chờ giao máy biến áp cao áp đã tăng vọt từ mức 24 đến 30 tháng trước năm 2020 lên mức 5 năm như hiện nay. Nút thắt nguồn cung này bắt nguồn từ việc Mỹ ngày càng phụ thuộc vào thiết bị điện Trung Quốc, với lượng máy biến áp nhập khẩu từ Trung Quốc tăng từ khoảng 1.500 đơn vị vào năm 2022 lên hơn 8.000 đơn vị trong 10 tháng đầu năm 2025.
Về mặt bề nổi, rủi ro này có vẻ là tiêu cực cho tất cả các công ty Neocloud, nhưng phân tích sâu hơn cho thấy một tác động hoàn toàn bất đối xứng.
Đối với CoreWeave, đây là con dao hai lưỡi. Mô hình nhẹ tài sản của công ty—chủ yếu thuê trung tâm dữ liệu từ Equinix, Digital Realty và các đơn vị khác—đồng nghĩa với việc công suất mới đi vào hoạt động bị hạn chế trực tiếp bởi các nút thắt chuỗi cung ứng của bên thứ ba. Ngược lại, giá trị hợp đồng đã ký kết trị giá 66,8 tỷ USD của công ty là cố định; ngay cả khi tình trạng thiếu điện trầm trọng hơn, giá trị hợp đồng vẫn không đổi, điều này thực tế lại làm tăng tính khan hiếm của các hợp đồng hiện có.
Đối với Nebius, tác động mang tính hai mặt. Nebius hiện vận hành các trung tâm dữ liệu khắp Bắc Mỹ, châu Âu và Trung Đông; trong bối cảnh tình trạng thiếu điện tồi tệ hơn, công suất trực tuyến này trở thành một tài sản khan hiếm, đó là điểm tích cực. Tuy nhiên, để mở rộng từ quy mô hiện tại lên mục tiêu 5GW vào cuối năm 2030, Nebius cũng sẽ phải chờ đợi máy biến áp và xếp hàng chờ đến lượt. Nói cách khác, nút thắt điện năng là động lực ngắn hạn nhưng lại là thách thức dài hạn đối với Nebius.
Đối với IREN, điều này đại diện cho cả cơ hội bứt phá lớn nhất và rủi ro cao nhất. Lợi thế cốt lõi của công ty nằm ở việc đã đảm bảo được quỹ đất và quyền đấu nối lưới điện, cùng các tài sản năng lượng tái tạo để tự phát điện—về lý thuyết cho phép một phần công suất của họ tránh được sự phụ thuộc hoàn toàn vào chuỗi cung ứng máy biến áp của bên thứ ba. Tuy nhiên, vì mảng AI cloud của IREN chưa trưởng thành, lợi thế này hiện chỉ phục vụ cho một khách hàng duy nhất là Microsoft, khiến công ty khó có thể tận dụng để tạo ra quyền thương lượng cho các hợp đồng thương mại khác.
Biến số ngoại sinh này—nút thắt chuỗi cung ứng điện—đang xáo trộn cục diện cạnh tranh nội bộ của Neocloud. Những người chơi đã kiểm soát được nguồn lực điện sẽ vươn lên dẫn trước, trong khi những bên vẫn đang chờ giao máy biến áp sẽ đối mặt với rủi ro trong việc triển khai thực tế.
6. Bốn câu hỏi đánh giá và năm chỉ số then chốt: Khung phân tích Neocloud có thể tái sử dụng
Sau khi nắm bắt được những thay đổi về cấu trúc, định vị khác biệt của ba công ty và tác động của các nút thắt điện năng, nhà đầu tư cần nhiều hơn là một kết luận "mua/bán" đơn thuần; họ cần một khung đánh giá có thể tái sử dụng. Bốn câu hỏi thường bị thị trường bỏ qua sau đây tạo nên logic cốt lõi cho việc phân bổ danh mục đầu tư Neocloud.
Câu hỏi 1: Bạn đang đặt cược vào huấn luyện hay suy luận?Huấn luyện là một khoản chi phí R&D một lần, trong khi suy luận là việc tiêu thụ năng lượng tính toán liên tục sau khi mô hình được triển khai. Nếu các nhà đầu tư đồng ý với xu hướng cấu trúc rằng suy luận sẽ vượt xa huấn luyện, thì những bên hưởng lợi chính sẽ là những người dẫn đầu về suy luận thay vì huấn luyện. Xét theo tiêu chuẩn này: cơ sở khách hàng của CoreWeave thiên về huấn luyện; sản phẩm Token Factory của Nebius là một sản phẩm suy luận thuần túy; còn IREN là một đơn vị hạ tầng tổng hợp với chiều sâu phần mềm tương đối hạn chế.
Câu hỏi 2: Bạn có tin rằng "thanh toán theo mức độ sử dụng" sẽ trở thành nền tảng mới cho việc định giá SaaS?Nếu các nhà đầu tư tin vào câu chuyện này, điều đó ngụ ý rằng cơ sở khách hàng doanh nghiệp vừa của Neocloud sẽ chứng kiến sự tăng trưởng theo cấp số nhân—theo báo cáo Tokenomics của Deloitte, khối lượng công việc token tầm trung đại diện cho phân khúc mà Neocloud nắm giữ lợi thế chi phí lớn nhất so với các nhà cung cấp đám mây quy mô siêu lớn. Trong kịch bản này, những người chơi như Nebius—với "ngăn xếp phần mềm hoàn chỉnh và cơ sở khách hàng tương đối đa dạng"—sẽ được hưởng lợi nhiều nhất. Ngược lại, nếu nhà đầu tư tin rằng các nhà cung cấp quy mô siêu lớn cuối cùng sẽ thống trị và Neocloud sẽ chỉ phục vụ cho nhu cầu dư thừa, thì CoreWeave, với mối liên kết với bốn phòng thí nghiệm AI lớn, sẽ mang lại sự chắc chắn cao hơn.
Câu hỏi 3: Bạn có thể chịu đựng bao nhiêu rủi ro sụt giảm? Hồ sơ rủi ro của ba công ty này là khác biệt: CoreWeave là "đòn bẩy cao + hợp đồng chắc chắn cao" (tổng nợ 21 tỷ USD, 34 tỷ USD nợ thuê ngoài bảng cân đối kế toán, nhưng có 66,8 tỷ USD giá trị hợp đồng chờ thực hiện với các khách hàng lớn hàng đầu); Nebius là "đòn bẩy thấp + pha loãng cổ phiếu liên tục" (cấu trúc tài chính tương đối lành mạnh, nhưng các đợt chào bán ATM liên tục làm pha loãng cổ đông hiện hữu); IREN là "đòn bẩy thấp nhất + mức độ tập trung khách hàng cao nhất" (cấu trúc vốn lành mạnh nhất trong cả ba, nhưng riêng Microsoft đã chiếm 57% mục tiêu ARR mảng AI cloud). Không có sự phân cấp tuyệt đối giữa ba hồ sơ rủi ro này; mấu chốt là liệu chúng có phù hợp với khẩu vị rủi ro cá nhân của nhà đầu tư hay không.
Câu hỏi 4: Đâu là những chỉ số phép thử thực sự cho mùa báo cáo kết quả kinh doanh này?Câu trả lời cho câu hỏi này trực tiếp tạo thành một danh sách theo dõi có thể hành động được.
- Bộ chỉ số đầu tiên dành cho CoreWeave, sẽ được công bố sau khi thị trường đóng cửa vào ngày 7 tháng 5 năm 2026: liệu tốc độ tăng trưởng hàng quý của giá trị hợp đồng chờ thực hiện có vượt quá 50% hay không (kỳ vọng của thị trường là 35%–40%); liệu kinh tế đơn vị có lần đầu tiên chuyển sang mức dương hay không; và liệu lịch trình bàn giao năng lượng tính toán của OpenAI có đi đúng hướng hay không. Việc không đạt được bất kỳ chỉ số nào trong ba chỉ số này sẽ củng cố lập luận tiêu cực từ phía phe bán.
- Bộ chỉ số thứ hai dành cho Nebius, sẽ được công bố trước khi thị trường mở cửa vào ngày 13 tháng 5 năm 2026: liệu có sự nhảy vọt đáng kể về số lượng khách hàng của Token Factory và tỷ trọng của nó trong ARR hay không. Con số duy nhất này mang theo uy tín của toàn bộ câu chuyện về thanh toán theo mức độ sử dụng cho suy luận.
- Bộ chỉ số thứ ba dành cho IREN, cần được theo dõi trong các báo cáo kết quả kinh doanh tiếp theo: khi nào doanh thu AI cloud sẽ vượt qua doanh thu đào Bitcoin về mặt cấu trúc. Cho đến khi đạt được ngưỡng này, thị trường sẽ khó có thể coi công ty như một đối thủ Neocloud thuần túy.
7. Cảnh báo rủi ro và giới hạn của khung đầu tư
Cuối cùng, một số giới hạn quan trọng cần được làm rõ. Thứ nhất, cả ba công ty Neocloud hiện đang nằm trong tâm bão của mùa báo cáo kết quả kinh doanh; bất kỳ kết quả kinh doanh nào không đạt kỳ vọng cũng có thể kích hoạt mức biến động giá cổ phiếu từ 15% đến 25% trong một ngày. Khung phân tích được cung cấp trong bài viết này không phải là hướng dẫn cho các điểm vào lệnh ngắn hạn mà là công cụ để xây dựng logic phân bổ trong 6 đến 12 tháng tới. Đối với các nhà giao dịch ngắn hạn, giá trị biên của khung này là hạn chế, nhưng đối với các nhà đầu tư dài hạn, những đợt sụt giảm do kết quả kinh doanh có thể lại đại diện cho cơ hội mua vào. Thứ hai, khung này không phải là một câu trả lời duy nhất. Khả năng chịu đựng rủi ro, quy mô vốn và phân bổ danh mục tổng thể của mỗi nhà đầu tư là khác nhau—sử dụng cùng một khung bốn câu hỏi, các nhà đầu tư khác nhau có thể đưa ra kết quả phân bổ hoàn toàn khác nhau; đây là hiện tượng bình thường chứ không phải là sự thất bại của khung phân tích. Thứ ba, tất cả các mục tiêu giá, giá trị hợp đồng và hướng dẫn kết quả kinh doanh trong bài viết này đều dựa trên dữ liệu mới nhất từ đầu tháng 5 năm 2026. Các điều kiện thị trường và các yếu tố cơ bản của công ty thay đổi theo thời gian; độc giả tiếp cận bài viết này vài tháng sau đó nên độc lập xác minh những tiến triển mới nhất.
Nội dung này được dịch bằng trí tuệ nhân tạo và đã được hiệu đính cho dễ hiểu hơn. Chỉ mang tính chất tham khảo.
Bài viết đề xuất













