La Sản xuất chip H200 của Nvidia đã trở thành một trong những điểm đến hấp dẫn nhất của cuộc chiến toàn cầu giành vị trí dẫn đầu trong lĩnh vực trí tuệ nhân tạoTrước áp lực từ nhu cầu của Trung Quốc, các hạn chế xuất khẩu của Mỹ và chuỗi cung ứng chất bán dẫn vốn đã căng thẳng, công ty Mỹ đang cân nhắc cách điều chỉnh năng lực sản xuất mà không làm mất ổn định sự cân bằng công nghệ và địa chính trị mong manh hiện nay.
Các nguồn tin trong ngành chỉ ra rằng Nvidia đã thông báo cho một số khách hàng của mình. khách hàng ở Trung Quốc Công ty đang nghiêm túc xem xét việc mở rộng sản xuất H200 sau khi nhận thấy số lượng đơn đặt hàng vượt xa năng lực sản xuất hiện tại. Quyết định này, hiện chưa được chốt окончательно, được đưa ra trong bối cảnh Washington chuẩn bị cho phép các GPU tiên tiến này vào thị trường Trung Quốc bằng cách áp thuế 25%.
H200, con chip mà Trung Quốc đang rất cần nhưng Nvidia không thể sản xuất đủ nhanh.
Theo những người quen thuộc với các cuộc trò chuyện, Nvidia đã di dời các tập đoàn công nghệ lớn của Trung Quốc. Công ty cho biết năng lực sản xuất H200 hiện tại của họ có hạn và nhu cầu hiện đang cao hơn đáng kể so với nguồn cung hiện có. Công ty đang đánh giá khả năng bổ sung năng lực sản xuất mới, mặc dù bất kỳ thay đổi đáng kể nào cũng sẽ cần thời gian do những hạn chế của ngành.
H200O là Bộ tăng tốc AI nhanh nhất của Hopper trong thế hệ này Chip của Nvidia bắt đầu được triển khai rộng rãi vào năm ngoái. Nó được sản xuất bởi TSMC bằng quy trình 4 nanomet, đưa nó vào nhóm những chip tiên tiến nhất hiện có sẵn cho sản xuất quy mô công nghiệp. Trong hệ sinh thái trung tâm dữ liệu và điện toán đám mây AI, mô hình này được coi là sản phẩm hiệu năng cao, nhưng nó đã tụt hậu so với kiến trúc Blackwell mới hơn và Rubin sắp ra mắt.
Tại thị trường Trung Quốc, H200 có sức hấp dẫn đặc biệt bởi vì nó là sản phẩm vượt trội nhất, con chip trí tuệ nhân tạo mạnh nhất mà các công ty trong nước có thể hợp pháp hướng tới. Hiện tại, các giải pháp thay thế trong nước, bao gồm cả những giải pháp do các nhà sản xuất máy gia tốc lớn của Trung Quốc phát triển, vẫn còn kém xa về sức mạnh tính toán.
Bằng chứng cho sự quan tâm đó là: các công ty như Alibaba hoặc ByteDance Những ngày gần đây, nhiều công ty đã liên hệ với Nvidia để đảm bảo nguồn cung H200O dồi dào, dự đoán về việc nới lỏng quy định. Theo các nguồn tin rò rỉ, các nhóm này sẵn sàng đặt hàng số lượng lớn để củng cố cơ sở hạ tầng đào tạo và triển khai các mô hình AI quy mô lớn.
Tình hình đặc biệt nhạy cảm vì, cùng lúc nghiên cứu việc tăng sản lượng H200O, Nvidia lại đang... ưu tiên quá trình chuyển đổi sang các dòng sản phẩm hiện đại hơn, chẳng hạn như Blackwell. và thế hệ Rubin tiếp theo. Nói cách khác, nhà sản xuất đang phải giữ thăng bằng giữa việc tối đa hóa tiềm năng của thế hệ Hopper tại Trung Quốc và không cản trở việc triển khai các kiến trúc tiên tiến nhất của mình tại các thị trường khác.
Washington mở cửa cho xuất khẩu H200O với mức thuế 25%.
Sự thay đổi trong chính sách của Mỹ là yếu tố then chốt dẫn đến làn sóng yêu cầu này. Nhà Trắng đang chuẩn bị cho... Cho phép xuất khẩu GPU H200 sang Trung QuốcĐộng thái này diễn ra sau nhiều năm tăng cường kiểm soát đối với các chip hiệu năng cao dành cho trí tuệ nhân tạo. Mục tiêu đã nêu là tìm ra điểm cân bằng giữa việc kiềm chế sự tiến bộ công nghệ của Bắc Kinh và không đẩy các công ty Mỹ ra khỏi một trong những thị trường lớn nhất thế giới.
Theo nhiều nguồn tin được truyền thông quốc tế trích dẫn, kế hoạch của chính phủ Mỹ bao gồm: Cho phép vận chuyển H200 sang Trung Quốc bằng cách áp dụng thuế suất 25%. Về doanh số bán hàng, mẫu máy này được mô tả là đủ mạnh để đáp ứng nhu cầu của khách hàng Trung Quốc, nhưng chậm hơn khoảng một năm rưỡi so với các giải pháp tiên tiến hơn của Nvidia, vốn vẫn phải chịu những hạn chế nghiêm ngặt.
Sự thay đổi trong cách tiếp cận này cũng nhằm mục đích khắc phục thất bại của H20, một phiên bản rút gọn được điều chỉnh cho phù hợp với các quy định xuất khẩu do Washington đặt ra. Bắc Kinh cuối cùng đã ngăn chặn hiệu quả việc sử dụng H20O.Với lý do an ninh quốc gia và khuyến khích các công ty trong nước lựa chọn các giải pháp thay thế từ Trung Quốc, quyết định đó đã củng cố các nhà cung cấp trong nước như Huawei, công ty đã lấp đầy một phần khoảng trống mà Nvidia để lại trong lĩnh vực trung tâm dữ liệu AI.
Với H200, cách tiếp cận chính trị lại khác: đó là về... Con chip này, dù không phải là mẫu cao cấp nhất hiện tại của Nvidia, nhưng lại cung cấp sức mạnh tính toán cao hơn nhiều. Nó vượt trội hơn hẳn so với các giải pháp nhỏ hơn như H20O và bỏ xa nhiều bộ xử lý nội địa. Đối với Washington, công thức này sẽ cho phép họ duy trì lợi thế công nghệ rõ rệt mà không phải hy sinh sự hiện diện thương mại của mình tại Trung Quốc.
Quyết định này cũng có khía cạnh kinh tế trực tiếp: bằng cách mở cửa xuất khẩu H200 sang Trung Quốc với một khoản phụ phí bắt buộc, Hoa Kỳ tìm cách nắm bắt một phần giá trị được tạo ra. Do nhu cầu khổng lồ về sức mạnh tính toán tại quốc gia châu Á này. Đồng thời, Nvidia có thể chứng kiến doanh thu tăng vọt nếu các đơn đặt hàng lớn từ các ông lớn công nghệ Trung Quốc cuối cùng được hiện thực hóa.
Trung Quốc đang lưỡng lự giữa việc chấp nhận H200O hoặc bảo vệ ngành công nghiệp trong nước.
Tại Bắc Kinh, khả năng nguồn cung chip H200 ồ ạt đổ về đã gây ra cuộc tranh luận gay gắt trong nội bộ. Mặc dù nhiều công ty đang rất cần tiếp cận những con chip này, Chính phủ Trung Quốc vẫn chưa chính thức phê duyệt các thương vụ mua bán này.Theo các nguồn tin thân cận với quá trình này, các quan chức trong nước vẫn duy trì quan điểm đó. cuộc họp khẩn cấp Phân tích xem liệu có nên cho phép các GPU tiên tiến này thâm nhập thị trường nội địa hay không.
Mối lo ngại chính là nếu việc sử dụng rộng rãi H200O được cho phép, Ngành công nghiệp chip AI trong nước có thể rơi vào tình thế thậm chí còn dễ tổn thương hơn.Cho đến nay, chưa có nhà sản xuất nội địa nào đưa được sản phẩm nào có hiệu năng tương đương với mẫu card đồ họa Nvidia này, làm dấy lên lo ngại về khả năng bị cô lập công nghệ lâu dài nếu các công ty Trung Quốc phụ thuộc vào phần cứng nước ngoài này.
Trong số các phương án được đưa ra, có một công thức kết hợp: Liên kết mỗi lần mua H200 với một tỷ lệ nhất định chip nội địa.Bằng cách này, các công ty Trung Quốc có thể tiếp cận sức mạnh của Nvidia mà không cần hoàn toàn từ bỏ các nhà cung cấp địa phương, những người sẽ được đảm bảo một khối lượng kinh doanh tối thiểu.
Tuy nhiên, xét về khía cạnh kinh doanh, áp lực là điều rõ ràng. Các nhà đầu tư và giám đốc điều hành trong lĩnh vực này chỉ ra rằng H200 nằm trong số những công ty gặp nhiều khó khăn. Nhanh hơn từ hai đến ba lần so với các bộ tăng tốc gia đình tiên tiến nhất.và mạnh hơn tới sáu lần so với H20, mẫu card đồ họa hạ cấp mà Nvidia ra mắt dành riêng cho thị trường Trung Quốc vào cuối năm 2023. Trong bối cảnh các mô hình AI lớn đòi hỏi lượng sức mạnh tính toán khổng lồ, nhiều người chơi coi việc bỏ qua lợi thế này là một điều xa xỉ khó có thể chấp nhận được.
Đồng thời, các quan chức cấp cao từ các công ty trí tuệ nhân tạo Trung Quốc đã công khai thừa nhận rằng Sự thiếu hụt các GPU mạnh mẽ là nút thắt cổ chai chính của họ.Thậm chí còn quan trọng hơn cả việc tiếp cận vốn. Việc thiếu hụt card đồ họa sẽ làm chậm hoặc hạn chế sự mở rộng của một số dự án dịch vụ đám mây và trí tuệ nhân tạo, làm tăng thêm áp lực phải nới lỏng các hạn chế đối với việc nhập khẩu chip tiên tiến.
Việc mở rộng năng lực sản xuất phụ thuộc vào chuỗi cung ứng chất bán dẫn toàn cầu.
Ngay cả khi Nvidia muốn đẩy mạnh sản xuất H200 chỉ sau một đêm, thực tế của ngành công nghiệp bán dẫn cũng đặt ra một rào cản đáng kể. Việc sản xuất chip hiệu năng cao phụ thuộc vào một chuỗi cung ứng cực kỳ chuyên biệt.Từ công nghệ in thạch bản tiên tiến đến bộ nhớ HBM thế hệ tiếp theo.
Đối với dòng H200, công ty không chỉ cần đảm bảo thêm nguồn cung cấp tấm bán dẫn và giờ sản xuất tại các nhà máy của TSMC mà còn phải phối hợp với các nhà cung cấp bộ nhớ như... Samsung, Micron hoặc SK Hynixnhững nhà sản xuất các mô-đun HBM thiết yếu cho các máy gia tốc này. Hơn nữa, bất kỳ sự tăng sản lượng nào cũng đòi hỏi nhiều thiết bị in thạch bản hơn, nhiều vật liệu hóa học hơn và năng lực lớn hơn trong các quy trình nhạy cảm như đóng gói.
Các chuyên gia trong ngành chỉ ra rằng Năng lực sản xuất chip tiên tiến của TSMC hiện đang rất được ưa chuộng.Tình trạng tắc nghẽn này đang ảnh hưởng đến cả Nvidia và các gã khổng lồ công nghệ khác như Google, vốn cũng đang cạnh tranh để giành được không gian sản xuất cho chip AI của riêng mình. Điều này hạn chế tính linh hoạt trong ngắn hạn và buộc các công ty phải lên kế hoạch tăng sản lượng trước nhiều năm.
Các nguồn tin thân cận với chuỗi cung ứng cho biết Nvidia đã lên kế hoạch tăng dần sản lượng của H200 và các mẫu khác, trong giới hạn hợp lý được các đối tác cho phép. Bất kỳ điều chỉnh đáng kể nào khác, do việc mở cửa thị trường Trung Quốc, sẽ không được thực hiện. Việc đó khó có thể thành hiện thực trước hai hoặc ba năm., xét đến thời gian cần thiết để mở rộng công suất lắp đặt và đảm bảo tất cả các thành phần.
Bối cảnh này khiến cho sự gia tăng sản lượng H200O được cho là không phải là một quyết định đột ngột, mà thực chất là... một bài tập cân bằng lại: Chuyển hướng một phần nguồn cung trong tương lai sang Trung Quốc, ưu tiên một số khách hàng nhất định hoặc trì hoãn quá trình chuyển đổi từ kiến trúc Hopper sang các kiến trúc như Blackwell và Rubin trong một số phân khúc, đồng thời vẫn đáp ứng nhu cầu ở các thị trường trọng điểm khác như Hoa Kỳ hoặc Châu Âu.
Tác động toàn cầu và những bài học từ châu Âu
Mặc dù trọng tâm trước mắt của cuộc tranh chấp này là trục Hoa Kỳ-Trung Quốc, nhưng những hệ lụy của những gì xảy ra với... sản xuất và phân phối H200 Những tác động này sẽ được cảm nhận một cách gián tiếp ở phần còn lại của thế giới, bao gồm cả châu Âu. Lục địa già không trực tiếp tham gia vào cuộc chiến pháp lý, nhưng lại phụ thuộc vào cùng một cơ sở hạ tầng điện toán toàn cầu để phát triển các dự án trí tuệ nhân tạo của mình.
Nếu phần lớn sản lượng nước tập trung ở Trung Quốc, thì có khả năng là Nguồn cung các chip này cho các trung tâm dữ liệu châu Âu sẽ càng chịu áp lực lớn hơn.Điều này đang đẩy chi phí tiếp cận phần cứng hiệu năng cao lên cao. Đối với các công ty và cơ quan công cộng châu Âu đang xây dựng các cụm máy chủ AI, bất kỳ sự hạn chế nào nữa về nguồn cung đều có thể dẫn đến sự chậm trễ hoặc hóa đơn lớn hơn.
Mặt khác, quyết định của Washington về việc mở cửa một phần nguồn cung nước trong khi vẫn duy trì kiểm soát chặt chẽ đối với các chip tiên tiến nhất củng cố thêm... Vai trò trung tâm của Hoa Kỳ trong việc định hình luật chơiChâu Âu, đang nỗ lực thúc đẩy ngành công nghiệp bán dẫn của riêng mình thông qua các sáng kiến như Đạo luật Chip châu Âu, đang theo dõi sát sao tình hình này với sự lo ngại, nhận thức được sự phụ thuộc của mình vào cả công nghệ của Mỹ và năng lực sản xuất của châu Á.
Đối với các cơ quan quản lý châu Âu, cuộc tranh luận xung quanh H200 cũng cung cấp một điểm tham chiếu về cách thức... Cân bằng giữa an ninh, khả năng cạnh tranh công nghiệp và khả năng tiếp cận công nghệ quan trọng.Mặc dù EU chưa đề xuất các hạn chế tương tự như của Washington, kinh nghiệm của Mỹ đóng vai trò là một thử nghiệm để đánh giá mức độ mà các biện pháp kiểm soát xuất khẩu có thể - hoặc không thể - cản trở sự phát triển của một đối thủ chiến lược mà không gây tổn hại quá mức cho chính các công ty đó.
Cuối cùng, những gì xảy ra với H200 sẽ là thước đo khả năng của Nvidia trong việc quản lý nhu cầu toàn cầu đang tăng vọt trong bối cảnh địa chính trị căng thẳng, và cũng là minh chứng cho cách thức mà Nvidia có thể làm được điều đó. Các quyết định của hai thủ đô, Washington và Bắc Kinh, có thể quyết định khả năng tiếp cận công nghệ điện toán tiên tiến. trên khắp các khu vực còn lại của hành tinh, bao gồm Tây Ban Nha và toàn bộ châu Âu.
Việc có khả năng gia tăng sản lượng H200, việc mở cửa xuất khẩu một phần sang Trung Quốc với mức thuế 25%, và những nghi ngờ của Bắc Kinh về cách bảo vệ các nhà sản xuất trong nước, đã vẽ nên một bức tranh như sau: Các chip của Nvidia đã trở thành một thành phần chiến lược. Xét cả về kinh tế và chính trị, chừng nào những căng thẳng trong chuỗi cung ứng và sự không chắc chắn về quy định vẫn chưa được giải quyết, H200O sẽ tiếp tục là một nguồn tài nguyên khan hiếm, và sự phân phối của nó sẽ quyết định tốc độ phát triển trí tuệ nhân tạo của các khu vực khác nhau trên thế giới.

