Công ty AI có trụ sở tại Stanford phát hành mô hình thế giới 3D “Đá cẩm thạch”
(Hoa Kỳ)
Từ San Francisco
25/11/2025
World Labs, một công ty khởi nghiệp do Tiến sĩ Feifei Li, nhà nghiên cứu trí tuệ nhân tạo (AI) tại Đại học Stanford ở Hoa Kỳ, dẫn đầu, đã ra mắt công chúng mô hình thế giới thương mại đầu tiên (Note 1) tạo ra không gian 3D, được gọi là Marble, vào ngày 12 tháng 11 Đá cẩm thạch tạo ra không gian 3D có thể chỉnh sửa từ văn bản, hình ảnh, video và đầu vào bố cục 3D và có thể xuất nó ở dạng phân tán Gaussian (Lưu ý 2) hoặc định dạng lưới (Lưu ý 3)
Trong một cuộc phỏng vấn với tạp chí công nghệ The Verge, Tiến sĩ Lee nói: ``Mô hình toàn cầu lớn hơn và thú vị hơn mô hình truyền thống'' Ben Mildenhall, đồng sáng lập công ty, cho biết: "Đây là một sự thay đổi mang tính cách mạng trong sản xuất 3D, vốn theo truyền thống đòi hỏi các nhóm lớn và phần mềm phức tạp" (The Verge, ngày 13 tháng 11)
Marble, được phát hành chính thức sau phiên bản beta giới hạn trong hai tháng, có cấu trúc giá bốn bậc, từ miễn phí đến $95 mỗi tháng Nó có nhiều chức năng chỉnh sửa khác nhau, bao gồm khả năng phản ánh các kiểu trong bản phác thảo cấu trúc 3D, khả năng mở rộng một phần không gian 3D và khả năng tích hợp nhiều không gian 3D, mở rộng đáng kể tính đa phương thức
Đối với mô hình thế giới, Google DeepMind đã phát hành ``Jenny 3'', một mô hình thế giới tạo ra môi trường tương tác trong thời gian thực chỉ bằng một lời nhắc văn bản Các công ty khác hiện đang phát hành các mô hình thế giới trực tiếp tạo ra không gian 3D bao gồm World Labs và NVIDIA NVIDIA đã công bố nền tảng Cosmos cho AI vật lý (Note 4) Đây là mô hình đẳng cấp thế giới có thể tạo ra nhiều môi trường 3D khác nhau từ các đầu vào như văn bản, hình ảnh và video, đồng thời có thể thể hiện hành vi vật lý, đồng thời cung cấp mô phỏng cho chế tạo robot và lái xe tự động, tạo dữ liệu tổng hợp, vv cho ngành công nghiệp
WorldLabs đã huy động được 230 triệu USD vào năm 2024, do Andreessen Horowitz và những người khác dẫn đầu AMD Ventures, Intel Capital và NVIDIA N Ventures cũng đầu tư vào khoản đầu tư này Tiến sĩ Lee chỉ ra rằng mặc dù AI hiện đại có khả năng đọc hiểu, tạo văn bản, nghiên cứu và phân tích dữ liệu rất xuất sắc, nhưng nó có những hạn chế trong việc thể hiện và tương tác với thế giới vật chất, đồng thời nhấn mạnh rằng “trí thông minh không gian”, vốn hiểu toàn diện về các mối quan hệ và ý nghĩa không gian, là điều cần thiết Các mô hình tạo không gian 3D này dự kiến sẽ được sử dụng trong AR/VR (Note 5), máy ảnh, xử lý hình ảnh, tự động hóa nhà máy, robot, bản sao kỹ thuật số, vv
(Lưu ý 1) Bắt nguồn từ một bài báo có tên "Mô hình thế giới" do Google Brain xuất bản năm 2018 AI tìm hiểu cấu trúc của môi trường, các quy luật vật lý và mối quan hệ nhân quả từ dữ liệu quan sát và thực hiện mô phỏng trong thế giới thực
(Lưu ý 2) Một phương pháp biểu diễn không gian 3D dưới dạng một số lượng lớn các điểm tuân theo phân bố Gaussian Nhẹ và có khả năng vẽ độ nét cao Nó yêu cầu tải tính toán ít hơn so với đa giác (bề mặt) thông thường và phù hợp để hiển thị thời gian thực
(Lưu ý 3) Phương pháp biểu thị không gian 3D dưới dạng tập hợp các đỉnh, cạnh và mặt Định dạng chuẩn cho 3D CAD, trò chơi, sản xuất CG, vv
(Lưu ý 4) Công nghệ AI sử dụng camera, cảm biến, vv để thu thập và xử lý thông tin từ thế giới thực và có thể hoạt động tự động
(Lưu ý 5) AR là thực tế tăng cường hiển thị thông tin kỹ thuật số được xếp chồng lên hình ảnh của thế giới thực và VR là thực tế ảo giúp bạn đắm chìm trong một không gian ảo hoàn toàn kỹ thuật số
(Miki Matsui)
(Hoa Kỳ)
Tóm lược kinh doanh 9eccd68d481e9cbb



Đóng
