XPENG X-World: світова модель для автопілота VLA 2.0 вже у виробництві

Авто | 30.04.2026 12:31

XPENG X-World: світова модель для автопілота VLA 2.0 вже у …
XPENG X-World: світова модель для автопілота VLA 2.0 вже у …

Китайська компанія XPENG опублікувала технічний звіт про генеративну модель X-World, яка забезпечує розробку та верифікацію системи автономного водіння VLA 2.0. Кількість симуляційних сценаріїв зросла з 30 000 до понад 500 000 за рік, а щоденний віртуальний пробіг сягає 30 млн км.

Китайський виробник електромобілів XPENG (NYSE: XPEV, HKEX: 9868) офіційно оприлюднив технічний звіт про генеративну модель X-World — ключовий інструмент для розробки та валідації системи автономного водінняVLA 2.0. Документ детально описує архітектуру, процес навчання, методи верифікації та практичне застосування моделі у виробничих процесах компанії.

Традиційні підходи до симуляції автономного водіння базуються на технології3D Gaussian Splatting (3DGS), яка добре відтворює вже зібрані сцени, проте погано справляється з нестандартними маневрами — різкою зміною смуги чи об’їздом перешкоди. Через це галузь досі значною мірою залежить від дорогих і важко відтворюваних тестів на реальних дорогах. X-World покликана вирішити цю проблему: отримуючи відеопотоки з кількох камер та задані команди керування, модель генерує відповідні майбутні відеопотоки з усіх ракурсів, фактично «уявляючи» зміни дорожньої ситуації на кілька секунд наперед.

В основі X-World лежить провідна модель генерації відеоWAN 2.2із застосуванням латентного простору через поєднання відео-VAE та DiT-денойзера. Нижній рівень використовує тривимірний причинний автоенкодер із високим коефіцієнтом стиснення, що суттєво знижує обчислювальне навантаження та підтримує моделювання довгих відеопослідовностей. Основа мережі — кастомізована DiT-архітектура з механізмом спільної уваги по часовому та ракурсному вимірах, що забезпечує узгодженість між сімома камерами.

Команда XPENG виділяє три головні сильні сторони X-World:крос-ракурсна 3D-узгодженістьміж усіма сімома камерами,точне виконання команд— згенеровані сцени точно відповідають заданій поведінці автомобіля, тадовгострокова симуляція— стабільне прогнозування на тривалих часових горизонтах. Саме ці властивості наближають генеративні моделі до практичного «симулятора реального світу».

На базі X-World XPENG розробила замкнутий рушій оцінювання для VLA 2.0, який дозволяє вимірювати показники зіткнень, прогрес досягнення мети та комфорт їзди у віртуальному середовищі, максимально наближеному до реального.Детальніше про автомобілі XPENG на autoporady.com. Крім того, X-World слугує платформою для онлайн-навчання з підкріпленням — компанія може цілеспрямовано відпрацьовувати складні сценарії: раптовий вихід пішохода на перехресті чи нерішуча зміна смуги у заторі.

Як генеративна фабрика даних, X-World здатна створювати відсутні дані для рідкісних сценаріїв та генерувати дані для зарубіжних ринків, прискорюючи глобальне розгортання автопілота XPENG.VLA 2.0, за даними компанії, підвищує ефективність водіння на23%, а кількість різких гальмувань скоротилася на 99% порівняно з попереднім поколінням.

VLA 2.0 — це система автономного водіння рівня L4, яка об’єднує сприйняття, розмірковування та дії в єдиній AI-моделі без проміжних перекладів між модулями. Система відмовилася від лідару на користь суто візійного підходу з радаром як резервом. Volkswagen став першим великим західним виробником, який ліцензував цю китайську розробку, що свідчить про серйозний технологічний рівень платформи.

Практичні поради для тих, хто розглядає автомобілі з VLA 2.0:

Джерела

XPENG X-World: світова модель для автопілота VLA 2.0 вже у виробництві — (Автопоради)

Всі новини: Авто