通過百億參數(shù)級基礎模型與強化學習驅動的世界模型,打造多模態(tài)智能駕駛大模型(Motovis大模型)。該技術兼具泛化能力與場景適應能力,支持跨模態(tài)數(shù)據(jù)交互與智能決策,可靈活部署于嵌入式平臺,構建高度擬人化的駕駛智能體,提升智能駕駛系統(tǒng)的安全性與智能化水平。
MOTOVIS VLA基礎大模型框架,是認知模型的基礎,是以視覺編碼器,視覺語言模型,動作策略模型為基礎,以世界模型為強化學習環(huán)境,以4D數(shù)據(jù)集,VQA數(shù)據(jù)集,法規(guī)數(shù)據(jù)集,物理交互數(shù)據(jù)集作Fine Tune。