VILA - a Ryukijano Collection

Ryukijano 's Collections

Vision_transformer_robotics

VILA

Diffusion models

Neural Rendering

Deep Reinforcement Learning

LLMs

Computer vision

Audio

Multi modal foundational models

Text_to_video diffusion

Vision_language_models

Text-3D

2D->3D

VILA

updated Dec 7, 2024

Efficient-Large-Model/VILA1.5-3b

Text Generation • Updated Jul 18, 2024 • 18.4k • 27