Audio - a Ryukijano Collection

Ryukijano 's Collections

Vision_transformer_robotics

VILA

Diffusion models

Neural Rendering

Deep Reinforcement Learning

LLMs

Computer vision

Audio

Multi modal foundational models

Text_to_video diffusion

Vision_language_models

Text-3D

2D->3D

Audio

updated Nov 13, 2024

EVA-GAN: Enhanced Various Audio Generation via Scalable Generative Adversarial Networks

Paper • 2402.00892 • Published Jan 31, 2024 • 14
Running on Zero

269

269

MusicGen Streaming

🔥

Generate music from text prompts
Runtime error

145

145

Whisper JAX

👀

Transcribe or translate audio from microphone, file, or YouTube
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning

Paper • 2406.03344 • Published Jun 5, 2024 • 21
gpt-omni/mini-omni

Text-to-Speech • Updated Sep 4, 2024 • 1 • 427
nyuuzyou/suno

Preview • Updated Nov 20, 2024 • 353 • 59
Running on Zero

98

98

Giant Music Transformer

🦖

Fast multi-instrumental music transformer