BingliangLi

CUHK(SZ)

Pinned Repositories

A-Renpy-Game-The-Only-Easy-Day-Was-Yesterday
This is a game build by Renpy.
Language:Ren'Py0 2 00
audiocaps-download
This package aims at simplifying the download of the AudioCaps dataset.
Language:Python0 0 00
AudioLDM2
Text-to-Audio/Music Generation
Language:Python0 0 00
audioset-download
This package aims at simplifying the download of the AudioSet dataset.
Language:Python0 0 00
ER-NeRF
[ICCV'23] Efficient Region-Aware Neural Radiance Fields for High-Fidelity Talking Portrait Synthesis
Language:Python2 0 00
HSIC-regularized-Kernel-Ridge-Regression
Language:Python3 2 00
stable-audio-metrics
Metrics for evaluating music and audio generative models – with a focus on long-form, full-band, and stereo generations.
Language:Python1 0 00
Stock-Price-Prediction-Based-on-MF-DFA-Facebook-Prophet
《基于多重分形谱的股价指数特征提取及预测》一文中的代码
Language:Jupyter Notebook4 2 10
Vision-Transformer-based-Short-range-behavior-recognition-using-Radar-Signals
Language:Jupyter Notebook1 2 00
wav2lip_vq
wav2lip in a Vector Quantized (VQ) space
Language:Python1 0 00

BingliangLi's Repositories

BingliangLi/stable-audio-metrics
Metrics for evaluating music and audio generative models – with a focus on long-form, full-band, and stereo generations.
Language:Python1 0 00
BingliangLi/audiocaps-download
This package aims at simplifying the download of the AudioCaps dataset.
Language:Python0 0 00
BingliangLi/AudioLDM2
Text-to-Audio/Music Generation
Language:Python0 0 00
BingliangLi/controlled-motion-latent-diffusion
Language:Python0 1 00
BingliangLi/CUHKSZ-Radiance
0 1 00
BingliangLi/chain-of-table
Code for paper Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding
BingliangLi/CoCap
[ICCV 2023] Accurate and Fast Compressed Video Captioning
Language:Python0 0
BingliangLi/DeepEdit_old
Repository for our paper "DeepEdit: Knowledge Editing as Decoding with Constraints". https://arxiv.org/abs/2401.10471
Language:Jupyter Notebook0 0
BingliangLi/detr
End-to-End Object Detection with Transformers
Language:Python0 0
BingliangLi/Diff-Foley
Diff-Foley: Synchronized Video-to-Audio Synthesis with Latent Diffusion Models
Language:Python
BingliangLi/DWPose
"Effective Whole-body Pose Estimation with Two-stages Distillation" (ICCV 2023, CV4Metaverse Workshop)
Language:Python0 0
BingliangLi/EDGE
Official PyTorch Implementation of EDGE (CVPR 2023)
Language:Python0 0
BingliangLi/Grounded-SAM-2
Grounded SAM 2: Ground and Track Anything in Videos with Grounding DINO, Florence-2 and SAM 2
Language:Jupyter Notebook
BingliangLi/guided-motion-diffusion
Language:Python0 0
BingliangLi/hoi-prediction-gaze-transformer
Language:Python0 0
BingliangLi/HumanML3D
HumanML3D: A large and diverse 3d human motion-language dataset.
Language:Python0 0
BingliangLi/image-background-remove-tool
✂️ Automated high-quality background removal framework for an image using neural networks. ✂️
Language:Python
BingliangLi/LanguageBind
【ICLR 2024🔥】 Extending Video-Language Pretraining to N-modality by Language-based Semantic Alignment
Language:Python0 0
BingliangLi/MP-HOI.github.io
Language:JavaScript0 0
BingliangLi/OLAPH-old
OLAPH: Improving Factuality in Biomedical Long-form Question Answering
Language:Python
BingliangLi/OmniControl
OmniControl: Control Any Joint at Any Time for Human Motion Generation, arXiv 2023
Language:Python0 0
BingliangLi/OneTrainer
OneTrainer is a one-stop solution for all your stable diffusion training needs.
Language:Python0 0
BingliangLi/pcpnet
Pytorch implementation of PCPNet
Language:Python0 0
BingliangLi/ProTrix_unofficial
Code for ProTrix: Building Models for Planning and Reasoning over Tables with Sentence Context
Language:Python
BingliangLi/pyramid-discrete-diffusion
Official implementation of paper "Pyramid Diffusion for Fine 3D Large Scene Generation" (ECCV 2024 Oral)
Language:Python
BingliangLi/R2-Talker-code
R2-Talker: Realistic Real-Time Talking Head Synthesis with Hash Grid Landmarks Encoding and Progressive Multilayer Conditioning
Language:Python0 0
BingliangLi/sd-scripts
Language:Python0 0
BingliangLi/Seeing-and-Hearing
[CVPR 2024] Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
Language:Python
BingliangLi/SpecVQGAN
Source code for "Taming Visually Guided Sound Generation" (Oral at the BMVC 2021)
Language:Jupyter Notebook
BingliangLi/videocomposer
Official repo for VideoComposer: Compositional Video Synthesis with Motion Controllability
Language:Python0 0