findalexli/mllm-dpo

[ACL 2024] Multi-modal preference alignment remedies regression of visual instruction tuning on language model

Jupyter Notebook

Readme
3Issues
33Stargazers
1Watcher

Watchers

findalexli
@reka-ai

Contact site admin: geeksiteservice@gmail.com.