本仓库为多模态大模型面试相关概念,由本人参考网络资源整理,欢迎阅读,如果对你有用,麻烦点一下 🌟 star
,谢谢!
其他学习资源推荐:
- tiny-diffusion: 实现一个简单 diffusion 扩散过程,包括:vae encoder、latent space、condition、denoise、vae decoder
- tiny-dit: 实现一个简单的 flux 架构模型,支持多种 control 模块
- llm-diffusion: 利用 llm 增加对 text embedding 的语义提取,增加 prompt 的控制效果。
在线阅读链接:mllm_interview_notes
相关答案为自己整理,若有不合理地方,请指出修正,谢谢!
欢迎关注加入知识星球,会不定期更新 AIGC 相关知识,以及一些面试、业务落地经验: