推荐最近3个开源AI项目:3D识别大语言模型,AI文本生成3D全景图,AI读懂视频唇语
3D识别大语言模型,能够基于3D世界模型回答问题,AI走向三次元。
项目地址:https://github.com/3d-vista/3D-VisTA
文字提示词+手绘草图,生成3D全景图,类似之前介绍过的Skybox(AI一键手绘3D全景),泰裤辣!
项目地址:https://huggingface.co/spaces/Intel/ldm3d/tree/main
能读懂唇语的AI多语言视听模型,支持9种语言,原始数据吸收自TED演讲录音,准确性相当高。
项目地址:https://github.com/facebookresearch/muavic
作者的公众号二维码丨扫一扫,关注我
关注我,不懂技术也可以学习AI。
资深大厂产品经理Glen,鹅厂、字节、华为工作经历。
让一部分人,看见AI并连接。
近期文章
更多