首页  >  案例  >  文章
2023-08-16 12:34

推荐最近3个开源AI项目:3D识别大语言模型,AI文本生成3D全景图,AI读懂视频唇语

3D识别大语言模型,能够基于3D世界模型回答问题,AI走向三次元。

项目地址:https://github.com/3d-vista/3D-VisTA


文字提示词+手绘草图,生成3D全景图,类似之前介绍过的Skybox(AI一键手绘3D全景),泰裤辣!

项目地址:https://huggingface.co/spaces/Intel/ldm3d/tree/main


能读懂唇语的AI多语言视听模型,支持9种语言,原始数据吸收自TED演讲录音,准确性相当高。

项目地址:https://github.com/facebookresearch/muavic


作者的公众号二维码丨扫一扫,关注我

关注我,不懂技术也可以学习AI。

资深大厂产品经理Glen,鹅厂、字节、华为工作经历。

让一部分人,看见AI并连接。

9

相关文章