LLaVa

LLaVa

获得高级语言和视觉理解的工具。

标签：AI训练模型

链接直达手机查看

LLaVA（大型语言和视觉助手）工具是一种创新的大型多模态模型，专为通用视觉和语言理解而设计。它将视觉编码器与大型语言模型 (LLM) Vicuna 相结合，并进行端到端训练。

LLaVA 展示了令人印象深刻的聊天功能，模仿了多模式 GPT-4 的性能，并在 Science QA 任务上设定了新的最先进的准确性。该工具的主要功能是能够使用纯语言 GPT-4 生成多模式语言图像指令跟踪数据。

LLaVA 是开源的，具有公开可用的数据、模型和代码。它针对视觉聊天应用程序和科学领域推理等任务进行了微调，在这两个领域都实现了高性能。

LLaVa

相关导航

在线运行开源机器学习模型

在浏览器中组装、配置和部署自主人工智能的开源项目

AI艺术生成社区和模型共享中心

开源的搭建机器学习模型UI界面的Python库

商量SenseChat

商汤科技推出的类ChatGPT的人工智能大语言模型

IBM推出的企业级生成式人工智能和机器学习平台