【人工智能】开源多模态模型MiniGPT-4发布 | 提前感受GPT-4的识图能力 | 基于Vicuna构建的LLM | 能够生成图片描述 | 根据手写文本指令构建网站

Name: 【人工智能】开源多模态模型MiniGPT-4发布 | 提前感受GPT-4的识图能力 | 基于Vicuna构建的LLM | 能够生成图片描述 | 根据手写文本指令构建网站 - PinQueue
Uploaded: 2023-04-18T19:11:59+0800
Duration: 6 min 46 s
Channel: 最佳拍档

1 年前

（基於 PinQueue 指標）

最佳拍档

最新多模态模型MiniGPT-4 开源：它使用先进的大型语言模型 (LLM)--Vicuna（其中 Vicuna 是基于 LLaMA 构建的）进行调优，在文本语言方面可以达到 ChatGPT 能力的90%。在视觉感知方面，作者采用了与BLIP-2相同的预训练视觉组件，其中该组件由EVA-CLIP的ViT-G/14和Q-Former组成。MiniGPT-4 只添加了一个映射层，将编码的视觉特征与Vicuna语言模型对齐，冻结了所有视觉和语言组件参数。

#minigpt4 #gpt4 #openai #chatgpt

今年夏季，絕不能錯過名勝壹號世界郵輪重回基隆啟航！多種優惠方案讓您輕鬆預訂心儀的日本沖繩郵輪行程，同時省下大筆開支！

0 則留言