【网易科技10月17日报道】近期,智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型,同样可以回答各种类型的视觉问题,可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。
记者获悉,在多模态权威学术榜单上,目前CogVLM-17B是综合成绩第一的模型,在14个数据集中的10项权威跨模态基准上取得了SOTA性能,其余4项取得了第二名的成绩。据悉,智谱AI还将于10月27日发布全新一代大模型产品。(定西)
【网易科技10月17日报道】近期,智谱AI和清华KEG合作研发并开源了名为CogVLM-17B的多模态大模型,同样可以回答各种类型的视觉问题,可以在不牺牲任何 NLP 任务性能的情况下,实现视觉语言特征的深度融合。
记者获悉,在多模态权威学术榜单上,目前CogVLM-17B是综合成绩第一的模型,在14个数据集中的10项权威跨模态基准上取得了SOTA性能,其余4项取得了第二名的成绩。据悉,智谱AI还将于10月27日发布全新一代大模型产品。(定西)