您的当前位置:首页 > 百科 > 【rajdhani day satta matka】智谱 AI 开源视频理解模型 CogVLM2 正文
时间:2024-09-20 23:37:24 来源:网络整理 编辑:百科
感谢IT之家网友 USER 的线索投递!IT之家 7 月 12 日消息,智谱 AI 宣布,训练了一种新的视频理解模型 CogVLM2-Video,并将其开源。据介绍,当前大多数的视频理解模型使用帧平均 rajdhani day satta matka
感谢IT之家网友 USER 的智谱线索投递!
IT之家 7 月 12 日消息,开源智谱 AI 宣布,视频rajdhani day satta matka训练了一种新的理解视频理解模型 CogVLM2-Video,并将其开源。模型
据介绍,智谱当前大多数的开源视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的视频丢失,无法准确回答与时间相关的理解问题。一些专注于时间问答数据集的模型rajdhani day satta matka模型过于局限于特定格式和适用领域,使得模型失去了更广泛的智谱问答能力。
▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的开源自动时间定位数据构建方法,生成了 3 万条与时间相关的视频视频问答数据。基于这个新数据集和现有的理解开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,模型训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
IT之家附相关链接:
代码:https://github.com/THUDM/CogVLM2
项目网站:https://cogvlm2-video.github.io
在线试用:http://36.103.203.44:7868/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
In pics: Chinese exhibitors at IFA Berlin 20242024-09-20 23:32
脉脉高聘:面对薪资福利减少,44%职场人自动缩短工时2024-09-20 23:28
微博发布Q2公益简报:微博力量引领公益传播与社会正能量2024-09-20 23:11
崇德科技(301548.SZ):产品暂未应用到城市自动驾驶方面2024-09-20 23:06
中国功夫,到非洲了!2024-09-20 23:02
中国工程院院士童小华:未来深空探测领域将会有极大发展2024-09-20 22:33
中国工程院院士钱旭红:微电子工业是最具代表性的未来产业2024-09-20 22:32
3分钟看懂iQOO Neo9S Pro+ 强大无需多言2024-09-20 22:32
Across China: Historic buildings revitalized with new business, tourism functions2024-09-20 22:21
中俄两军举行海上联演2024-09-20 22:13
Original Lobster Festival held in U.S.2024-09-20 23:30
无人水面舰艇快速发展2024-09-20 23:00
智界S7推送最新OTA:八大升级 新增红绿灯倒计时2024-09-20 22:44
美军试图重新锚定加沙临时码头 但未成功2024-09-20 22:19
60FlyOverChina2024-09-20 22:15
比亚迪第500万辆新能源车下线:王传福回顾创业“差点走不下去”2024-09-20 22:12
拜登再现口误 将副总统哈里斯说成特朗普2024-09-20 22:11
分众传媒一度跌近7%,回应美团进军电梯广告2024-09-20 21:51
为什么我们爱看喜剧类综艺2024-09-20 21:35
三千档唯一超声波指纹双芯旗舰,iQOO Neo9S Pro+ 重磅发布2024-09-20 20:56