您现在的位置是:首页 > 综合热门 > 科技信息 > 正文
淘天集团革新多模态对齐技术,有效缓解视觉大模型幻觉难题
发布时间:2025-01-20 22:52:55来源:
导读 视觉大模型在图像理解和跨模态任务中表现出色,但“幻觉现象”问题日益凸显。为此,淘天集团未来生活实验室团队提出“令牌偏好优化”(TPO
视觉大模型在图像理解和跨模态任务中表现出色,但“幻觉现象”问题日益凸显。
为此,淘天集团未来生活实验室团队提出“令牌偏好优化”(TPO)新方法,通过自动化的令牌级奖励信号,自动识别偏好数据中的视觉锚定令牌,优化模型对视觉信息的依赖性,减轻幻觉现象。
研究表明,采用TPO的模型在多个评测基准中显著优于传统方法,答案更依赖图像信息。
此外,消融实验发现优化的加噪步骤和奖励分配策略能进一步提升性能。
这一创新成果为多模态对齐技术提供新思路,推动AI技术在生活和消费领域的应用。
标签:
猜你喜欢
- 三星三折叠屏手机震撼亮相:Z形折叠挑战华为Mate XT
- TikTok:成功穿越阴霾,迎接新生
- 三星Galaxy S25 Slim影像配置大揭秘:2亿像素HP5主摄震撼来袭
- 特斯拉股价有望年内飙升近两成!美知名投行力荐:专注FSD新技术是关键
- 揭秘华为手机消费群体:25-45岁为主力军,富豪偏爱三折叠机型
- 微软与OpenAI调整合作框架,允许OpenAI接入多元计算资源
- 非主流AI口音纠正App爆红,单月流水突破百万美金大关
- 5000亿美元巨资!特朗普宣布史上最大AI投资计划,孙正义出任星门计划董事长
- 美国对TikTok禁令实施75天缓冲期:官方呼吁理性客观审视
- 12306官方揭秘:抢票加速包实为营销噱头,携程、去哪儿等平台客服各有说辞