2026 年 4 月 12 日 星期日
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 黄金

奇富科技发布首个信贷多模态评测基准,可全面评估信贷 AI 模型实战能力

2026 年 1 月 8 日
在 黄金
阅读时间: 1 min read
阅读:660
A A

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

广告

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

Related articles

国内黄金价格实时行情 (2026 年 4 月 8 日)

2026 年 4 月 12 日

最新美黄金期货实时行情查询 (2026 年 4 月 8 日)

2026 年 4 月 12 日

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

广告

【TechWeb】1 月 8 日消息,近日,奇富科技联合复旦大学与华南理工大学研究人员共同发布首个面向信贷场景的多模态评测基准 FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。该基准基于真实信贷业务场景,抽象科学问题,设计多模态评估任务与挑战,以期构建来源于业务、服务于业务的实用性评测体系,推动信贷 AI 的学术研究与应用落地。同时,奇富科技宣布开源数据集与评测工具,为行业共建 AI 基础设施提供关键支撑。

据介绍,FCMBench 不仅是当前金融信贷领域样本量最大、最符合真实应用场景的多模态大模型评测基准,更创新推出"感知-推理-鲁棒性"三维评测体系,全面评估信贷 AI 模型的实战能力。

与传统侧重单一识别或理解能力的评测不同,FCMBench 所评测出的模型能力,能够直接对应小微企业授信过程中对多证件识别、信息一致性校验与风险线索发现等核心环节,为模型是否具备实际可用性提供清晰、可量化的参考依据。

该基准旨在提供一个标准的评测平台,以促进学术界和产业界之间的协作发展,推动 AI 更好地赋能信贷场景。一方面,金融机构不再缺乏公平比较信贷领域 AI 模型能力的标准;另一方面,学术界和金融科技公司的研究人员能够对信贷领域的关键难题开展深入研究。这打破了行业内数据和领域知识壁垒,推动信贷人工智能从 「单点优化」 迈向 「产学研协同创新」。

奇富科技多模态负责人杨叶辉博士介绍:"金融信贷审核涉及几十类证件、每类证件有多种模版、审核流程涉及多个环节和任务、以及多证件的交叉推理验证,用户拍摄的场景和上传的文件也多种多样。信贷场景的这些挑战对于多模态大模型的能力也是非常好的试金石。FCMBench-V1.0 只是一个开始,我们会持续完善这个评测基准,希望打磨好一把公平、公正,面向实战需求的尺子:如果你的模型在 FCMBench 上取得了好成绩,理论上就可以面向实际落地,而不仅仅是满足了实验室指标。"

FCMBench-V1.0 构建了与真实银行审核流程高度一致的评测框架,涵盖 18 类核心信贷证件,如身份证、收入证明、银行流水、房产证等,包含 4043 张合规图像和 8446 个测试样本,问题覆盖信贷审核全链条。

其创新的"感知-推理-鲁棒性"三维评测体系,对金融信贷 AI 模型所需的实战核心能力提出了全面的考核。

通过对 23 个主流多模态模型 (来自 14 家顶尖 AI 企业及科研机构) 的全面评测,FCMBench 展现出强大的鉴别能力。结果显示, Google DeepMind 的 Gemini 3 Pro(64.61) 位列商业模型榜首,阿里巴巴 Qwen3-VL-235B(57.27) 成为最佳的开源基模。而奇富科技自研的信贷垂类多模态大模型 Qfin-VL-Instruct 以 64.92 的 F1 分数斩获综合第一,该模型基于奇富实际业务场景进行研发,彰显了垂类领域定制化训练的优势,该模型的试用接口已向公众开放。

目前,FCMBench 的数据集、评测工具以及 Qfin-VL-Instruct 的试用接口已开放获取,相关细节已在学术论文中全面披露。奇富科技表示,将持续携手产学研伙伴,推动金融 AI 技术的标准化与规范化发展,助力金融机构数智化转型与小微企业融资服务能力的持续提升。

技术报告链接:https://arxiv.org/abs/2601.00150

相关 文章

国内黄金价格实时行情 (2026 年 4 月 8 日)

来自 周天财经
2026 年 4 月 12 日
0

今日国内黄金价格实时行情 (2026 年 4 月...

最新美黄金期货实时行情查询 (2026 年 4 月 8 日)

来自 周天财经
2026 年 4 月 12 日
0

最新美黄金期货价格实时行情查询 (2026...

今日建行纸黄金价格走势图最新查询 (2026 年 4 月 8 日)

来自 周天财经
2026 年 4 月 12 日
0

今日建行纸黄金价格走势图最新查询 (202...

今日工行纸黄金价格走势图最新查询 (2026 年 4 月 8 日)

来自 周天财经
2026 年 4 月 12 日
0

今日工行纸黄金价格走势图最新查询 (202...

今日纸黄金价格走势图最新查询 (2026 年 4 月 8 日)

来自 周天财经
2026 年 4 月 11 日
0

纸黄金多少钱一克_今日纸黄金价格走势图最...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2
美国消费者信心暴跌至历史新低 通胀预期急剧升温

美国消费者信心暴跌至历史新低 通胀预期急剧升温

2026 年 4 月 12 日

国家网信办等五部门联合公布 《人工智能拟人化互动服务管理暂行办法》

2026 年 4 月 12 日
AI打榜,打的是什么?

AI 打榜,打的是什么?

2026 年 4 月 12 日
【科股一线拆解】美国最新宣布,将征收100% 关税!

管理提升的 AI 化

2026 年 4 月 12 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录