中国科学院宁波材料技术与工程研究所

宁波材料所在基于多语言大模型的事件分析方面取得进展

发布:2025-01-06

点赞:

字号: 打印:

国际热点事件频繁爆发,针对热点事件的信息报道繁杂,导致信息分析的难度日益增加。传统的人工信息分析不仅耗时长、成本高,还难以应对多语言、多文化背景下的信息变化。大模型技术的出现和广泛使用,为信息分析人员在极短时间内深入分析与处理海量多语言数据、迅速掌握重要主题事件全貌提供了可能。因此,如何利用大模型技术在错综复杂的国际热点议题中生成高质量的专题分析报告,已成为信息分析领域亟待攻克的重要课题。

中国科学院宁波材料技术与工程研究所计算机视觉技术团队长期专注于大模型应用的前沿研究,团队围绕情报挖掘、深度分析到辅助决策的全链条研究,开发了多个具有实用价值的智能化解决方案。近期,团队提出了一种基于知识图谱驱动的多语言专题事件分析报告生成方法(“NimteRAG”大模型),有效攻克了传统情报分析方法在处理海量多语言数据时面临的语义关联复杂、上下文感知缺失以及泛化能力受限等难题。其核心关键技术包括:采用哈希增强图结构索引,将多语言文本映射为紧凑的哈希编码,以优化存储并加速检索与关联分析;设计双层次检索模式,灵活处理具体实体查询和抽象概念查询,生成层次清晰、连贯性强的报告;运用知识注入的增量学习方法,在保持模型通用知识的基础上,有效学习并融入专题事件特定知识,显著增强了模型的泛化性能。生成的报告内容全面深入,包括事件整体情况的详细梳理(涵盖事件演化流程、各子事件及关键拐点)、事件的综合分析(从多角度、多维度出发,兼顾不同立场进行深入分析)以及事件发展预测(基于推理预判,展望事件的未来走向)。

12月27日,在国防科技大学外国语学院承办的首届“智擎杯”信息分析处理大赛中,课题组成员张晓露、谷晓静、许根、王益杰凭借自主研发的“NimteRAG”大模型从全国124支参赛队伍中脱颖而出,在专题事件分析报告智能生成关键技术赛道上获得全国第五名。该项目获得了宁波市“科创甬江2035“关键技术突破计划(2024Z120)等的支持。

技术思路框架图

(机器人与智能制造装备技术实验室 张晓露)