沪粤联合研发金融知识大模型在自己擅长的金融知识领域超越了GPT4等

最新信息

2024-01-17 15:56:00

人工智能尤其是AI大模型技术如何在金融垂直领域应用落地？日前，上海交通大学上海高级金融学院（SAIF）与粤港澳大湾区数字经济研究院（IDEA）联合研发出“金融知识大模型”，并发布“金融试题解析”“金融分析计算”和“金融事件分析”三大功能。仅就其金融知识库而言，就囊括了超过20万篇研报、3000万篇新闻资讯。
　　最新测试结果表明，金融知识大模型的“垂类”性能突出。不仅在主流金融测试集FinEval上全面超越了现有的主流大模型，而且在金融领域的重要考试方面成绩喜人——譬如，在注册会计师全国统考CPA考试中，全面超越现有的主流大模型，包括GPT3.5和GPT4；在国际通行的金融投资从业者专业资格认证CFA考试中，则全面超越了主流的中文大模型，在大部分科目上跟GPT4互有胜负。
　　此次“模拟考”在现场演示了3个场景。第一个场景是求解注册会计师考试CPA例题。CPA题目相对简短，金融知识大模型就定位题干关键词对应的知识点，还针对知识点检索做了特定优化。第二个场景是解答较为复杂的CFA二级分析计算题。金融知识大模型的求解过程，经过OCR图表识别和STEM剪枝过程，以便精简题干。
　　第三个场景更具时效性，即针对“2023年中央金融工作会议”的公报内容作深层次的信息检索和归纳整理。由此，金融知识大模型构建了以“2023中央金融工作会议”为问题主体的思维导图，并生成了与其相关的子问题。通过意图识别选取相关的子节点，对金融知识库、资讯库进行信息检索，实现最终内容生成。
　　粤港澳大湾区数字经济研究院数字金融首席科学家林舟驰表示，“金融知识大模型”面向金融教育、金融咨询与金融分析这3个主要场景，以金融知识检索、知识问答、信息抽取、意图识别、代码智能和工具调用等能力为支撑。从CPA到CFA的金融试题解析方面，大模型通过题干关键词进行背景知识搜索、相关案例搜索和相关例题搜索，能够根据需要解答问题、对答案进行分析或答疑。
　　林舟驰博士解读认为，其背后以金融知识库+大语言模型为底座，取代了传统的单一语言模型底座架构，再搭配金融、教育、咨询场景的高质量语料进行模型预训练，形成了思维图谱推理技术。这种思维图谱推理技术，能在某种程度上把大模型的推理过程白盒化，通过知识的归纳整理，形成思维图谱，逐点逐层解决一个现实中的金融问题。
　　值得一提的是，当推理过程不再是“黑盒”，CPA、CFA考试的两个场景中，会计及金融专业学生也可以以交互式学习方式，获得答案的解析以及针对题干内容的答疑，革新了传统的人机教培方式。
　　在知识+模型的底座基础上，沪粤研发团队还开发了一系列面向现实场景的工具接口，例如金融信息抽取，可在海量研究报告与新闻材料中抽取有价值的金融常识、金融主体和关系信息，以及金融事件各类观点等等。这些金融信息都被AI解析，并被吸收成为金融知识库的一部分，服务于各类顶层任务。
　　目前，这款大模型采用了来自金融教科书、企业财报、企业研报、新闻舆情、法律案例和政府报告等超过160G的高质量金融文本进行增量预训练，还通过30多万条衍生于金融公式、金融试题、金融代码、金融问答、金融表格和金融知识图谱等的高质量指令数据进行有监督微调，有力保证了大模型最终输出内容的可靠性和可控性。
　　据悉，目前金融知识大模型还未对外开放，其未来计划的第一阶段，主要以上海高级金融学院的业务场景为落点，在业务中“跑”起来并不断迭代，逐渐在更大范围落地。
（文章来源：上观新闻）

免责申明： 本站部分内容转载自国内知名媒体，如有侵权请联系客服删除。

沪粤联合研发金融知识大模型 在自己擅长的金融知识领域超越了GPT4等

最新信息

沪粤联合研发金融知识大模型 在自己擅长的金融知识领域超越了GPT4等

沪粤联合研发金融知识大模型在自己擅长的金融知识领域超越了GPT4等

沪粤联合研发金融知识大模型在自己擅长的金融知识领域超越了GPT4等