发布日期:2024-12-06 17:26 点击次数:107
新民晚报讯(记者 杨硕)12月6日,上海市东说念主工智能行业协会和上海金融业聚首汇集会髻布宇宙首个以金融业务才气为中枢的团体程序《金融大模子欺诈评测指南》,上海库帕想科技有限公司发布多维度金融大模子评测数据集(2024版)。
《金融大模子欺诈评测指南》,以金融业务为中枢,以金融机构模子欺诈为导向,从模子基础、金融安全与价值对皆、金融风险约束、金融专科见解、金融业务提拔拓展等5个维度185项缱绻条目,构建了金融范畴大模子的才气测评框架。模子基础才气方面,围绕模子基础显露和推演功能,指南界说了包括文分内类、信息抽取等在内的11项单模态、图文检索、视频问答等在内的6项多模态缱绻条目。金融安全与价值对皆才气方面,围绕模子的可靠性、可讲明性以及销毁保护,指南瞎想了内容合规、文化价值、伦理价值等在内的9项缱绻条目。金融风险约束才气方面,围绕模子在本体欺诈中的风险防护与约束,指南建议了利率风险、汇率风险、舆情风险等在内的19项缱绻条目。金融专科见解才气方面,围绕模子的金融基础常识和信息解读,指南归纳了管帐核算、财务报表编制与分析等在内的23项缱绻条目。金融业务提拔拓展才气方面,围绕银行、基金、保障、证券、信赖等5个范畴,指南索要了28项业务场景,包括存贷款业务、量化往来等在内的117项缱绻条目。《金融大模子欺诈评测指南》同步细化了干系的评测内容,给出了干系的评测形态与器用,并以附录的相貌给出了评测分级程序。
金融大模子评测数据集(2024版),以金融业务的视角,趋奉金融行业的实行,是金融范畴大模子欺诈收效评测的伏击握手。评测数据集比照最高水平、最佳程序,具有范畴大、结构优、价值对皆等特色,恰当金融范畴对常识鲜嫩度、万般性和高密度的全体条目。金融机构比照《金融大模子欺诈评测指南》才气测评框架,共瞎想评测数据44000余句对。聚焦“模子基础才气”,围绕诡计才气、逻辑推理等6个维度,瞎想评测数据22000余句对。聚焦“金融安全与价值对皆才气”,围绕信息内容、社会次序等13个维度,瞎想评测数据2000余句对。聚焦“金融风险约束才气”,围绕合规、市集、操作等5类金融风险,瞎想评测数据1000余句对。聚焦“金融业务提拔拓展才气”,围绕舆情分析、智能投研等3项业务场景,瞎想评测数据12000余句对。聚焦“金融专科见解才气”,围绕金融专科常识、IPO图表等6种常识类型,瞎想评测数据7000余句对。后续,金融评测数据集将如期更新,样例集已在Open Data Lab和怒放原子社区发布。
《金融大模子欺诈评测指南》和金融大模子评测数据集的发布是深入金融垂类欺诈,范例和带领金融范畴用好模子的伏击里程碑。干系评测推崇也将在近期发布。