您所在位置: 首页 > 学术信息 > 学术动态 > 正文

学术动态

学术讲座——浙财数量经济研究中心Seminar 53
时间:2025-04-21来源: 作者:点击数:

主题:大语言模型评测


摘要:近年来,大语言模型的快速发展标志着人工智能领域的重大突破,它在自然语言处理、图像理解与生成等多模态任务中表现出色,揭示了强大的泛化能力和应用潜力。这些模型的评测对于了解其性能边界、优化实际应用场景以及推动未来研究具有重要意义。本报告将首先概述大语言模型的发展情况和评测的重要作用,随后重点介绍目前大语言模型的评测体系,包括评测任务、评测数据集与基准以及评测方法。接下来,报告将详述香港大学针对大语言模型图像理解能力和生成能力的评测体系,其中涵盖了具体的评测任务、方法、标准和具体结果,分析模型在专业能力、安全与责任等方面的表现,弥补现有大语言模型评测的不足。最后,报告将基于评测结果对大语言模型的发展方向和可能的技术突破进行展望,为未来的多模态人工智能乃至通用人工智能研究提供思路和借鉴。本报告旨在为相关学术领域与应用场景的研究者和使用者提供参考,同时促进大语言模型技术在社会中的广泛落地。


报告时间:2025年4月24日,下午3:00        

线下地点:浙江财经大学4号学院楼,二楼玻璃会议室

主办单位:浙江财经大学数量经济研究中心、浙江财经大学经济学院

协办单位:《财经论丛》编辑部


嘉宾介绍:

余捷博士是宁波诺丁汉大学商学院国际交流与合作副院长,信息系统学副教授。自2010年加入宁诺以来,余老师承担了信息系统领域的教学,开发了商务编程和数据科学导论两门新课,其中数据科学导论还获得了浙江省一流本科课程的荣誉。他还创立了宁诺的国际商务(商业分析)硕士项目。近年来他与业界紧密合作,例如淘宝、鸭嘴兽物流科技有限公司和宁波本地跨境电商企业(遨森电子商务)。通过和淘宝的合作,研究成果登上了国际顶级期刊Information Systems Research(FT50/ABS4*);而与鸭嘴兽的合作也获得了宁波市公益项目的资助。