浪潮海若大模型斩获千言数据集阅读理解评测榜单第一名

发布时间

2024-07-10

近日，由中国计算机学会、中国中文信息学会和百度联合举办的千言数据集阅读理解评测公布最新榜单排名，浪潮海若大模型以综合得分79.5斩获榜单第一名，这是海若大模型继QASC挑战赛之后的又一榜首成绩，再次展示了其在自然语言处理方面的深厚实力。

作为自然语言处理领域的重要前沿课题，模型阅读理解能力对提升模型的智能水平具有重要价值。千言数据集阅读理解评测旨在为研究人员和开发者提供学术和技术交流平台，进一步提升中文机器阅读理解的水平，推动自然语言理解和大模型技术的应用和发展。本次评测的问题集包括DuReader robust（抽取式阅读理解数据集）、DuReader yesno（观点型阅读理解数据集）和DuReader checklist（抽取式阅读理解数据集），分别考察模型的鲁棒性、对观点极性的判断能力以及机器的语言理解能力，最终通过模型对三个数据集回答问题的准确率来评测模型理解自然语言的能力。

在本次测评中，凭借创新架构和先进算法，海若大模型通过全面革新的大模型阅读理解技术，融合了超过10万条丰富的训练数据，显著提升了大模型在处理阅读理解任务时的分析和整合能力，打破了单一模型只能处理一种任务的局限，实现多任务协同优化；在技术设计上，通过引入共享表示层，加强了不同任务间知识的共享与特征的深度融合能力，从而显著提升了模型的泛化能力、处理效率及运行稳定性；同时，通过动态调整损失函数，模型能够精准平衡各项任务间的学习进度，确保在复杂多变的任务环境中依然能保持卓越的性能表现，大幅缩短了训练周期，降低了资源消耗。最终，浪潮海若大模型在DuReader robust数据集与DuReader yesno数据集任务中分别得分91与84，均位列榜单第一，充分验证了海若大模型在处理复杂阅读理解问题时的卓越能力、高度稳定性以及在多变环境中的非凡适应性和鲁棒性。

技术的突破，不仅增强了海若大模型的产品竞争力，还加速了其在行业场景的落地应用。浪潮海若大模型定位行业大模型，首批面向政府、交通、应急、制造、医疗、农业六大行业，具备可信赖、易落地、可持续三大核心优势。通过采用MoE（混合专家模型）架构、全面优化RAG、全链路安全防护等举措实现关键技术创新，解决了行业用户在大模型落地过程中所关注的运行成本、准确性、安全性等问题，依托海若完整产品矩阵，帮助用户打造行业专属大模型，并基于在全国布局的分布式算力平台，实现带算力入场，为行业用户提供更加精准、更加智能的支持和服务。

未来，浪潮云将持续释放数据“新要素”的价值，推动数实融合，赋能千行百业，提升经济社会发展“质效”，为新质生产力的发展贡献数字力量。

浪潮海若大模型斩获千言数据集阅读理解评测榜单第一名

新闻推荐