当前位置: 首页-> 热门 ->内容

上海首发新产品!《大辞海》与大模型深度融合,10分钟审校40万字

发布时间:2025-03-25 22:05 来源:东方网 阅读量:17838   

以《大辞海》为“地基”,插上人工智能大模型的“翅膀”,3月25日,上海辞书出版社与百度、鲸汤智能科技有限公司在沪发布最新产品“辞文智能知识审校系统”(简称“辞文”)。历时两年研发的该产品深度整合我国标志性大型综合性辞典《大辞海》中30多万词条的权威知识体系与文心大模型理解、生成、逻辑、记忆四大核心能力,成为国内首个融合权威工具书资源的智能审校解决方案。

近几年,文本审校工具如雨后春笋不断涌现,从早期的黑马校对、方正审校到i校对、凤凰智能校对系统、蜜度校对通、果麦AI校对王等产品各有所长,融合权威辞书资源和大模型能力的“辞文智能知识审校系统”瞄准了传统文本审校在知识性、逻辑性方面的痛点,实现四大技术突破:一是精准的知识溯源能力,当发现错误时,系统不仅能指出问题所在,更能通过Agent技术精准定位到《大辞海》中的相关条目,展示完整的知识链条,让用户不仅知道“错在哪里”,更明白“正确的应该是什么”;二是强大的多轮推理能力,可深入验证文本多维度合理性,找出隐藏的逻辑谬误,比如当审核一篇关于历史人物的文章时,系统不仅是简单地核对年代,而是会通过多重推理,验证人物关系、历史背景、事件顺序等多个维度的合理性;三是动态的知识更新机制,当《大辞海》数据库有更新时,系统能自动完成知识的同步;四是智能的交互式审校流程,通过有效控制大模型的发散、幻觉问题,提供个性化的审校建议,这种人机协作的方式既保留人工审校的专业判断,又发挥AI的效率优势。

通过高算力支持,该产品目前可在10分钟之内完成40万字文本量的审校,支持Word/WPS和PDF两种主流文档格式。样本实测数据显示,采用该系统后,审校工作效率成倍提升,错误识别准确率可达80%。

“2023年8月起执行的《图书编校质量差错判定和计算方法》中规定,一般性错字、别字,每处计1个差错;知识性、逻辑性差错,每处计2个差错,由此可见知识性、逻辑性差错对编校质量管理的重要性。然而,随着知识专业化分工的日益精细,单个审校人员难以完全掌握跨学科知识,市场迫切需要一套智能、高效、准确的知识审校系统。这不仅是新闻出版机构、内容发布平台的把关利器,也将是整个内容创作行业的前置工具。”上海世纪出版集团副总裁、上海辞书出版社社长秦志华表示,“辞文”突破以往文本审校工具的局限,实现从“文字纠错”到“知识审校”的能力跨越,其价值更在于守护知识传播的准确性与严肃性。据悉,目前该产品已应用于人文社科、科学技术等出版领域的文本审校,未来还将拓展至新闻传媒、教育科研等场景,致力于成为内容生产领域的“数字质检员”。

“大模型时代的软件产品是‘活的’,具有自优化、自迭代、自成长的特点,可以依据数据、用户反馈及模型自身成长不断改进。”百度AI技术生态副总经理周奇表示,依托文心+飞桨的核心技术,在可控数据安全的前提下,希望和更多硬件伙伴、技术伙伴、数据伙伴等共建生态,架起技术和行业专业知识的桥梁,打通大模型垂直领域应用工程化“最后一公里”。

发布会上展示了应用“辞文”的部分案例。上海辞书出版社针对该社一部50多万字的关于上海历史主题的付型稿件,采用“辞文”进行深度检测,系统共标记471处潜在错误,经专业编辑团队逐条复核,最终确认采纳87处知识性差错,错误类型覆盖上海开埠史、租界制度、地方文献等专业领域。横向对比测试数据显示,“辞文”系统检出471处,确认采纳87处;市场上另一审校产品检出262处,确认采纳0处。

有“语林啄木鸟”之称的上海《咬文嚼字》编辑部也试用了这一新产品。“我们测试了11条材料,7条提示没有审校到错误点,4条提出了修订点。”上海咬文嚼字文化传播有限公司总经理王敏分享试用情况,其中对一句元好问诗句的纠错令他惊艳,对唐代诗人李端的字的纠正也很正确。不过,“辞文”的纠错也有编辑部认为没有必要之处。他感慨,在大模型助力下,通过人机协同,产品有很大潜力。

声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。