中文

这里几乎每天都有重大新闻发生

点击展开全部

法律宝库

更多 >>

东城区检察院一项数智技术获国家发明专利证书 全市检察机关首例!

发布时间:2026-06-30 来源:东城检察
字号: +-
563

为深入贯彻落实全国检察长会议“推动数字检察深化升级”部署要求,北京检察机关依托与中国电信股份有限公司北京分公司(以下简称北京电信)共建的“生成式人工智能检察应用联合实验室”(以下简称联合实验室),由东城区检察院联合北京电信共同研发“光学字符识别模型强化学习优化方法及装置”专利技术,于2026年5月获国家知识产权局发明专利授权,系北京检察机关首例成功申报的专利。

非结构化数据(即无固定格式、结构不规则的数据)处理效率与效果是制约数智赋能检察效能的重要问题。光学字符识别(OCR)技术可快速识别非结构化数据,大幅提高数据处理效率‌。目前主流的OCR算法主要包括传统OCR小模型、图文多模态大模型。东城区检察院在“老年人权益保护”大模型场景体系化建设中,需对依法获取的大量非结构化数据进行处理,但现有OCR技术存在三方面难题。一是语义理解偏差。多模态大模型具备较强的语义理解能力,但易输出语义合理但不符合事实的内容,导致输出结果后,仍需反复溯源核查,严重影响工作效率。二是关键信息被印章或签名遮挡。部分数据虽然字体较清晰,但关键信息被印章或签名遮挡,影响数据提取的准确性。三是小模型对复杂场景适应性不足。传统OCR小模型具有速度快、轻量化的优势,但对复杂场景适应性差,针对检察机关依法调取的格式多样的数据,传统模型难以准确定位需要提取的信息位置,导致输出结果不符合业务需求。

针对以上问题,联合实验室创新提出“基于事实奖励增强的OCR大模型强化学习优化方法”,通过引入语义一致性、逻辑事实校验等奖励机制(即通过对模型输出结果进行反馈、调整,保障结果准确性)改进算法,成功研发本专利,将非结构化数据的识别准确率提升8.8个百分点,达到97.6%,显著优于行业平均水平,为破解传统技术短板贡献检察智慧。目前专利技术已在支撑公益诉讼检察“养老助餐点专项监督”、民事检察“公告送达专项监督”等领域办案方面取得成效。

没有了 下一篇下一篇

评论

在线咨询