中文

真理愈辩愈明

点击展开全部

法律宝库

更多 >>

人工智能场景创新类专利申请的创造性判断

发布时间:2025-08-06 来源:中国知识产权报
字号: +-
563

目前,我国人工智能基础算法研究取得突破性成就,将基础算法垂直应用到各个真实场景,成为人工智能技术升级、产业增长的新路径。2022年科技部等六部门联合印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,指出要着力打造人工智能重大场景,提升人工智能场景创新能力。2024年和2025年的政府工作报告都提出要开展或持续推进“人工智能+”行动。宏观政策引导创新主体将算法与千行百业的真实场景进行深度的融合应用。将基础算法与具体场景融合而形成的技术方案转化为专利申请文件时,如何撰写申请文件以及如何进行创造性审查,是新形势下面临的新问题。

复审请求人北京字节跳动网络技术有限公司对“用于处理图像的方法和装置”(申请号:201810734681.2)的驳回决定不服,提出复审请求。经审理,国家知识产权局作出第1694596号复审请求审查决定,在修改文本的基础上撤销驳回决定。本案结合人工智能场景创新类申请的特点,诠释了创造性评价时如何整体把握算法特征与场景特征。

【案情简述】    

本申请涉及基于图像处理算法构建并训练得到的模型在具体场景下的应用。说明书实施例中针对球场场景,要解决的是同一球场的两张拍摄图像之间像素对应的问题。其方案为:在目标球场的固定位置上预定义一些球场关键点,基于该球场自身的拍摄图像和关键点标注信息构建训练数据集,训练得到一个专属于该球场的关键点检测模型。不同球场个体对应不同的模型,即“一个体一模型”。实际使用时模型输入为该球场的拍摄图像,模型输出为该图像中球场关键点的位置坐标和可见性信息。可见性信息用于在图像仅拍到球场局部时,筛选出被拍摄到图像中的球场关键点,利用关键点的位置坐标来确定同一球场在两张不同图像中的几何变换关系,从而实现同一球场的两张图像之间的像素对应。

实审程序中提交的权利要求相对于实施例的方案而言更为概括,其聚焦于模型的输入输出,构建出了泛化场景下的通用图像处理方案。权利要求中仅包括了获取目标对象的拍摄图像,以及将图像输入预训练模型从而得到模型输出的位置坐标和可见性信息这两个步骤。其中,说明书实施例中涉及的球场场景被剥离,球场被抽象为“目标对象”,不同球场个体对应不同模型的对应关系相应地概括为“不同目标对象对应不同模型”,可见性信息被定义为“关键点显示在拍摄图像中的概率”,模型的训练数据以及模型输出数据的后续处理均被省略。

实审程序中使用两篇对比文件结合来评价创造性。对比文件1-2均涉及人脸识别场景下人脸图像被遮挡情况的判断,且方案中都用到了人脸关键点定位技术;其中对比文件1提到输入人脸图像至预训练模型,即可输出图像中人脸关键点坐标,该坐标用于结合图像像素内容来评价人脸遮挡情况。对比文件2提到解析人脸图像的特征,得到每个人脸关键点被遮挡的概率,从而评价遮挡情况。对比文件1公开了权利要求1中输入图像至模型、输出关键点坐标的架构,由此得到两点区别,区别1包括“不同目标对象对应不同模型”,区别2包括“模型输出可见性信息”。驳回决定认为区别1中的“不同目标对象”可理解为“不同类别的目标对象”,而基于不同类别的对象具有不同的外观特性,区别1是显而易见的;区别2中,对比文件2里人脸关键点有无遮挡是该点可见性信息的一种具体表现。

请求人对区别特征的认定无异议,但从说明书实施例及本申请的本意出发,认为区别1的含义是不同个体的目标对象对应不同模型,即“一个体一模型”,这与对比文件1-2中的通用人脸模型具有本质不同;区别2中可见性信息描述的是关键点有没有被拍摄到图像的视野范围中,而非其表面有无遮挡。可见,权利要求的区别特征因较广的语义范围而出现了不同理解,并由此得出不同的创造性结论。

复审阶段请求人在权利要求中加入了球场场景、目标对象为个体以及模型训练数据为目标对象拍摄图像等限定,这些新增的场景及相关特征也构成了本申请与对比文件1的区别。合议组认为,基于区别特征本申请实际解决的技术问题是如何确定同一目标对象在不同拍摄图像中的对应关系;而对比文件1和2未公开区别特征,亦未给出相结合来解决上述技术问题相应的启示,由此撤销驳回决定。

【案件分析】    

本案表面上争议焦点是权利要求的特征理解,其根源则在于场景创新类申请的内在属性和撰写方式。这类申请以场景为创新起点,结合算法结构的改变或者处理方法的调整,来解决具体场景下存在的特定问题,其技术方案的文字记载通常呈现出“场景及相关特征”+“算法特征”的二元结构。一方面,技术方案的形成会受到场景的潜在影响,方案中技术术语的含义、技术手段的实际作用以及所要解决的问题均与具体场景存在着不同程度的依赖关系。另一方面,场景及其相关特征易于从算法中剥离出来,通过在权利要求中省略场景、使用抽象词来概括算法的处理对象、省略对算法输出的进一步处理等等概括撰写方式,可将具体场景下形成的方案扩大成以算法为核心的通用方案。

然而,保护范围的扩张也常伴随着法律不确定性风险。正如本案,对概括后的权利要求进行解读时,对于部分特征除了基于说明书实施例作出理解之外,代入不同场景时还可作出其他合理理解,造成权利要求与现有技术的相似从而不具备创造性。因而本案需要解决两个问题,其一是多义性解读如何处理,其二是创造性如何考量。

对于第一个问题,虽然说明书可以用于解释权利要求,但是权利要求自身的保护范围应当清楚。授权程序中申请人应尽可能完善权利要求,来减少权利要求的语义模糊,而不是在面临不利局面时利用说明书实施例来限缩权利要求的保护范围。本案复审阶段对权利要求的修改正是如此,请求人在权利要求中加入了场景及相关特征,此时区别特征就需要结合场景及相关特征来理解。具体的,加入了球场场景,结合球场图像易于出现的视角变换问题来理解区别2中可见性信息时,其含义不再包含人脸关键点的遮挡情况;加入了目标对象为个体、模型训练数据为球场自身的拍摄图像,区别1可作出“一个体一模型”的理解,如此消除了上述区别特征的理解歧义。

对于第二个问题,创造性评价不能机械割裂特征之间的关联,包含算法特征的申请也应如此。《专利审查指南》第二部分第九章第6.1.3节提到:“对既包含技术特征又包含算法特征或商业规则和方法特征的发明专利申请进行创造性审查时,应将与技术特征功能上彼此相互支持、存在相互作用关系的算法特征或商业规则和方法特征与所述技术特征作为一个整体考虑”。然而实践中对“整体考虑”存在误读,认为特征之间只要存在关联,就应当将所有关联的特征拼合成一个特征予以评述,这种“简单拼合”特征的方式变相降低了创造性判断标准,从一个极端走向另一个极端。

由于场景及其相关特征易于从方案中剥离的客观属性,加之通过概括撰写方式剥离场景及相关特征的主观意图,致使场景及相关特征与其他特征之间的关联性容易被“机械割裂”。可是,若将场景及相关特征与权利要求的其他特征“简单拼合”为一个特征进行评述,则会得出将相同算法简单转用到不同场景均具备创造性的错误结论。因而场景创新类申请创造性判断中如何“整体考虑”更有难度。

以本案为例,合议组认为,区别1中“一个体一模型”并非单纯描述模型与对象的对应关系,而是限定了一个模型的输入只能是同一球场的多幅图像,进而所要解决的确定同一球场在不同图像中的像素对应的问题得以明晰。区别2中模型同时输出每一个球场关键点的位置坐标与可见性信息,二者配合用于筛选可见关键点以确定图像间对应关系的作用亦应当考虑。而对比文件1、2涉及的人脸识别领域通常建立通用模型,模型所处理的是不相关人脸图像而不涉及同一人脸在不同图像中的对应关系,对比文件2中遮挡概率与本申请中可见性信息的含义和作用亦不相同。因此,对比文件未给出采用上述区别特征来解决上述问题的启示。由此可见,合议组不仅在区别特征的理解时考虑了场景及相关特征,而且在技术手段的作用、技术问题的确定以及技术启示的判断上同样考虑到了场景及相关特征。

【案件意义】    

本案的审理思路体现了合议组对“整体考虑”的准确把握,其蕴含了勿“机械割裂”和勿“简单拼合”的双重含义,这也是三步法的应有之义。审查决定遵循三步法的基础框架,在将权利要求分特征进行独立的理解、比对和判断的前提下,于特征比对、区别认定、问题确定和启示判断的每个环节中均考虑了特征之间的关联。本案的审理符合场景创新类申请的内在属性,亦是“整体考虑”在包含算法特征的专利申请创造性判断中的准确实践,有效矫正了实践中“非此即彼”的极端化倾向,为场景创新类申请的审查提供了规范指引。

同时对于场景创新类申请的撰写,若申请人想要撰写为泛化场景下的通用方案,还需围绕解决技术问题的核心手段将方案清楚、完整地呈现,这也对权利要求的撰写提出了较高要求。

没有了 下一篇下一篇

评论

在线咨询