算法被一种非常巧妙的‘注意力权重微调技巧’影响过,导致模型在后期的生成过程中,会不自觉地‘偏好’生成具有类似特定光影效果、微表情动态特征以及背景融合方式的图像——恰恰就是这次伪造视频所呈现出来的那种‘高度逼真但略带某种风格化’的效果!”
“你是说,有人在一年半前,就通过污染训练数据、微调算法的方式,给‘牧马人’的这个模块埋下了‘后门’或者‘倾向性’?”
安娜迅速理解,沉声道:“当自由灯塔需要制作针对肖恩和老板的深度伪造视频时,他们可能并不需要盗走完整的代码,只需要知道这个‘后门’的存在,并利用类似的技术架构(可能源于共同的技术源头,比如严锋提到的‘昆仑’理念外流),就能制造出高度相似的产品?”
“没错!”莱昂用力点头说:“这就解释了为什么技术特征相似,但我们内部却查不到直接的代码泄露,内鬼可能根本不存在,或者,内鬼的工作不是在近期盗取代码,而是在更早的时候,悄无声息地‘污染’了我们的数据源和训练过程!这个人,或者这股力量,必须对‘牧马人’项目的早期数据管理和训练流程非常熟悉,并且拥有足够的权限进行这种精细操作而不被立刻发现。”
一年半前……那正是“牧马人”项目从“先知”系统升级而来的关键研发期,有权限接触核心数据管理和训练流程的人,范围比能接触成熟代码的人要广一些,但也绝对是核心研发和运维团队。
“名单。”严飞吐出两个字。
莱昂立刻调出一份名单,上面有二十几个名字,涵盖了当时数据团队、算法团队、以及项目管理的关键人员。
“这些人,都有技术能力和权限做到这一点,但其中大部分人后来都转到了其他项目,或者离开了深瞳,需要逐一排查他们当时的活动、接触的外部人员、以及……可能的动机。”
“动机……”严飞沉吟,如果真是内部人员,动机是什么?金钱收买?理念分歧?还是受人胁迫?
“老板,”凯瑟琳忽然开口,她一直在旁边默默听着,此时举起手中的平板。
“我对比了这份名单,和陈处长希望我‘私下了解’的、关于深瞳早期技术团队构成的一些问题……有重叠。”
众人都看向她。
“陈处长之前闲聊时,曾看似随意地问起过深瞳AI技术的‘早期核心团队是哪些天才’,还特别提到了‘数据质量是AI的灵魂,不知道你们的数据清洗和标注团队当初是怎么搭
本章未完,请点击下一页继续阅读!