解密引擎:在黑条之间阅读

时间:2017-05-22 03:04:04166网络整理admin

<p>8月下旬,奥巴马政府发布了一系列文件,详细说明了政府根据“外国情报监视法”收集的信息,其中包括一份有关国家安全局2012年部分国际安全局FISA合规情况的重大编辑,长达52页的报告“这些文件“国家情报总监詹姆斯·克拉珀(James Clapper)在发布的一封信中指出,”并且他们的解密不是轻易做到的</p><p>“从表面来看,这肯定是真的:除了七个之外的所有人都出现了黑条合规报告中的页面当政府宣布将这些严重编辑的文件作为透明行为发布时,让我们猜测我们可能会遗漏的内容,这个问题不可避免地出现了:我们是否有办法在黑条后面进行对等</p><p>根据一些研究人员的说法,众所周知,美国政府倾向于过度分类由政府资助的咨询集团公共利益解密委员会(International Interest Declassification Board)发布的2012年报告发现,其中存在“谨慎文化”</p><p>行政机构机构导致长期过度分类,反过来又“妥协”整个分类系统政府官员经常通过援引国家安全来延续这种文化,但加州大学洛杉矶分校的冷战历史学家Marc Trachtenberg告诉我“解密的功能远比保持敌人的信息更广泛“通常文件只是为了挽回面子而被归类(想想维基解密在2010年发布的电报,其中一些没有透露敏感信息,但仅仅是不讨人喜欢)大多数政府机构处理机密信息的人有专门的消毒剂,因为这种行为往往与匿名,无情的ch相关政府机器的推动,编辑在选择什么留下可见和隐藏的东西,以及黑条本身的形状背叛了一个引人注目的个人主义黑色标记笔是消毒剂最基本的工具但它可以是草率的,并且复印件的光泽有时会显示墨水下面的字母</p><p>清洁剂也使用不透明胶带和剃须刀,从页面副本中删除敏感内容您通常可以通过它留下的标记来识别工具:笔编辑页面充满了沉重,不完美的线条,而剃刀刀和不透明的胶带都留下锋利的边缘(虽然复印机给刀削出一块斑驳的灰色色调)偶尔,消毒剂只是在复印时用另一张纸覆盖文字文件天生数字文件的兴起带来了新的挑战:2009年,美国国家安全局发布了“自信地编辑”的更新版本,它的解决方案如何解读数字文档本手册强调一系列新的行动;使用文字处理器时,消毒剂必须删除敏感内容,将其替换为“无害文本”以保留格式,然后用数字绘制的黑色覆盖无害文本,或者按照建议使用灰色框“复杂文件格式”为隐藏数据提供了大量途径,“它警告说”一旦用户将数据输入文档,有效地删除它可能很困难“Trachtenberg,他已经改进了分析解密文本中编辑段的旧方法,利用了一种比较读数来看看黑色“基本的想法是利用文件 - 相同的文件 - 在不同的存储库中以不同的方式解密”这一事实,揭示每个版本中的不同信息,他说解密的指导方针因代理商而异,并为解释,以便在1992年响应信息自由法案要求的消毒剂可能会以不同于消毒剂的方式编辑文件在2012年,创造有利的不一致性慢慢地,一个细心的研究人员可以消除文件的黑暗部分,建立背景并加强进一步挖掘但是Trachtenberg的技术虽然基本上是合理的,但速度很慢,而其他研究人员自然也接受了这项任务</p><p>尝试自动化这个过程,至少部分是在不久前的一个无云的下午,我在华盛顿特区的国家档案馆外会见了哥伦比亚历史教授Matthew Connelly</p><p> Connelly与一群历史学家,计算机科学家和统计学家一起开发了一个名为解密引擎的雄心勃勃的项目,该项目除了其他方面外,还利用机器学习和自然语言处理来研究解密文本中的语义模式</p><p>该项目的目标范围编制世界上最大的解密文件数字化档案馆,在交互式全球地图上绘制超过一百万条国务院电报的解密地理元数据,研究人员希望通过这些数据可以让他们对政府机密的运作有新的认识</p><p>尽管解密引擎处于早期阶段的Connelly告诉我,该项目“已经达到了我们可以看到可以预测编辑文本内容的程度但是我们还没有决定是否要这样做或者不是“试图实现自动化不发布就不会没有先例2004年4月,克莱尔惠兰,都柏林城市大学计算机科学博士候选人,使用一套成熟的文件分析技术解密臭名昭着的“宾拉丁决定美国罢工”中的一个黑色字样,乔治布什于2001年8月6日收到惠兰通过光学字符识别软件运行备忘录的数字化版本,该软件确定字体类型(Arial)并帮助“估计污点背后字的大小”,Whelan的顾问David Naccache当时告诉Nature然后你只需要字典中的每一个字,并计算是否,在该字体中,它是适合空间的正确大小,加上或减去三个像素“第二个字典阅读程序提供了几百适合” “从”乙酸“到”乌克兰“ - 从惠灵那里收集了大约六个可能的形容词和国名</p><p>最后,她和Naccache确认政府已经警告过美国即将发生的恐怖袭击仅仅是9月11日的一个月 - 除非乌克兰或乌干达对本·拉登有秘密情报,所有线索都指向埃及惠兰和纳卡奇的分析很大程度上依赖于备忘录中露出笔尖的黑条形状缩小可能的单词数量当我在实验九年后与Naccache交谈时,他说他们的技术实际上已“死亡”,因为很难将其应用于数字编辑文档,而解密引擎的存档最终会但是,解密引擎不会像两位人类研究人员那样面临同样的障碍,因为它的技术更少关注编辑条本身而不是它们周围的空间和文字</p><p>解密引擎研究人员没有在没有惶恐的情况下处理这个问题</p><p>理查德H默默曼 - 坦普尔大学的历史学家,曾任国家情报部助理副主任,哈哈一个绝密的安全许可 - 听说该项目未发布的可能性,他开始担心马赛克理论,这是一个信息社会经常援引国家安全所谓的合法利益的理论</p><p>该理论的论点很清楚 - 削减:平庸,解密信息,拼凑在一起时,可能为知识渊博的读者提供足够的紧急细节,以揭示仍然被归类的信息或者,正如Immerman所说:“如果你能找到A,不知何故你可以将点连接到一个非常大的Z“在2003年的一个案例中,国家安全研究中心在否决了FOIA要求提供有关9/11事件后数百人被秘密拘留的文件后起诉司法部法院判决主要支持司法部最后,证明政府拒绝接受FOIA请求,理由是被拘留者的信息构成了“执法的综合图表” 9月11日之后的调查“”如果他们认为人们可能或者很可能找出黑条背后的内容并且意义重大,“Immerman谈到政府机构时,”他们会停止一起编辑所有他们会拒绝该文件“与我交谈过的许多人都表达了对加剧情报界“谨慎文化”的类似担忧</p><p>这种关注不是基于现实,而是基于解释和承诺;它是关于政府认为某人有朝一日会恢复的 就他而言,康奈利意识到了镶嵌理论,并成立了一个由十几位历史学家(包括伊默曼),计算机科学家和熟悉分类和解密的专家组成的“指导委员会”,以帮助指导解密引擎和道德伦理与法律</p><p>最终,该委员会于1月召开会议,将有助于决定该项目是否应该试图解决“该项目中没有人认为没有适当的官方保密地点”,Connelly说,并补充说研究人员“希望探索可能的事情,如果我们可以管理风险”研究人员希望该项目能够帮助阐明必要的秘密和过度谨慎之间的空间,打开消毒剂的思想,采取不那么保守的编辑方法“我想我们是什么所有人都希望,“Immerman说,”是一个解密过程,