主要發(fā)現(xiàn)


方法概述

Common Crawl簡(jiǎn)介

Common Crawl是一個(gè)包含400TB壓縮網(wǎng)絡(luò)數(shù)據(jù)的龐大數(shù)據(jù)集,其內(nèi)容來自3830萬個(gè)注冊(cè)域名和4750萬臺(tái)主機(jī)。數(shù)據(jù)以WARC(Web ARCive)文件格式存儲(chǔ),每個(gè)WARC文件包含多個(gè)記錄,記錄了客戶端請(qǐng)求、服務(wù)器響應(yīng)及相關(guān)元數(shù)據(jù)。

以下是WARC記錄的一個(gè)示例:

數(shù)據(jù)處理與掃描

為了處理如此龐大的數(shù)據(jù)集,我們使用了20臺(tái)高性能服務(wù)器(每臺(tái)16核CPU和32GB內(nèi)存),構(gòu)建了一個(gè)分布式作業(yè)隊(duì)列。每個(gè)節(jié)點(diǎn)的處理步驟如下:

  1. 下載一個(gè)4GB的Common Crawl文件。
  2. 使用awk解壓縮并拆分WARC記錄。
  3. 對(duì)提取的內(nèi)容運(yùn)行TruffleLog進(jìn)行掃描。

優(yōu)化與挑戰(zhàn)

WARC流媒體效率問題

我們嘗試構(gòu)建自定義的WARC文件處理程序,但發(fā)現(xiàn)直接流式處理WARC文件效率較低。最終,我們選擇通過awk分割文件后再掃描,顯著提高了處理速度。

僅報(bào)告“活著”的秘密

在研究中,我們僅統(tǒng)計(jì)了通過自動(dòng)驗(yàn)證過程確認(rèn)有效的API密鑰和密碼。這些“活著”的秘密能夠成功通過各自服務(wù)的身份驗(yàn)證,而未驗(yàn)證的類似字符串則未被納入統(tǒng)計(jì)范圍。

需要注意的是,LLM在訓(xùn)練過程中無法區(qū)分有效和無效的秘密,這可能導(dǎo)致不安全的編碼實(shí)踐被強(qiáng)化。


研究影響與下一步

我們的研究表明,LLM在Common Crawl數(shù)據(jù)集中暴露了數(shù)百萬個(gè)包含硬編碼秘密的代碼示例。這些暴露可能會(huì)影響LLM的輸出安全性,尤其是在模型訓(xùn)練時(shí)未能有效過濾這些數(shù)據(jù)的情況下。

為了減少風(fēng)險(xiǎn),我們建議:

  1. 擴(kuò)展秘密掃描范圍,涵蓋公共網(wǎng)頁和存檔數(shù)據(jù)集(如Common Crawl和Archive.org)。
  2. 采用改進(jìn)的保障措施(如憲法AI技術(shù)),以降低無意中復(fù)制或暴露敏感信息的可能性。

關(guān)于披露的說明

Common Crawl的數(shù)據(jù)集是公共互聯(lián)網(wǎng)的快照,記錄了開發(fā)者將密鑰硬編碼到前端HTML和JavaScript中的情況。需要明確的是,這并非Common Crawl的責(zé)任,而是開發(fā)者未能妥善管理敏感信息所致。

作為一項(xiàng)政策,當(dāng)Truffle Security發(fā)現(xiàn)泄露的秘密時(shí),我們會(huì)盡力幫助受影響的組織撤銷密鑰。在此次研究中,我們選擇與用戶受影響最大的供應(yīng)商合作,成功撤銷了數(shù)千個(gè)密鑰。


額外收獲:值得注意的暴露

前端代碼中的AWS根密鑰

我們發(fā)現(xiàn)一個(gè)AWS根密鑰被硬編碼在前端HTML中,雖然S3基本身份驗(yàn)證未生效,但這一暴露本不應(yīng)存在。

Mailchimp API密鑰的硬編碼

我們還發(fā)現(xiàn)了近1500個(gè)獨(dú)特的Mailchimp API密鑰被硬編碼在HTML表單和JavaScript代碼中,而非使用服務(wù)器端環(huán)境變量。這種做法可能導(dǎo)致攻擊者利用這些密鑰進(jìn)行釣魚、數(shù)據(jù)泄露或品牌冒充。

重復(fù)使用的密鑰

一些軟件開發(fā)公司在多個(gè)客戶站點(diǎn)上重復(fù)使用相同的API密鑰,這使得攻擊者可以輕松識(shí)別客戶列表,進(jìn)一步增加了安全風(fēng)險(xiǎn)。


總結(jié)

本次研究揭示了公共數(shù)據(jù)集中硬編碼秘密的嚴(yán)重性,并強(qiáng)調(diào)了改進(jìn)LLM訓(xùn)練數(shù)據(jù)過濾和開發(fā)者安全實(shí)踐的重要性。未來,我們希望通過技術(shù)改進(jìn)和行業(yè)合作,進(jìn)一步降低敏感信息泄露的風(fēng)險(xiǎn)。

原文鏈接: https://trufflesecurity.com/blog/research-finds-12-000-live-api-keys-and-passwords-in-deepseek-s-training-data
熱門推薦
一個(gè)賬號(hào)試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊(cè)
3000+提示詞助力AI大模型
和專業(yè)工程師共享工作效率翻倍的秘密
返回頂部
上一篇
深入解析什么是API安全
下一篇
Web Speech API:功能分析、局限性及改進(jìn)方法
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
成人黄色小视频| 欧美肥妇bbw| 成人黄色在线看| 精品美女一区二区| av亚洲精华国产精华精| 精品理论电影在线观看| 风间由美一区二区三区在线观看| 久久久久久久久岛国免费| 亚洲欧美在线观看| 日本欧美一区二区三区| 亚洲靠逼com| 精品国产免费一区二区三区香蕉| 国内成+人亚洲+欧美+综合在线| a美女胸又www黄视频久久| 中文字幕在线一区二区三区| 日本在线不卡一区| 日韩精品一区二区三区四区视频| 自拍偷拍亚洲综合| 国产午夜精品理论片a级大结局| 欧美性猛交xxxx黑人交| 国产69精品久久777的优势| 国产精品三级视频| 成人a区在线观看| 欧美一级片在线看| 国产制服丝袜一区| 久久99国产精品免费网站| 亚洲一区二区三区精品在线| 日韩小视频在线观看专区| 91麻豆精品国产91久久久久久久久| 成人在线综合网| 亚洲大型综合色站| 激情国产一区二区| 99视频精品在线| 在线精品视频免费观看| 国产亚洲va综合人人澡精品| 成人综合在线观看| 午夜精品福利在线| 久久免费美女视频| 国产精品污www在线观看| 亚洲在线视频免费观看| 久久精品99国产国产精| 国产精品三级电影| 麻豆高清免费国产一区| 色综合久久中文综合久久牛| 一本大道久久精品懂色aⅴ| 欧美片网站yy| 国产欧美一区二区三区鸳鸯浴 | 国产网站一区二区三区| 51精品国自产在线| 久久久精品国产免大香伊| 日精品一区二区三区| 亚洲成人在线免费| 欧美性猛交xxxx乱大交退制版| 色哟哟欧美精品| 亚洲香肠在线观看| 欧美亚洲综合在线| 日韩精品一二三区| 成人禁用看黄a在线| 一区二区三区四区激情| 欧美系列日韩一区| 免费日本视频一区| 久久综合久久久久88| 国产成人综合在线| 国产精品久久久久一区| 一级日本不卡的影视| 国产精品你懂的| 国产在线播精品第三| 99re这里都是精品| 亚洲国产精品视频| 色8久久精品久久久久久蜜| 6080国产精品一区二区| 精品少妇一区二区三区在线视频| 久久精品国产一区二区| 亚洲国产电影在线观看| 美女久久久精品| 国产性天天综合网| 亚洲成人av福利| 亚洲欧洲av一区二区三区久久| 日韩一级欧美一级| 风间由美性色一区二区三区| 国内精品视频一区二区三区八戒| 青娱乐精品在线视频| 日韩高清一级片| 亚欧色一区w666天堂| 亚洲午夜激情网站| 粉嫩一区二区三区性色av| 免费成人美女在线观看| 麻豆免费精品视频| 狠狠色丁香久久婷婷综合_中| 蜜臀av性久久久久蜜臀aⅴ流畅| 激情久久久久久久久久久久久久久久| 欧美一区二区三区啪啪| 欧美一级片在线看| 7777精品伊人久久久大香线蕉的| 蜜桃视频一区二区三区在线观看 | 日本91福利区| 不卡一区中文字幕| 国产亚洲精品福利| 丁香婷婷综合五月| 懂色av一区二区三区蜜臀| 精品噜噜噜噜久久久久久久久试看| 国产午夜亚洲精品不卡| 国产麻豆一精品一av一免费 | 亚洲成人av中文| 国产盗摄女厕一区二区三区| 国产一二精品视频| 欧美系列日韩一区| 欧美成人一区二区三区片免费| 亚洲男女一区二区三区| 成人美女在线观看| 97久久超碰国产精品电影| 欧美日韩久久久一区| xvideos.蜜桃一区二区| 另类中文字幕网| 国产一区二区三区在线观看免费| 蜜桃一区二区三区在线| 久久国产免费看| 97国产一区二区| 日韩欧美美女一区二区三区| 久久日韩精品一区二区五区| 日韩福利视频网| 欧美亚洲国产一卡| 免费高清视频精品| 国产精品免费视频观看| 91麻豆精东视频| 中文字幕日韩一区| 欧美日本在线看| 免费精品视频在线| 成人晚上爱看视频| 精品蜜桃在线看| 日本一不卡视频| 中文字幕制服丝袜成人av| 日韩欧美卡一卡二| 精品99999| 成人综合在线网站| 国产原创一区二区三区| 天堂一区二区在线| 亚洲精品久久久蜜桃| 欧美精品一二三| 91精品国产91久久综合桃花| 亚洲综合免费观看高清完整版| 欧美a一区二区| 精品一区二区三区欧美| 国产精品资源在线| av爱爱亚洲一区| 国产欧美一区二区精品性色超碰| 精品黑人一区二区三区久久| 2023国产精品视频| 国产欧美日韩视频在线观看| 国产精品美女久久久久久久久久久 | 国产成人免费在线视频| 一区二区三区中文字幕精品精品 | 中文字幕一区二区三| 国产精品久久久久久久久久免费看 | 国内成+人亚洲+欧美+综合在线| 免费成人美女在线观看.| 久久久久久久综合| 欧美视频在线观看一区二区| 欧美日韩成人综合在线一区二区| 欧美日韩国产综合草草| 精品久久久久久久久久久久久久久| 久久久久综合网| 午夜精品影院在线观看| 色婷婷久久久综合中文字幕| 日韩视频永久免费| 国产高清不卡一区| 久久综合色播五月| 蜜桃传媒麻豆第一区在线观看| 国产电影一区在线| 日韩一区二区三区在线观看| 91精品国产综合久久久蜜臀图片 | 国产精品理论片| 久久99精品久久久久婷婷| 欧美男女性生活在线直播观看| 亚洲乱码中文字幕| 欧美成人一区二区三区片免费| 亚洲激情中文1区| 欧美三级日韩三级国产三级| 欧美一级电影网站| 久久久久99精品国产片| 一区二区三区四区蜜桃 | 亚洲国产综合色| 91成人在线观看喷潮| 国产午夜精品美女毛片视频| 亚洲精品在线观| 国产精品毛片a∨一区二区三区| 国产欧美日产一区| 日本成人在线一区| 在线视频亚洲一区| 亚洲第一会所有码转帖| 欧美日韩免费高清一区色橹橹| 经典一区二区三区| 精品福利在线导航| 99re视频精品| 国产乱妇无码大片在线观看| 日本一区二区视频在线观看| 成人精品在线视频观看| 国产精品网站一区| 日韩午夜激情av| 91在线国产观看|